This is an archive of the discontinued LLVM Phabricator instance.

[x86] narrow extract subvector of vector select
ClosedPublic

Authored by spatel on Jun 6 2019, 10:52 AM.

Download Raw Diff

Details

Reviewers

RKSimon
craig.topper
andreadb

Commits

rG6880bceda2df: [x86] narrow extract subvector of vector select
rL362797: [x86] narrow extract subvector of vector select

Summary

This is a potentially large perf win for AVX1 targets because of the way we auto-vectorize to 256-bit but then expect the backend to legalize/optimize for the half-implemented AVX1 ISA.

On the motivating example from PR37428 (even though this patch doesn't solve the vector shift issue):
https://bugs.llvm.org/show_bug.cgi?id=37428
...there's a 16% speedup when compiling with "-mavx" (perf tested on Haswell) because we eliminate the remaining 256-bit vblendv ops.

I added comments on a couple of tests that require further work. If we have 256-bit logic ops separating the vselect and extract, we should probably narrow everything to 128-bit, but that requires a larger pattern match.

Diff Detail

Event Timeline

spatel created this revision.Jun 6 2019, 10:52 AM

Herald added a project: Restricted Project. · View Herald TranscriptJun 6 2019, 10:52 AM

Herald added subscribers: hiraditya, mcrosier. · View Herald Transcript

RKSimon added inline comments.Jun 6 2019, 2:18 PM

llvm/lib/Target/X86/X86ISelLowering.cpp
43172	Should we limit this to cases where all the uses of Sel.getOperand(0) are EXTRACT_SUBVECTORs?

RKSimon added inline comments.Jun 6 2019, 2:23 PM

llvm/test/CodeGen/X86/horizontal-reduce-smax.ll
541	This case probably has a extract_element(extract_subvector(vselect())) pattern - should the existing DAGCombine code catch it?

spatel marked 2 inline comments as done.Jun 6 2019, 4:01 PM

spatel added inline comments.

llvm/lib/Target/X86/X86ISelLowering.cpp
43172	This would be difficult because we peeked through bitcasts to get here (because that was required to match most of the cases in the regression tests). So we'd have to check uses of uses. A 1st attempt at that didn't go well - we lost almost all of the improvements.
llvm/test/CodeGen/X86/horizontal-reduce-smax.ll
541	I don't think we have generic combines for shrinking/scalarizing vselects. We would almost certainly need a TLI hook to decide when those are profitable. The reason I've proposed this as an x86-specific fold is because it allows us to be more aggressive for these specific patterns. We know the 128-bit sequences are going to be cheaper than the 256-bit variants in almost all cases - even if it means we have to extract the true/false values or have extra uses of the select.

agreed, lets go with this. LGTM.

This revision is now accepted and ready to land.Jun 7 2019, 1:29 AM

Closed by commit rL362797: [x86] narrow extract subvector of vector select (authored by spatel). · Explain WhyJun 7 2019, 6:18 AM

This revision was automatically updated to reflect the committed changes.

spatel mentioned this in D63364: [x86] split 256-bit vector selects if operands are vector concats.Jun 14 2019, 3:05 PM

spatel mentioned this in rL363508: [x86] split 256-bit vector selects if operands are vector concats.Jun 16 2019, 7:04 AM

spatel mentioned this in rGd14389c0a550: [x86] split 256-bit vector selects if operands are vector concats.

Revision Contents

Path

Size

llvm/

lib/

Target/

X86/

X86ISelLowering.cpp

52 lines

test/

CodeGen/

X86/

horizontal-reduce-smax.ll

54 lines

horizontal-reduce-smin.ll

46 lines

horizontal-reduce-umax.ll

100 lines

horizontal-reduce-umin.ll

112 lines

masked_store_trunc_ssat.ll

230 lines

masked_store_trunc_usat.ll

183 lines

midpoint-int-vec-256.ll

898 lines

psubus.ll

40 lines

uadd_sat_vec.ll

79 lines

usub_sat_vec.ll

47 lines

vector-reduce-smax-widen.ll

64 lines

vector-reduce-smax.ll

64 lines

vector-reduce-smin-widen.ll

62 lines

vector-reduce-smin.ll

62 lines

vector-reduce-umax-widen.ll

116 lines

vector-reduce-umax.ll

116 lines

vector-reduce-umin-widen.ll

122 lines

vector-reduce-umin.ll

122 lines

vector-trunc-packus-widen.ll

285 lines

vector-trunc-packus.ll

285 lines

vector-trunc-ssat-widen.ll

304 lines

vector-trunc-ssat.ll

302 lines

vector-trunc-usat-widen.ll

237 lines

vector-trunc-usat.ll

237 lines

Diff 203402

llvm/lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 43,152 Lines • ▼ Show 20 Lines	static SDValue combineInsertSubvector(SDNode *N, SelectionDAG &DAG,

// If this is a broadcast insert into an upper undef, use a larger broadcast.		// If this is a broadcast insert into an upper undef, use a larger broadcast.
if (Vec.isUndef() && IdxVal != 0 && SubVec.getOpcode() == X86ISD::VBROADCAST)		if (Vec.isUndef() && IdxVal != 0 && SubVec.getOpcode() == X86ISD::VBROADCAST)
return DAG.getNode(X86ISD::VBROADCAST, dl, OpVT, SubVec.getOperand(0));		return DAG.getNode(X86ISD::VBROADCAST, dl, OpVT, SubVec.getOperand(0));

return SDValue();		return SDValue();
}		}

		/// If we are extracting a subvector of a vector select and the select condition
		/// is composed of concatenated vectors, try to narrow the select width. This
		/// is a common pattern for AVX1 integer code because 256-bit selects may be
		/// legal, but there is almost no integer math/logic available for 256-bit.
		/// This function should only be called with legal types (otherwise, the calls
		/// to get simple value types will assert).
		static SDValue narrowExtractedVectorSelect(SDNode *Ext, SelectionDAG &DAG) {
		SDValue Sel = peekThroughBitcasts(Ext->getOperand(0));
		SmallVector<SDValue, 4> CatOps;
		if (Sel.getOpcode() != ISD::VSELECT \|\|
		!collectConcatOps(Sel.getOperand(0).getNode(), CatOps))
		return SDValue();
		RKSimonUnsubmitted Not Done Reply Inline Actions Should we limit this to cases where all the uses of Sel.getOperand(0) are EXTRACT_SUBVECTORs? RKSimon: Should we limit this to cases where all the uses of Sel.getOperand(0) are EXTRACT_SUBVECTORs?
		spatelAuthorUnsubmitted Done Reply Inline Actions This would be difficult because we peeked through bitcasts to get here (because that was required to match most of the cases in the regression tests). So we'd have to check uses of uses. A 1st attempt at that didn't go well - we lost almost all of the improvements. spatel: This would be difficult because we peeked through bitcasts to get here (because that was…

		// TODO: This can be extended to handle extraction to 256-bits.
		MVT VT = Ext->getSimpleValueType(0);
		if (!VT.is128BitVector())
		return SDValue();

		MVT WideVT = Ext->getOperand(0).getSimpleValueType();
		MVT SelVT = Sel.getSimpleValueType();
		unsigned SelElts = SelVT.getVectorNumElements();
		unsigned CastedElts = WideVT.getVectorNumElements();
		unsigned ExtIdx = cast<ConstantSDNode>(Ext->getOperand(1))->getZExtValue();
		if (SelElts % CastedElts == 0) {
		// The select has the same or more (narrower) elements than the extract
		// operand. The extraction index gets scaled by that factor.
		ExtIdx *= (SelElts / CastedElts);
		} else if (CastedElts % SelElts == 0) {
		// The select has less (wider) elements than the extract operand. Make sure
		// that the extraction index can be divided evenly.
		unsigned IndexDivisor = CastedElts / SelElts;
		if (ExtIdx % IndexDivisor != 0)
		return SDValue();
		ExtIdx /= IndexDivisor;
		} else {
		llvm_unreachable("Element count of simple vector types are not divisible?");
		}

		unsigned NarrowingFactor = WideVT.getSizeInBits() / VT.getSizeInBits();
		unsigned NarrowElts = SelElts / NarrowingFactor;
		MVT NarrowSelVT = MVT::getVectorVT(SelVT.getVectorElementType(), NarrowElts);
		SDLoc DL(Ext);
		SDValue ExtCond = extract128BitVector(Sel.getOperand(0), ExtIdx, DAG, DL);
		SDValue ExtT = extract128BitVector(Sel.getOperand(1), ExtIdx, DAG, DL);
		SDValue ExtF = extract128BitVector(Sel.getOperand(2), ExtIdx, DAG, DL);
		SDValue NarrowSel = DAG.getSelect(DL, NarrowSelVT, ExtCond, ExtT, ExtF);
		return DAG.getBitcast(VT, NarrowSel);
		}

static SDValue combineExtractSubvector(SDNode *N, SelectionDAG &DAG,		static SDValue combineExtractSubvector(SDNode *N, SelectionDAG &DAG,
TargetLowering::DAGCombinerInfo &DCI,		TargetLowering::DAGCombinerInfo &DCI,
const X86Subtarget &Subtarget) {		const X86Subtarget &Subtarget) {
// For AVX1 only, if we are extracting from a 256-bit and+not (which will		// For AVX1 only, if we are extracting from a 256-bit and+not (which will
// eventually get combined/lowered into ANDNP) with a concatenated operand,		// eventually get combined/lowered into ANDNP) with a concatenated operand,
// split the 'and' into 128-bit ops to avoid the concatenate and extract.		// split the 'and' into 128-bit ops to avoid the concatenate and extract.
// We let generic combining take over from there to simplify the		// We let generic combining take over from there to simplify the
// insert/extract and 'not'.		// insert/extract and 'not'.
Show All 26 Lines	if (isConcatenatedNot(WideVec.getOperand(0)) \|\|
return DAG.getNode(ISD::EXTRACT_SUBVECTOR, SDLoc(N), VT,		return DAG.getNode(ISD::EXTRACT_SUBVECTOR, SDLoc(N), VT,
DAG.getBitcast(WideVecVT, Concat), N->getOperand(1));		DAG.getBitcast(WideVecVT, Concat), N->getOperand(1));
}		}
}		}

if (DCI.isBeforeLegalizeOps())		if (DCI.isBeforeLegalizeOps())
return SDValue();		return SDValue();

		if (SDValue V = narrowExtractedVectorSelect(N, DAG))
		return V;

SDValue InVec = N->getOperand(0);		SDValue InVec = N->getOperand(0);
unsigned IdxVal = cast<ConstantSDNode>(N->getOperand(1))->getZExtValue();		unsigned IdxVal = cast<ConstantSDNode>(N->getOperand(1))->getZExtValue();

if (ISD::isBuildVectorAllZeros(InVec.getNode()))		if (ISD::isBuildVectorAllZeros(InVec.getNode()))
return getZeroVector(VT, Subtarget, DAG, SDLoc(N));		return getZeroVector(VT, Subtarget, DAG, SDLoc(N));

if (ISD::isBuildVectorAllOnes(InVec.getNode())) {		if (ISD::isBuildVectorAllOnes(InVec.getNode())) {
if (VT.getScalarType() == MVT::i1)		if (VT.getScalarType() == MVT::i1)
▲ Show 20 Lines • Show All 1,490 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/horizontal-reduce-smax.ll

	Show First 20 Lines • Show All 449 Lines • ▼ Show 20 Lines
	; X86-SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; X86-SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; X86-SSE42-NEXT: movd %xmm2, %eax			; X86-SSE42-NEXT: movd %xmm2, %eax
	; X86-SSE42-NEXT: pextrd $1, %xmm2, %edx			; X86-SSE42-NEXT: pextrd $1, %xmm2, %edx
	; X86-SSE42-NEXT: retl			; X86-SSE42-NEXT: retl
	;			;
	; X86-AVX1-LABEL: test_reduce_v4i64:			; X86-AVX1-LABEL: test_reduce_v4i64:
	; X86-AVX1: ## %bb.0:			; X86-AVX1: ## %bb.0:
	; X86-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; X86-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; X86-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; X86-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; X86-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm3			; X86-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X86-AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
	; X86-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; X86-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; X86-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; X86-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; X86-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; X86-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X86-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X86-AVX1-NEXT: vmovd %xmm0, %eax			; X86-AVX1-NEXT: vmovd %xmm0, %eax
	; X86-AVX1-NEXT: vpextrd $1, %xmm0, %edx			; X86-AVX1-NEXT: vpextrd $1, %xmm0, %edx
	; X86-AVX1-NEXT: vzeroupper			; X86-AVX1-NEXT: vzeroupper
	; X86-AVX1-NEXT: retl			; X86-AVX1-NEXT: retl
	;			;
	; X86-AVX2-LABEL: test_reduce_v4i64:			; X86-AVX2-LABEL: test_reduce_v4i64:
	; X86-AVX2: ## %bb.0:			; X86-AVX2: ## %bb.0:
	; X86-AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; X86-AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
	; X64-SSE42-NEXT: pcmpgtq %xmm2, %xmm0			; X64-SSE42-NEXT: pcmpgtq %xmm2, %xmm0
	; X64-SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; X64-SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; X64-SSE42-NEXT: movq %xmm2, %rax			; X64-SSE42-NEXT: movq %xmm2, %rax
	; X64-SSE42-NEXT: retq			; X64-SSE42-NEXT: retq
	;			;
	; X64-AVX1-LABEL: test_reduce_v4i64:			; X64-AVX1-LABEL: test_reduce_v4i64:
	; X64-AVX1: ## %bb.0:			; X64-AVX1: ## %bb.0:
	; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; X64-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; X64-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; X64-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm3			; X64-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
	; X64-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; X64-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; X64-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; X64-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; X64-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; X64-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X64-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X64-AVX1-NEXT: vmovq %xmm0, %rax			; X64-AVX1-NEXT: vmovq %xmm0, %rax
	RKSimonUnsubmitted Not Done Reply Inline Actions This case probably has a extract_element(extract_subvector(vselect())) pattern - should the existing DAGCombine code catch it? RKSimon: This case probably has a extract_element(extract_subvector(vselect())) pattern - should the…
	spatelAuthorUnsubmitted Done Reply Inline Actions I don't think we have generic combines for shrinking/scalarizing vselects. We would almost certainly need a TLI hook to decide when those are profitable. The reason I've proposed this as an x86-specific fold is because it allows us to be more aggressive for these specific patterns. We know the 128-bit sequences are going to be cheaper than the 256-bit variants in almost all cases - even if it means we have to extract the true/false values or have extra uses of the select. spatel: I don't think we have generic combines for shrinking/scalarizing vselects. We would almost…
	; X64-AVX1-NEXT: vzeroupper			; X64-AVX1-NEXT: vzeroupper
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX2-LABEL: test_reduce_v4i64:			; X64-AVX2-LABEL: test_reduce_v4i64:
	; X64-AVX2: ## %bb.0:			; X64-AVX2: ## %bb.0:
	; X64-AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; X64-AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; X64-AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2			; X64-AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2
	; X64-AVX2-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X64-AVX2-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	▲ Show 20 Lines • Show All 563 Lines • ▼ Show 20 Lines
	; X86-SSE42-NEXT: pcmpgtq %xmm1, %xmm0			; X86-SSE42-NEXT: pcmpgtq %xmm1, %xmm0
	; X86-SSE42-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; X86-SSE42-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; X86-SSE42-NEXT: movd %xmm1, %eax			; X86-SSE42-NEXT: movd %xmm1, %eax
	; X86-SSE42-NEXT: pextrd $1, %xmm1, %edx			; X86-SSE42-NEXT: pextrd $1, %xmm1, %edx
	; X86-SSE42-NEXT: retl			; X86-SSE42-NEXT: retl
	;			;
	; X86-AVX1-LABEL: test_reduce_v8i64:			; X86-AVX1-LABEL: test_reduce_v8i64:
	; X86-AVX1: ## %bb.0:			; X86-AVX1: ## %bb.0:
	; X86-AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; X86-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; X86-AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; X86-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm3
	; X86-AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
	; X86-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; X86-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; X86-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; X86-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; X86-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm3			; X86-AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; X86-AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm2, %ymm2			; X86-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
	; X86-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X86-AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm5
				; X86-AVX1-NEXT: vblendvpd %xmm5, %xmm4, %xmm3, %xmm3
				; X86-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; X86-AVX1-NEXT: vpcmpgtq %xmm3, %xmm0, %xmm1
				; X86-AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm3, %xmm0
	; X86-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; X86-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; X86-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; X86-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; X86-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X86-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X86-AVX1-NEXT: vmovd %xmm0, %eax			; X86-AVX1-NEXT: vmovd %xmm0, %eax
	; X86-AVX1-NEXT: vpextrd $1, %xmm0, %edx			; X86-AVX1-NEXT: vpextrd $1, %xmm0, %edx
	; X86-AVX1-NEXT: vzeroupper			; X86-AVX1-NEXT: vzeroupper
	; X86-AVX1-NEXT: retl			; X86-AVX1-NEXT: retl
	;			;
	; X86-AVX2-LABEL: test_reduce_v8i64:			; X86-AVX2-LABEL: test_reduce_v8i64:
	; X86-AVX2: ## %bb.0:			; X86-AVX2: ## %bb.0:
	; X86-AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2			; X86-AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2
	▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	; X64-SSE42-NEXT: movdqa %xmm3, %xmm0			; X64-SSE42-NEXT: movdqa %xmm3, %xmm0
	; X64-SSE42-NEXT: pcmpgtq %xmm1, %xmm0			; X64-SSE42-NEXT: pcmpgtq %xmm1, %xmm0
	; X64-SSE42-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; X64-SSE42-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; X64-SSE42-NEXT: movq %xmm1, %rax			; X64-SSE42-NEXT: movq %xmm1, %rax
	; X64-SSE42-NEXT: retq			; X64-SSE42-NEXT: retq
	;			;
	; X64-AVX1-LABEL: test_reduce_v8i64:			; X64-AVX1-LABEL: test_reduce_v8i64:
	; X64-AVX1: ## %bb.0:			; X64-AVX1: ## %bb.0:
	; X64-AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; X64-AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; X64-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm3
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
	; X64-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; X64-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; X64-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; X64-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm3			; X64-AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm2, %ymm2			; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
	; X64-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X64-AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm5
				; X64-AVX1-NEXT: vblendvpd %xmm5, %xmm4, %xmm3, %xmm3
				; X64-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; X64-AVX1-NEXT: vpcmpgtq %xmm3, %xmm0, %xmm1
				; X64-AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm3, %xmm0
	; X64-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; X64-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; X64-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; X64-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; X64-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X64-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X64-AVX1-NEXT: vmovq %xmm0, %rax			; X64-AVX1-NEXT: vmovq %xmm0, %rax
	; X64-AVX1-NEXT: vzeroupper			; X64-AVX1-NEXT: vzeroupper
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX2-LABEL: test_reduce_v8i64:			; X64-AVX2-LABEL: test_reduce_v8i64:
	; X64-AVX2: ## %bb.0:			; X64-AVX2: ## %bb.0:
	; X64-AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2			; X64-AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2
	; X64-AVX2-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X64-AVX2-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	▲ Show 20 Lines • Show All 578 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/horizontal-reduce-smin.ll

	Show First 20 Lines • Show All 452 Lines • ▼ Show 20 Lines
	; X86-SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; X86-SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; X86-SSE42-NEXT: movd %xmm2, %eax			; X86-SSE42-NEXT: movd %xmm2, %eax
	; X86-SSE42-NEXT: pextrd $1, %xmm2, %edx			; X86-SSE42-NEXT: pextrd $1, %xmm2, %edx
	; X86-SSE42-NEXT: retl			; X86-SSE42-NEXT: retl
	;			;
	; X86-AVX1-LABEL: test_reduce_v4i64:			; X86-AVX1-LABEL: test_reduce_v4i64:
	; X86-AVX1: ## %bb.0:			; X86-AVX1: ## %bb.0:
	; X86-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; X86-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; X86-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; X86-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; X86-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm3			; X86-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X86-AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
	; X86-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; X86-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; X86-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; X86-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; X86-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; X86-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X86-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X86-AVX1-NEXT: vmovd %xmm0, %eax			; X86-AVX1-NEXT: vmovd %xmm0, %eax
	; X86-AVX1-NEXT: vpextrd $1, %xmm0, %edx			; X86-AVX1-NEXT: vpextrd $1, %xmm0, %edx
	; X86-AVX1-NEXT: vzeroupper			; X86-AVX1-NEXT: vzeroupper
	; X86-AVX1-NEXT: retl			; X86-AVX1-NEXT: retl
	;			;
	; X86-AVX2-LABEL: test_reduce_v4i64:			; X86-AVX2-LABEL: test_reduce_v4i64:
	; X86-AVX2: ## %bb.0:			; X86-AVX2: ## %bb.0:
	; X86-AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; X86-AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	; X64-SSE42-NEXT: pcmpgtq %xmm1, %xmm0			; X64-SSE42-NEXT: pcmpgtq %xmm1, %xmm0
	; X64-SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; X64-SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; X64-SSE42-NEXT: movq %xmm2, %rax			; X64-SSE42-NEXT: movq %xmm2, %rax
	; X64-SSE42-NEXT: retq			; X64-SSE42-NEXT: retq
	;			;
	; X64-AVX1-LABEL: test_reduce_v4i64:			; X64-AVX1-LABEL: test_reduce_v4i64:
	; X64-AVX1: ## %bb.0:			; X64-AVX1: ## %bb.0:
	; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; X64-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; X64-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; X64-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm3			; X64-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
	; X64-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; X64-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; X64-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; X64-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; X64-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; X64-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X64-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X64-AVX1-NEXT: vmovq %xmm0, %rax			; X64-AVX1-NEXT: vmovq %xmm0, %rax
	; X64-AVX1-NEXT: vzeroupper			; X64-AVX1-NEXT: vzeroupper
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX2-LABEL: test_reduce_v4i64:			; X64-AVX2-LABEL: test_reduce_v4i64:
	; X64-AVX2: ## %bb.0:			; X64-AVX2: ## %bb.0:
	; X64-AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; X64-AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; X64-AVX2-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2			; X64-AVX2-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2
	▲ Show 20 Lines • Show All 566 Lines • ▼ Show 20 Lines
	; X86-SSE42-NEXT: movd %xmm1, %eax			; X86-SSE42-NEXT: movd %xmm1, %eax
	; X86-SSE42-NEXT: pextrd $1, %xmm1, %edx			; X86-SSE42-NEXT: pextrd $1, %xmm1, %edx
	; X86-SSE42-NEXT: retl			; X86-SSE42-NEXT: retl
	;			;
	; X86-AVX1-LABEL: test_reduce_v8i64:			; X86-AVX1-LABEL: test_reduce_v8i64:
	; X86-AVX1: ## %bb.0:			; X86-AVX1: ## %bb.0:
	; X86-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; X86-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; X86-AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; X86-AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; X86-AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; X86-AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm4
	; X86-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm3			; X86-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm5
	; X86-AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2			; X86-AVX1-NEXT: vblendvpd %xmm5, %xmm0, %xmm1, %xmm0
	; X86-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X86-AVX1-NEXT: vblendvpd %xmm4, %xmm2, %xmm3, %xmm1
	; X86-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; X86-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; X86-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; X86-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm3			; X86-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X86-AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm2, %ymm2
	; X86-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; X86-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; X86-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; X86-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; X86-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; X86-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X86-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X86-AVX1-NEXT: vmovd %xmm0, %eax			; X86-AVX1-NEXT: vmovd %xmm0, %eax
	; X86-AVX1-NEXT: vpextrd $1, %xmm0, %edx			; X86-AVX1-NEXT: vpextrd $1, %xmm0, %edx
	; X86-AVX1-NEXT: vzeroupper			; X86-AVX1-NEXT: vzeroupper
	; X86-AVX1-NEXT: retl			; X86-AVX1-NEXT: retl
	;			;
	; X86-AVX2-LABEL: test_reduce_v8i64:			; X86-AVX2-LABEL: test_reduce_v8i64:
	; X86-AVX2: ## %bb.0:			; X86-AVX2: ## %bb.0:
	; X86-AVX2-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2			; X86-AVX2-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2
	▲ Show 20 Lines • Show All 93 Lines • ▼ Show 20 Lines
	; X64-SSE42-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; X64-SSE42-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; X64-SSE42-NEXT: movq %xmm1, %rax			; X64-SSE42-NEXT: movq %xmm1, %rax
	; X64-SSE42-NEXT: retq			; X64-SSE42-NEXT: retq
	;			;
	; X64-AVX1-LABEL: test_reduce_v8i64:			; X64-AVX1-LABEL: test_reduce_v8i64:
	; X64-AVX1: ## %bb.0:			; X64-AVX1: ## %bb.0:
	; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; X64-AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; X64-AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; X64-AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; X64-AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm4
	; X64-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm3			; X64-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm5
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2			; X64-AVX1-NEXT: vblendvpd %xmm5, %xmm0, %xmm1, %xmm0
	; X64-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X64-AVX1-NEXT: vblendvpd %xmm4, %xmm2, %xmm3, %xmm1
	; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; X64-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; X64-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; X64-AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm3			; X64-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm2, %ymm2
	; X64-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; X64-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; X64-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; X64-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; X64-AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; X64-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X64-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X64-AVX1-NEXT: vmovq %xmm0, %rax			; X64-AVX1-NEXT: vmovq %xmm0, %rax
	; X64-AVX1-NEXT: vzeroupper			; X64-AVX1-NEXT: vzeroupper
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX2-LABEL: test_reduce_v8i64:			; X64-AVX2-LABEL: test_reduce_v8i64:
	; X64-AVX2: ## %bb.0:			; X64-AVX2: ## %bb.0:
	; X64-AVX2-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2			; X64-AVX2-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2
	; X64-AVX2-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X64-AVX2-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	▲ Show 20 Lines • Show All 578 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/horizontal-reduce-umax.ll

	Show First 20 Lines • Show All 535 Lines • ▼ Show 20 Lines
	;			;
	; X86-AVX1-LABEL: test_reduce_v4i64:			; X86-AVX1-LABEL: test_reduce_v4i64:
	; X86-AVX1: ## %bb.0:			; X86-AVX1: ## %bb.0:
	; X86-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; X86-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; X86-AVX1-NEXT: vmovddup {{.*#+}} xmm2 = [-0.0E+0,-0.0E+0]			; X86-AVX1-NEXT: vmovddup {{.*#+}} xmm2 = [-0.0E+0,-0.0E+0]
	; X86-AVX1-NEXT: ## xmm2 = mem[0,0]			; X86-AVX1-NEXT: ## xmm2 = mem[0,0]
	; X86-AVX1-NEXT: vxorps %xmm2, %xmm1, %xmm3			; X86-AVX1-NEXT: vxorps %xmm2, %xmm1, %xmm3
	; X86-AVX1-NEXT: vxorps %xmm2, %xmm0, %xmm4			; X86-AVX1-NEXT: vxorps %xmm2, %xmm0, %xmm4
	; X86-AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm4			; X86-AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
	; X86-AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm3			; X86-AVX1-NEXT: vblendvpd %xmm3, %xmm0, %xmm1, %xmm0
	; X86-AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3
	; X86-AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm1, %ymm0
	; X86-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; X86-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; X86-AVX1-NEXT: vxorpd %xmm2, %xmm0, %xmm3			; X86-AVX1-NEXT: vxorpd %xmm2, %xmm0, %xmm3
	; X86-AVX1-NEXT: vxorpd %xmm2, %xmm1, %xmm2			; X86-AVX1-NEXT: vxorpd %xmm2, %xmm1, %xmm2
	; X86-AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; X86-AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; X86-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X86-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X86-AVX1-NEXT: vmovd %xmm0, %eax			; X86-AVX1-NEXT: vmovd %xmm0, %eax
	; X86-AVX1-NEXT: vpextrd $1, %xmm0, %edx			; X86-AVX1-NEXT: vpextrd $1, %xmm0, %edx
	; X86-AVX1-NEXT: vzeroupper			; X86-AVX1-NEXT: vzeroupper
	; X86-AVX1-NEXT: retl			; X86-AVX1-NEXT: retl
	;			;
	; X86-AVX2-LABEL: test_reduce_v4i64:			; X86-AVX2-LABEL: test_reduce_v4i64:
	; X86-AVX2: ## %bb.0:			; X86-AVX2: ## %bb.0:
	; X86-AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; X86-AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
	; X64-SSE42-NEXT: retq			; X64-SSE42-NEXT: retq
	;			;
	; X64-AVX1-LABEL: test_reduce_v4i64:			; X64-AVX1-LABEL: test_reduce_v4i64:
	; X64-AVX1: ## %bb.0:			; X64-AVX1: ## %bb.0:
	; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; X64-AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; X64-AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; X64-AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3			; X64-AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3
	; X64-AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm4			; X64-AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm4
	; X64-AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm4			; X64-AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
	; X64-AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm3			; X64-AVX1-NEXT: vblendvpd %xmm3, %xmm0, %xmm1, %xmm0
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3
	; X64-AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm1, %ymm0
	; X64-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; X64-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; X64-AVX1-NEXT: vxorpd %xmm2, %xmm0, %xmm3			; X64-AVX1-NEXT: vxorpd %xmm2, %xmm0, %xmm3
	; X64-AVX1-NEXT: vxorpd %xmm2, %xmm1, %xmm2			; X64-AVX1-NEXT: vxorpd %xmm2, %xmm1, %xmm2
	; X64-AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; X64-AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; X64-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X64-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X64-AVX1-NEXT: vmovq %xmm0, %rax			; X64-AVX1-NEXT: vmovq %xmm0, %rax
	; X64-AVX1-NEXT: vzeroupper			; X64-AVX1-NEXT: vzeroupper
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX2-LABEL: test_reduce_v4i64:			; X64-AVX2-LABEL: test_reduce_v4i64:
	; X64-AVX2: ## %bb.0:			; X64-AVX2: ## %bb.0:
	; X64-AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; X64-AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 594 Lines • ▼ Show 20 Lines
	; X86-SSE42-NEXT: pcmpgtq %xmm5, %xmm0			; X86-SSE42-NEXT: pcmpgtq %xmm5, %xmm0
	; X86-SSE42-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; X86-SSE42-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; X86-SSE42-NEXT: movd %xmm1, %eax			; X86-SSE42-NEXT: movd %xmm1, %eax
	; X86-SSE42-NEXT: pextrd $1, %xmm1, %edx			; X86-SSE42-NEXT: pextrd $1, %xmm1, %edx
	; X86-SSE42-NEXT: retl			; X86-SSE42-NEXT: retl
	;			;
	; X86-AVX1-LABEL: test_reduce_v8i64:			; X86-AVX1-LABEL: test_reduce_v8i64:
	; X86-AVX1: ## %bb.0:			; X86-AVX1: ## %bb.0:
	; X86-AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; X86-AVX1-NEXT: vmovddup {{.*#+}} xmm2 = [-0.0E+0,-0.0E+0]
	; X86-AVX1-NEXT: vmovddup {{.*#+}} xmm3 = [-0.0E+0,-0.0E+0]			; X86-AVX1-NEXT: ## xmm2 = mem[0,0]
	; X86-AVX1-NEXT: ## xmm3 = mem[0,0]			; X86-AVX1-NEXT: vxorps %xmm2, %xmm1, %xmm3
	; X86-AVX1-NEXT: vxorps %xmm3, %xmm2, %xmm2			; X86-AVX1-NEXT: vxorps %xmm2, %xmm0, %xmm4
	; X86-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; X86-AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
	; X86-AVX1-NEXT: vxorps %xmm3, %xmm4, %xmm4			; X86-AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4
	; X86-AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2			; X86-AVX1-NEXT: vxorps %xmm2, %xmm4, %xmm5
	; X86-AVX1-NEXT: vxorps %xmm3, %xmm1, %xmm4			; X86-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
	; X86-AVX1-NEXT: vxorps %xmm3, %xmm0, %xmm5			; X86-AVX1-NEXT: vxorps %xmm2, %xmm6, %xmm7
	; X86-AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; X86-AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm5
	; X86-AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm4, %ymm2			; X86-AVX1-NEXT: vblendvpd %xmm5, %xmm6, %xmm4, %xmm4
	; X86-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X86-AVX1-NEXT: vxorpd %xmm2, %xmm4, %xmm5
	; X86-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; X86-AVX1-NEXT: vblendvpd %xmm3, %xmm0, %xmm1, %xmm0
	; X86-AVX1-NEXT: vxorps %xmm3, %xmm1, %xmm2			; X86-AVX1-NEXT: vxorpd %xmm2, %xmm0, %xmm1
	; X86-AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm4			; X86-AVX1-NEXT: vpcmpgtq %xmm5, %xmm1, %xmm1
	; X86-AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm4			; X86-AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm4, %xmm0
	; X86-AVX1-NEXT: vpcmpgtq %xmm0, %xmm2, %xmm2
	; X86-AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm4, %ymm2
	; X86-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; X86-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; X86-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; X86-AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm2			; X86-AVX1-NEXT: vxorpd %xmm2, %xmm0, %xmm3
	; X86-AVX1-NEXT: vxorpd %xmm3, %xmm1, %xmm3			; X86-AVX1-NEXT: vxorpd %xmm2, %xmm1, %xmm2
	; X86-AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; X86-AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; X86-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X86-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X86-AVX1-NEXT: vmovd %xmm0, %eax			; X86-AVX1-NEXT: vmovd %xmm0, %eax
	; X86-AVX1-NEXT: vpextrd $1, %xmm0, %edx			; X86-AVX1-NEXT: vpextrd $1, %xmm0, %edx
	; X86-AVX1-NEXT: vzeroupper			; X86-AVX1-NEXT: vzeroupper
	; X86-AVX1-NEXT: retl			; X86-AVX1-NEXT: retl
	;			;
	; X86-AVX2-LABEL: test_reduce_v8i64:			; X86-AVX2-LABEL: test_reduce_v8i64:
	; X86-AVX2: ## %bb.0:			; X86-AVX2: ## %bb.0:
	; X86-AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [-0.0E+0,-0.0E+0,-0.0E+0,-0.0E+0]			; X86-AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [-0.0E+0,-0.0E+0,-0.0E+0,-0.0E+0]
	▲ Show 20 Lines • Show All 109 Lines • ▼ Show 20 Lines
	; X64-SSE42-NEXT: pxor %xmm1, %xmm5			; X64-SSE42-NEXT: pxor %xmm1, %xmm5
	; X64-SSE42-NEXT: pcmpgtq %xmm5, %xmm0			; X64-SSE42-NEXT: pcmpgtq %xmm5, %xmm0
	; X64-SSE42-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; X64-SSE42-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; X64-SSE42-NEXT: movq %xmm1, %rax			; X64-SSE42-NEXT: movq %xmm1, %rax
	; X64-SSE42-NEXT: retq			; X64-SSE42-NEXT: retq
	;			;
	; X64-AVX1-LABEL: test_reduce_v8i64:			; X64-AVX1-LABEL: test_reduce_v8i64:
	; X64-AVX1: ## %bb.0:			; X64-AVX1: ## %bb.0:
	; X64-AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; X64-AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; X64-AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]			; X64-AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3
	; X64-AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; X64-AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm4
	; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; X64-AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
	; X64-AVX1-NEXT: vpxor %xmm3, %xmm4, %xmm4			; X64-AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4
	; X64-AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2			; X64-AVX1-NEXT: vpxor %xmm2, %xmm4, %xmm5
	; X64-AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm4			; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
	; X64-AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm5			; X64-AVX1-NEXT: vpxor %xmm2, %xmm6, %xmm7
	; X64-AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; X64-AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm5
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm4, %ymm2			; X64-AVX1-NEXT: vblendvpd %xmm5, %xmm6, %xmm4, %xmm4
	; X64-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X64-AVX1-NEXT: vxorpd %xmm2, %xmm4, %xmm5
	; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; X64-AVX1-NEXT: vblendvpd %xmm3, %xmm0, %xmm1, %xmm0
	; X64-AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm2			; X64-AVX1-NEXT: vxorpd %xmm2, %xmm0, %xmm1
	; X64-AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm4			; X64-AVX1-NEXT: vpcmpgtq %xmm5, %xmm1, %xmm1
	; X64-AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm4			; X64-AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm4, %xmm0
	; X64-AVX1-NEXT: vpcmpgtq %xmm0, %xmm2, %xmm2
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm4, %ymm2
	; X64-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; X64-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; X64-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; X64-AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm2			; X64-AVX1-NEXT: vxorpd %xmm2, %xmm0, %xmm3
	; X64-AVX1-NEXT: vxorpd %xmm3, %xmm1, %xmm3			; X64-AVX1-NEXT: vxorpd %xmm2, %xmm1, %xmm2
	; X64-AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; X64-AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; X64-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X64-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X64-AVX1-NEXT: vmovq %xmm0, %rax			; X64-AVX1-NEXT: vmovq %xmm0, %rax
	; X64-AVX1-NEXT: vzeroupper			; X64-AVX1-NEXT: vzeroupper
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX2-LABEL: test_reduce_v8i64:			; X64-AVX2-LABEL: test_reduce_v8i64:
	; X64-AVX2: ## %bb.0:			; X64-AVX2: ## %bb.0:
	; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; X64-AVX2-NEXT: vpxor %ymm2, %ymm1, %ymm3			; X64-AVX2-NEXT: vpxor %ymm2, %ymm1, %ymm3
	▲ Show 20 Lines • Show All 599 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/horizontal-reduce-umin.ll

	Show First 20 Lines • Show All 468 Lines • ▼ Show 20 Lines
	; X86-SSE42-NEXT: movdqa %xmm3, %xmm0			; X86-SSE42-NEXT: movdqa %xmm3, %xmm0
	; X86-SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; X86-SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; X86-SSE42-NEXT: movd %xmm2, %eax			; X86-SSE42-NEXT: movd %xmm2, %eax
	; X86-SSE42-NEXT: pextrd $1, %xmm2, %edx			; X86-SSE42-NEXT: pextrd $1, %xmm2, %edx
	; X86-SSE42-NEXT: retl			; X86-SSE42-NEXT: retl
	;			;
	; X86-AVX1-LABEL: test_reduce_v4i64:			; X86-AVX1-LABEL: test_reduce_v4i64:
	; X86-AVX1: ## %bb.0:			; X86-AVX1: ## %bb.0:
	; X86-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; X86-AVX1-NEXT: vmovddup {{.*#+}} xmm1 = [-0.0E+0,-0.0E+0]
	; X86-AVX1-NEXT: vmovddup {{.*#+}} xmm2 = [-0.0E+0,-0.0E+0]			; X86-AVX1-NEXT: ## xmm1 = mem[0,0]
	; X86-AVX1-NEXT: ## xmm2 = mem[0,0]			; X86-AVX1-NEXT: vxorps %xmm1, %xmm0, %xmm2
	; X86-AVX1-NEXT: vxorps %xmm2, %xmm0, %xmm3			; X86-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; X86-AVX1-NEXT: vxorps %xmm2, %xmm1, %xmm4			; X86-AVX1-NEXT: vxorps %xmm1, %xmm3, %xmm4
	; X86-AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; X86-AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2
	; X86-AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm4			; X86-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm3, %xmm0
	; X86-AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm3, %ymm3			; X86-AVX1-NEXT: vpermilps {{.*#+}} xmm2 = xmm0[2,3,0,1]
	; X86-AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm1, %ymm0			; X86-AVX1-NEXT: vxorpd %xmm1, %xmm0, %xmm3
	; X86-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; X86-AVX1-NEXT: vxorpd %xmm1, %xmm2, %xmm1
	; X86-AVX1-NEXT: vxorpd %xmm2, %xmm0, %xmm3			; X86-AVX1-NEXT: vpcmpgtq %xmm3, %xmm1, %xmm1
	; X86-AVX1-NEXT: vxorpd %xmm2, %xmm1, %xmm2			; X86-AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm2, %xmm0
	; X86-AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; X86-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; X86-AVX1-NEXT: vmovd %xmm0, %eax			; X86-AVX1-NEXT: vmovd %xmm0, %eax
	; X86-AVX1-NEXT: vpextrd $1, %xmm0, %edx			; X86-AVX1-NEXT: vpextrd $1, %xmm0, %edx
	; X86-AVX1-NEXT: vzeroupper			; X86-AVX1-NEXT: vzeroupper
	; X86-AVX1-NEXT: retl			; X86-AVX1-NEXT: retl
	;			;
	; X86-AVX2-LABEL: test_reduce_v4i64:			; X86-AVX2-LABEL: test_reduce_v4i64:
	; X86-AVX2: ## %bb.0:			; X86-AVX2: ## %bb.0:
	; X86-AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; X86-AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; X64-SSE42-NEXT: pcmpgtq %xmm0, %xmm3			; X64-SSE42-NEXT: pcmpgtq %xmm0, %xmm3
	; X64-SSE42-NEXT: movdqa %xmm3, %xmm0			; X64-SSE42-NEXT: movdqa %xmm3, %xmm0
	; X64-SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; X64-SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; X64-SSE42-NEXT: movq %xmm2, %rax			; X64-SSE42-NEXT: movq %xmm2, %rax
	; X64-SSE42-NEXT: retq			; X64-SSE42-NEXT: retq
	;			;
	; X64-AVX1-LABEL: test_reduce_v4i64:			; X64-AVX1-LABEL: test_reduce_v4i64:
	; X64-AVX1: ## %bb.0:			; X64-AVX1: ## %bb.0:
	; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; X64-AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
	; X64-AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; X64-AVX1-NEXT: vpxor %xmm1, %xmm0, %xmm2
	; X64-AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3			; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; X64-AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm4			; X64-AVX1-NEXT: vpxor %xmm1, %xmm3, %xmm4
	; X64-AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; X64-AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2
	; X64-AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm4			; X64-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm3, %xmm0
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm3, %ymm3			; X64-AVX1-NEXT: vpermilps {{.*#+}} xmm2 = xmm0[2,3,0,1]
	; X64-AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm1, %ymm0			; X64-AVX1-NEXT: vxorpd %xmm1, %xmm0, %xmm3
	; X64-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; X64-AVX1-NEXT: vxorpd %xmm1, %xmm2, %xmm1
	; X64-AVX1-NEXT: vxorpd %xmm2, %xmm0, %xmm3			; X64-AVX1-NEXT: vpcmpgtq %xmm3, %xmm1, %xmm1
	; X64-AVX1-NEXT: vxorpd %xmm2, %xmm1, %xmm2			; X64-AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm2, %xmm0
	; X64-AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; X64-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; X64-AVX1-NEXT: vmovq %xmm0, %rax			; X64-AVX1-NEXT: vmovq %xmm0, %rax
	; X64-AVX1-NEXT: vzeroupper			; X64-AVX1-NEXT: vzeroupper
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX2-LABEL: test_reduce_v4i64:			; X64-AVX2-LABEL: test_reduce_v4i64:
	; X64-AVX2: ## %bb.0:			; X64-AVX2: ## %bb.0:
	; X64-AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; X64-AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 559 Lines • ▼ Show 20 Lines
	; X86-SSE42-NEXT: pextrd $1, %xmm1, %edx			; X86-SSE42-NEXT: pextrd $1, %xmm1, %edx
	; X86-SSE42-NEXT: retl			; X86-SSE42-NEXT: retl
	;			;
	; X86-AVX1-LABEL: test_reduce_v8i64:			; X86-AVX1-LABEL: test_reduce_v8i64:
	; X86-AVX1: ## %bb.0:			; X86-AVX1: ## %bb.0:
	; X86-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; X86-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; X86-AVX1-NEXT: vmovddup {{.*#+}} xmm3 = [-0.0E+0,-0.0E+0]			; X86-AVX1-NEXT: vmovddup {{.*#+}} xmm3 = [-0.0E+0,-0.0E+0]
	; X86-AVX1-NEXT: ## xmm3 = mem[0,0]			; X86-AVX1-NEXT: ## xmm3 = mem[0,0]
	; X86-AVX1-NEXT: vxorps %xmm3, %xmm2, %xmm2			; X86-AVX1-NEXT: vxorps %xmm3, %xmm2, %xmm4
	; X86-AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4			; X86-AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5
	; X86-AVX1-NEXT: vxorps %xmm3, %xmm4, %xmm4			; X86-AVX1-NEXT: vxorps %xmm3, %xmm5, %xmm6
	; X86-AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2			; X86-AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm4
	; X86-AVX1-NEXT: vxorps %xmm3, %xmm0, %xmm4			; X86-AVX1-NEXT: vxorps %xmm3, %xmm0, %xmm6
	; X86-AVX1-NEXT: vxorps %xmm3, %xmm1, %xmm5			; X86-AVX1-NEXT: vxorps %xmm3, %xmm1, %xmm7
	; X86-AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; X86-AVX1-NEXT: vpcmpgtq %xmm6, %xmm7, %xmm6
	; X86-AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm4, %ymm2			; X86-AVX1-NEXT: vblendvpd %xmm6, %xmm0, %xmm1, %xmm0
	; X86-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X86-AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm1
	; X86-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; X86-AVX1-NEXT: vblendvpd %xmm4, %xmm2, %xmm5, %xmm2
	; X86-AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm2			; X86-AVX1-NEXT: vxorpd %xmm3, %xmm2, %xmm4
	; X86-AVX1-NEXT: vxorps %xmm3, %xmm1, %xmm4			; X86-AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm1
	; X86-AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2			; X86-AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm2, %xmm0
	; X86-AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm4
	; X86-AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm2, %ymm2
	; X86-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; X86-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; X86-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; X86-AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm2			; X86-AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm2
	; X86-AVX1-NEXT: vxorpd %xmm3, %xmm1, %xmm3			; X86-AVX1-NEXT: vxorpd %xmm3, %xmm1, %xmm3
	; X86-AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; X86-AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; X86-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X86-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X86-AVX1-NEXT: vmovd %xmm0, %eax			; X86-AVX1-NEXT: vmovd %xmm0, %eax
	; X86-AVX1-NEXT: vpextrd $1, %xmm0, %edx			; X86-AVX1-NEXT: vpextrd $1, %xmm0, %edx
	; X86-AVX1-NEXT: vzeroupper			; X86-AVX1-NEXT: vzeroupper
	; X86-AVX1-NEXT: retl			; X86-AVX1-NEXT: retl
	;			;
	; X86-AVX2-LABEL: test_reduce_v8i64:			; X86-AVX2-LABEL: test_reduce_v8i64:
	; X86-AVX2: ## %bb.0:			; X86-AVX2: ## %bb.0:
	; X86-AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [-0.0E+0,-0.0E+0,-0.0E+0,-0.0E+0]			; X86-AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [-0.0E+0,-0.0E+0,-0.0E+0,-0.0E+0]
	▲ Show 20 Lines • Show All 113 Lines • ▼ Show 20 Lines
	; X64-SSE42-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; X64-SSE42-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; X64-SSE42-NEXT: movq %xmm1, %rax			; X64-SSE42-NEXT: movq %xmm1, %rax
	; X64-SSE42-NEXT: retq			; X64-SSE42-NEXT: retq
	;			;
	; X64-AVX1-LABEL: test_reduce_v8i64:			; X64-AVX1-LABEL: test_reduce_v8i64:
	; X64-AVX1: ## %bb.0:			; X64-AVX1: ## %bb.0:
	; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; X64-AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]			; X64-AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
	; X64-AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; X64-AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm4
	; X64-AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4			; X64-AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5
	; X64-AVX1-NEXT: vpxor %xmm3, %xmm4, %xmm4			; X64-AVX1-NEXT: vpxor %xmm3, %xmm5, %xmm6
	; X64-AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2			; X64-AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm4
	; X64-AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm4			; X64-AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm6
	; X64-AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm5			; X64-AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm7
	; X64-AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; X64-AVX1-NEXT: vpcmpgtq %xmm6, %xmm7, %xmm6
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm4, %ymm2			; X64-AVX1-NEXT: vblendvpd %xmm6, %xmm0, %xmm1, %xmm0
	; X64-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X64-AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm1
	; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; X64-AVX1-NEXT: vblendvpd %xmm4, %xmm2, %xmm5, %xmm2
	; X64-AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm2			; X64-AVX1-NEXT: vxorpd %xmm3, %xmm2, %xmm4
	; X64-AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm4			; X64-AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm1
	; X64-AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2			; X64-AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm2, %xmm0
	; X64-AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm4
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm2, %ymm2
	; X64-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; X64-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; X64-AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; X64-AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm2			; X64-AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm2
	; X64-AVX1-NEXT: vxorpd %xmm3, %xmm1, %xmm3			; X64-AVX1-NEXT: vxorpd %xmm3, %xmm1, %xmm3
	; X64-AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; X64-AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; X64-AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; X64-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X64-AVX1-NEXT: vmovq %xmm0, %rax			; X64-AVX1-NEXT: vmovq %xmm0, %rax
	; X64-AVX1-NEXT: vzeroupper			; X64-AVX1-NEXT: vzeroupper
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX2-LABEL: test_reduce_v8i64:			; X64-AVX2-LABEL: test_reduce_v8i64:
	; X64-AVX2: ## %bb.0:			; X64-AVX2: ## %bb.0:
	; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; X64-AVX2-NEXT: vpxor %ymm2, %ymm0, %ymm3			; X64-AVX2-NEXT: vpxor %ymm2, %ymm0, %ymm3
	▲ Show 20 Lines • Show All 559 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/masked_store_trunc_ssat.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 303 Lines • ▼ Show 20 Lines
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm3
	; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX1-NEXT: vpcmpeqd %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm4, %xmm3, %xmm3
	; AVX1-NEXT: vpcmpeqd %xmm5, %xmm5, %xmm5			; AVX1-NEXT: vpcmpeqd %xmm5, %xmm5, %xmm5
	; AVX1-NEXT: vpxor %xmm5, %xmm3, %xmm3			; AVX1-NEXT: vpxor %xmm5, %xmm3, %xmm3
	; AVX1-NEXT: vpcmpeqd %xmm4, %xmm2, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm4, %xmm2, %xmm2
	; AVX1-NEXT: vpxor %xmm5, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm5, %xmm2, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm2, %ymm2			; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm2, %ymm8
	; AVX1-NEXT: vmovapd {{.*#+}} ymm3 = [2147483647,2147483647,2147483647,2147483647]
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [2147483647,2147483647]
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm5, %xmm6
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm6, %ymm4
	; AVX1-NEXT: vblendvpd %ymm4, %ymm1, %ymm3, %ymm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm5, %xmm5
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4
	; AVX1-NEXT: vblendvpd %ymm4, %ymm0, %ymm3, %ymm0
	; AVX1-NEXT: vmovapd {{.*#+}} ymm3 = [18446744071562067968,18446744071562067968,18446744071562067968,18446744071562067968]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [18446744071562067968,18446744071562067968]
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm4, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm0, %xmm6
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm6, %ymm4
	; AVX1-NEXT: vblendvpd %ymm4, %ymm0, %ymm3, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm4, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm1, %xmm5
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4
	; AVX1-NEXT: vblendvpd %ymm4, %ymm1, %ymm3, %ymm1
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
				; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [2147483647,2147483647]
				; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm9
				; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm6
				; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm7
				; AVX1-NEXT: vpcmpgtq %xmm7, %xmm4, %xmm2
				; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm5
				; AVX1-NEXT: vblendvpd %xmm5, %xmm0, %xmm4, %xmm0
				; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [18446744071562067968,18446744071562067968]
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm0, %xmm10
				; AVX1-NEXT: vblendvpd %xmm2, %xmm7, %xmm4, %xmm2
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm2, %xmm7
				; AVX1-NEXT: vblendvpd %xmm6, %xmm1, %xmm4, %xmm1
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm1, %xmm6
				; AVX1-NEXT: vblendvpd %xmm9, %xmm3, %xmm4, %xmm3
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm3, %xmm4
				; AVX1-NEXT: vblendvpd %xmm4, %xmm3, %xmm5, %xmm3
				; AVX1-NEXT: vblendvpd %xmm6, %xmm1, %xmm5, %xmm1
	; AVX1-NEXT: vshufps {{.*#+}} xmm1 = xmm1[0,2],xmm3[0,2]			; AVX1-NEXT: vshufps {{.*#+}} xmm1 = xmm1[0,2],xmm3[0,2]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm7, %xmm2, %xmm5, %xmm2
	; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm3[0,2]			; AVX1-NEXT: vblendvpd %xmm10, %xmm0, %xmm5, %xmm0
				; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm2[0,2]
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
	; AVX1-NEXT: vmaskmovps %ymm0, %ymm2, (%rdi)			; AVX1-NEXT: vmaskmovps %ymm0, %ymm8, (%rdi)
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: truncstore_v8i64_v8i32:			; AVX2-LABEL: truncstore_v8i64_v8i32:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3			; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3
	; AVX2-NEXT: vpcmpeqd %ymm3, %ymm2, %ymm2			; AVX2-NEXT: vpcmpeqd %ymm3, %ymm2, %ymm2
	; AVX2-NEXT: vpcmpeqd %ymm3, %ymm3, %ymm3			; AVX2-NEXT: vpcmpeqd %ymm3, %ymm3, %ymm3
	▲ Show 20 Lines • Show All 350 Lines • ▼ Show 20 Lines
	; SSE4-NEXT: pextrw $7, %xmm7, 14(%rdi)			; SSE4-NEXT: pextrw $7, %xmm7, 14(%rdi)
	; SSE4-NEXT: .LBB1_16: # %else14			; SSE4-NEXT: .LBB1_16: # %else14
	; SSE4-NEXT: retq			; SSE4-NEXT: retq
	;			;
	; AVX1-LABEL: truncstore_v8i64_v8i16:			; AVX1-LABEL: truncstore_v8i64_v8i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpxor %xmm8, %xmm8, %xmm8			; AVX1-NEXT: vpxor %xmm8, %xmm8, %xmm8
	; AVX1-NEXT: vpcmpeqd %xmm8, %xmm2, %xmm5			; AVX1-NEXT: vpcmpeqd %xmm8, %xmm2, %xmm5
	; AVX1-NEXT: vpcmpeqd %xmm4, %xmm4, %xmm4			; AVX1-NEXT: vpcmpeqd %xmm9, %xmm9, %xmm9
	; AVX1-NEXT: vpxor %xmm4, %xmm5, %xmm5			; AVX1-NEXT: vpxor %xmm9, %xmm5, %xmm10
	; AVX1-NEXT: vmovapd {{.*#+}} ymm6 = [32767,32767,32767,32767]
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm7
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [32767,32767]
	; AVX1-NEXT: vpcmpgtq %xmm7, %xmm3, %xmm7
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm9
	; AVX1-NEXT: vinsertf128 $1, %xmm7, %ymm9, %ymm7
	; AVX1-NEXT: vblendvpd %ymm7, %ymm1, %ymm6, %ymm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm7
	; AVX1-NEXT: vpcmpgtq %xmm7, %xmm3, %xmm7
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm3
	; AVX1-NEXT: vinsertf128 $1, %xmm7, %ymm3, %ymm3
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm6, %ymm0
	; AVX1-NEXT: vmovapd {{.*#+}} ymm3 = [18446744073709518848,18446744073709518848,18446744073709518848,18446744073709518848]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm7 = [18446744073709518848,18446744073709518848]
	; AVX1-NEXT: vpcmpgtq %xmm7, %xmm6, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm7, %xmm0, %xmm9
	; AVX1-NEXT: vinsertf128 $1, %xmm6, %ymm9, %ymm6
	; AVX1-NEXT: vblendvpd %ymm6, %ymm0, %ymm3, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm6			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm7, %xmm6, %xmm6			; AVX1-NEXT: vmovdqa {{.*#+}} xmm7 = [32767,32767]
	; AVX1-NEXT: vpcmpgtq %xmm7, %xmm1, %xmm7			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm7, %xmm11
	; AVX1-NEXT: vinsertf128 $1, %xmm6, %ymm7, %ymm6			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm7, %xmm12
	; AVX1-NEXT: vblendvpd %ymm6, %ymm1, %ymm3, %ymm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm3
	; AVX1-NEXT: vpackssdw %xmm3, %xmm1, %xmm1			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm7, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm7, %xmm0
				; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [18446744073709518848,18446744073709518848]
				; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm13
				; AVX1-NEXT: vblendvpd %xmm3, %xmm5, %xmm7, %xmm3
				; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm14
				; AVX1-NEXT: vblendvpd %xmm12, %xmm1, %xmm7, %xmm1
				; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm5
				; AVX1-NEXT: vblendvpd %xmm11, %xmm6, %xmm7, %xmm6
				; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm7
				; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm4, %xmm6
				; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm4, %xmm1
				; AVX1-NEXT: vpackssdw %xmm6, %xmm1, %xmm1
				; AVX1-NEXT: vblendvpd %xmm14, %xmm3, %xmm4, %xmm3
				; AVX1-NEXT: vblendvpd %xmm13, %xmm0, %xmm4, %xmm0
	; AVX1-NEXT: vpackssdw %xmm3, %xmm0, %xmm0			; AVX1-NEXT: vpackssdw %xmm3, %xmm0, %xmm0
	; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpextrb $0, %xmm5, %eax			; AVX1-NEXT: vpextrb $0, %xmm10, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB1_2			; AVX1-NEXT: je .LBB1_2
	; AVX1-NEXT: # %bb.1: # %cond.store			; AVX1-NEXT: # %bb.1: # %cond.store
	; AVX1-NEXT: vpextrw $0, %xmm0, (%rdi)			; AVX1-NEXT: vpextrw $0, %xmm0, (%rdi)
	; AVX1-NEXT: .LBB1_2: # %else			; AVX1-NEXT: .LBB1_2: # %else
	; AVX1-NEXT: vpcmpeqd %xmm8, %xmm2, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm8, %xmm2, %xmm1
	; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm9, %xmm1, %xmm1
	; AVX1-NEXT: vpextrb $4, %xmm1, %eax			; AVX1-NEXT: vpextrb $4, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB1_4			; AVX1-NEXT: je .LBB1_4
	; AVX1-NEXT: # %bb.3: # %cond.store1			; AVX1-NEXT: # %bb.3: # %cond.store1
	; AVX1-NEXT: vpextrw $1, %xmm0, 2(%rdi)			; AVX1-NEXT: vpextrw $1, %xmm0, 2(%rdi)
	; AVX1-NEXT: .LBB1_4: # %else2			; AVX1-NEXT: .LBB1_4: # %else2
	; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm2, %xmm4			; AVX1-NEXT: vpcmpeqd %xmm1, %xmm2, %xmm4
	▲ Show 20 Lines • Show All 530 Lines • ▼ Show 20 Lines
	; SSE4-NEXT: pextrb $14, %xmm7, 7(%rdi)			; SSE4-NEXT: pextrb $14, %xmm7, 7(%rdi)
	; SSE4-NEXT: .LBB2_16: # %else14			; SSE4-NEXT: .LBB2_16: # %else14
	; SSE4-NEXT: retq			; SSE4-NEXT: retq
	;			;
	; AVX1-LABEL: truncstore_v8i64_v8i8:			; AVX1-LABEL: truncstore_v8i64_v8i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpxor %xmm8, %xmm8, %xmm8			; AVX1-NEXT: vpxor %xmm8, %xmm8, %xmm8
	; AVX1-NEXT: vpcmpeqd %xmm8, %xmm2, %xmm5			; AVX1-NEXT: vpcmpeqd %xmm8, %xmm2, %xmm5
	; AVX1-NEXT: vpcmpeqd %xmm4, %xmm4, %xmm4			; AVX1-NEXT: vpcmpeqd %xmm9, %xmm9, %xmm9
	; AVX1-NEXT: vpxor %xmm4, %xmm5, %xmm5			; AVX1-NEXT: vpxor %xmm9, %xmm5, %xmm10
	; AVX1-NEXT: vmovapd {{.*#+}} ymm6 = [127,127,127,127]
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm7
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [127,127]
	; AVX1-NEXT: vpcmpgtq %xmm7, %xmm3, %xmm7
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm9
	; AVX1-NEXT: vinsertf128 $1, %xmm7, %ymm9, %ymm7
	; AVX1-NEXT: vblendvpd %ymm7, %ymm1, %ymm6, %ymm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm7
	; AVX1-NEXT: vpcmpgtq %xmm7, %xmm3, %xmm7
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm3
	; AVX1-NEXT: vinsertf128 $1, %xmm7, %ymm3, %ymm3
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm6, %ymm0
	; AVX1-NEXT: vmovapd {{.*#+}} ymm3 = [18446744073709551488,18446744073709551488,18446744073709551488,18446744073709551488]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm7 = [18446744073709551488,18446744073709551488]
	; AVX1-NEXT: vpcmpgtq %xmm7, %xmm6, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm7, %xmm0, %xmm9
	; AVX1-NEXT: vinsertf128 $1, %xmm6, %ymm9, %ymm6
	; AVX1-NEXT: vblendvpd %ymm6, %ymm0, %ymm3, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm6			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm7, %xmm6, %xmm6			; AVX1-NEXT: vmovdqa {{.*#+}} xmm7 = [127,127]
	; AVX1-NEXT: vpcmpgtq %xmm7, %xmm1, %xmm7			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm7, %xmm11
	; AVX1-NEXT: vinsertf128 $1, %xmm6, %ymm7, %ymm6			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm7, %xmm12
	; AVX1-NEXT: vblendvpd %ymm6, %ymm1, %ymm3, %ymm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm3
	; AVX1-NEXT: vpackssdw %xmm3, %xmm1, %xmm1			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm7, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm7, %xmm0
				; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [18446744073709551488,18446744073709551488]
				; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm13
				; AVX1-NEXT: vblendvpd %xmm3, %xmm5, %xmm7, %xmm3
				; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm14
				; AVX1-NEXT: vblendvpd %xmm12, %xmm1, %xmm7, %xmm1
				; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm5
				; AVX1-NEXT: vblendvpd %xmm11, %xmm6, %xmm7, %xmm6
				; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm7
				; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm4, %xmm6
				; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm4, %xmm1
				; AVX1-NEXT: vpackssdw %xmm6, %xmm1, %xmm1
				; AVX1-NEXT: vblendvpd %xmm14, %xmm3, %xmm4, %xmm3
				; AVX1-NEXT: vblendvpd %xmm13, %xmm0, %xmm4, %xmm0
	; AVX1-NEXT: vpackssdw %xmm3, %xmm0, %xmm0			; AVX1-NEXT: vpackssdw %xmm3, %xmm0, %xmm0
	; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpextrb $0, %xmm5, %eax			; AVX1-NEXT: vpextrb $0, %xmm10, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB2_2			; AVX1-NEXT: je .LBB2_2
	; AVX1-NEXT: # %bb.1: # %cond.store			; AVX1-NEXT: # %bb.1: # %cond.store
	; AVX1-NEXT: vpextrb $0, %xmm0, (%rdi)			; AVX1-NEXT: vpextrb $0, %xmm0, (%rdi)
	; AVX1-NEXT: .LBB2_2: # %else			; AVX1-NEXT: .LBB2_2: # %else
	; AVX1-NEXT: vpcmpeqd %xmm8, %xmm2, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm8, %xmm2, %xmm1
	; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm9, %xmm1, %xmm1
	; AVX1-NEXT: vpextrb $4, %xmm1, %eax			; AVX1-NEXT: vpextrb $4, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB2_4			; AVX1-NEXT: je .LBB2_4
	; AVX1-NEXT: # %bb.3: # %cond.store1			; AVX1-NEXT: # %bb.3: # %cond.store1
	; AVX1-NEXT: vpextrb $2, %xmm0, 1(%rdi)			; AVX1-NEXT: vpextrb $2, %xmm0, 1(%rdi)
	; AVX1-NEXT: .LBB2_4: # %else2			; AVX1-NEXT: .LBB2_4: # %else2
	; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm2, %xmm4			; AVX1-NEXT: vpcmpeqd %xmm1, %xmm2, %xmm4
	▲ Show 20 Lines • Show All 390 Lines • ▼ Show 20 Lines
	; SSE4-NEXT: retq			; SSE4-NEXT: retq
	;			;
	; AVX1-LABEL: truncstore_v4i64_v4i32:			; AVX1-LABEL: truncstore_v4i64_v4i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [2147483647,2147483647,2147483647,2147483647]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [2147483647,2147483647]
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm4
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [18446744071562067968,18446744071562067968,18446744071562067968,18446744071562067968]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [18446744071562067968,18446744071562067968]
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm4
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
				; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [2147483647,2147483647]
				; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm4
				; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm5
				; AVX1-NEXT: vblendvpd %xmm5, %xmm0, %xmm3, %xmm0
				; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [18446744071562067968,18446744071562067968]
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm0, %xmm6
				; AVX1-NEXT: vblendvpd %xmm4, %xmm2, %xmm3, %xmm2
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm2, %xmm3
				; AVX1-NEXT: vblendvpd %xmm3, %xmm2, %xmm5, %xmm2
				; AVX1-NEXT: vblendvpd %xmm6, %xmm0, %xmm5, %xmm0
	; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm2[0,2]			; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm2[0,2]
	; AVX1-NEXT: vmaskmovps %xmm0, %xmm1, (%rdi)			; AVX1-NEXT: vmaskmovps %xmm0, %xmm1, (%rdi)
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: truncstore_v4i64_v4i32:			; AVX2-LABEL: truncstore_v4i64_v4i32:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
	▲ Show 20 Lines • Show All 217 Lines • ▼ Show 20 Lines
	; SSE4-NEXT: retq			; SSE4-NEXT: retq
	;			;
	; AVX1-LABEL: truncstore_v4i64_v4i16:			; AVX1-LABEL: truncstore_v4i64_v4i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vmovapd {{.*#+}} ymm3 = [32767,32767,32767,32767]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [32767,32767]
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm5, %xmm5
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4
	; AVX1-NEXT: vblendvpd %ymm4, %ymm0, %ymm3, %ymm0
	; AVX1-NEXT: vmovapd {{.*#+}} ymm3 = [18446744073709518848,18446744073709518848,18446744073709518848,18446744073709518848]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [18446744073709518848,18446744073709518848]
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm4, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm0, %xmm5
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4
	; AVX1-NEXT: vblendvpd %ymm4, %ymm0, %ymm3, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
				; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [32767,32767]
				; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm5
				; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm6
				; AVX1-NEXT: vblendvpd %xmm6, %xmm0, %xmm4, %xmm0
				; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [18446744073709518848,18446744073709518848]
				; AVX1-NEXT: vpcmpgtq %xmm6, %xmm0, %xmm7
				; AVX1-NEXT: vblendvpd %xmm5, %xmm3, %xmm4, %xmm3
				; AVX1-NEXT: vpcmpgtq %xmm6, %xmm3, %xmm4
				; AVX1-NEXT: vblendvpd %xmm4, %xmm3, %xmm6, %xmm3
				; AVX1-NEXT: vblendvpd %xmm7, %xmm0, %xmm6, %xmm0
	; AVX1-NEXT: vpackssdw %xmm3, %xmm0, %xmm0			; AVX1-NEXT: vpackssdw %xmm3, %xmm0, %xmm0
	; AVX1-NEXT: vpextrb $0, %xmm2, %eax			; AVX1-NEXT: vpextrb $0, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB4_2			; AVX1-NEXT: je .LBB4_2
	; AVX1-NEXT: # %bb.1: # %cond.store			; AVX1-NEXT: # %bb.1: # %cond.store
	; AVX1-NEXT: vpextrw $0, %xmm0, (%rdi)			; AVX1-NEXT: vpextrw $0, %xmm0, (%rdi)
	; AVX1-NEXT: .LBB4_2: # %else			; AVX1-NEXT: .LBB4_2: # %else
	; AVX1-NEXT: vpextrb $4, %xmm2, %eax			; AVX1-NEXT: vpextrb $4, %xmm2, %eax
	▲ Show 20 Lines • Show All 299 Lines • ▼ Show 20 Lines
	; SSE4-NEXT: retq			; SSE4-NEXT: retq
	;			;
	; AVX1-LABEL: truncstore_v4i64_v4i8:			; AVX1-LABEL: truncstore_v4i64_v4i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vmovapd {{.*#+}} ymm3 = [127,127,127,127]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [127,127]
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm5, %xmm5
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4
	; AVX1-NEXT: vblendvpd %ymm4, %ymm0, %ymm3, %ymm0
	; AVX1-NEXT: vmovapd {{.*#+}} ymm3 = [18446744073709551488,18446744073709551488,18446744073709551488,18446744073709551488]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [18446744073709551488,18446744073709551488]
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm4, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm0, %xmm5
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4
	; AVX1-NEXT: vblendvpd %ymm4, %ymm0, %ymm3, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
				; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [127,127]
				; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm5
				; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm6
				; AVX1-NEXT: vblendvpd %xmm6, %xmm0, %xmm4, %xmm0
				; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [18446744073709551488,18446744073709551488]
				; AVX1-NEXT: vpcmpgtq %xmm6, %xmm0, %xmm7
				; AVX1-NEXT: vblendvpd %xmm5, %xmm3, %xmm4, %xmm3
				; AVX1-NEXT: vpcmpgtq %xmm6, %xmm3, %xmm4
				; AVX1-NEXT: vblendvpd %xmm4, %xmm3, %xmm6, %xmm3
				; AVX1-NEXT: vblendvpd %xmm7, %xmm0, %xmm6, %xmm0
	; AVX1-NEXT: vpackssdw %xmm3, %xmm0, %xmm0			; AVX1-NEXT: vpackssdw %xmm3, %xmm0, %xmm0
	; AVX1-NEXT: vpextrb $0, %xmm2, %eax			; AVX1-NEXT: vpextrb $0, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB5_2			; AVX1-NEXT: je .LBB5_2
	; AVX1-NEXT: # %bb.1: # %cond.store			; AVX1-NEXT: # %bb.1: # %cond.store
	; AVX1-NEXT: vpextrb $0, %xmm0, (%rdi)			; AVX1-NEXT: vpextrb $0, %xmm0, (%rdi)
	; AVX1-NEXT: .LBB5_2: # %else			; AVX1-NEXT: .LBB5_2: # %else
	; AVX1-NEXT: vpextrb $4, %xmm2, %eax			; AVX1-NEXT: vpextrb $4, %xmm2, %eax
	▲ Show 20 Lines • Show All 6,356 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/masked_store_trunc_usat.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 242 Lines • ▼ Show 20 Lines
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm3
	; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX1-NEXT: vpcmpeqd %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm4, %xmm3, %xmm3
	; AVX1-NEXT: vpcmpeqd %xmm5, %xmm5, %xmm5			; AVX1-NEXT: vpcmpeqd %xmm5, %xmm5, %xmm5
	; AVX1-NEXT: vpxor %xmm5, %xmm3, %xmm3			; AVX1-NEXT: vpxor %xmm5, %xmm3, %xmm3
	; AVX1-NEXT: vpcmpeqd %xmm4, %xmm2, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm4, %xmm2, %xmm2
	; AVX1-NEXT: vpxor %xmm5, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm5, %xmm2, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm2, %ymm2			; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm2, %ymm8
	; AVX1-NEXT: vmovapd {{.*#+}} ymm3 = [4294967295,4294967295,4294967295,4294967295]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm4
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372041149743103,9223372041149743103]
	; AVX1-NEXT: vpxor %xmm5, %xmm4, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm9
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [9223372041149743103,9223372041149743103]			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm4			; AVX1-NEXT: vpxor %xmm3, %xmm6, %xmm7
	; AVX1-NEXT: vpxor %xmm5, %xmm0, %xmm7			; AVX1-NEXT: vpcmpgtq %xmm7, %xmm5, %xmm7
	; AVX1-NEXT: vpcmpgtq %xmm7, %xmm6, %xmm7			; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm7, %ymm4			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm5, %xmm2
	; AVX1-NEXT: vblendvpd %ymm4, %ymm0, %ymm3, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4
	; AVX1-NEXT: vpxor %xmm5, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm3, %xmm4, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3
	; AVX1-NEXT: vpxor %xmm5, %xmm1, %xmm5			; AVX1-NEXT: vmovapd {{.*#+}} xmm5 = [4294967295,4294967295]
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5			; AVX1-NEXT: vblendvpd %xmm3, %xmm4, %xmm5, %xmm3
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4			; AVX1-NEXT: vblendvpd %xmm2, %xmm1, %xmm5, %xmm1
	; AVX1-NEXT: vblendvpd %ymm4, %ymm1, %ymm3, %ymm1
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vshufps {{.*#+}} xmm1 = xmm1[0,2],xmm3[0,2]			; AVX1-NEXT: vshufps {{.*#+}} xmm1 = xmm1[0,2],xmm3[0,2]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm5, %xmm2
	; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm3[0,2]			; AVX1-NEXT: vblendvpd %xmm9, %xmm0, %xmm5, %xmm0
				; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm2[0,2]
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
	; AVX1-NEXT: vmaskmovps %ymm0, %ymm2, (%rdi)			; AVX1-NEXT: vmaskmovps %ymm0, %ymm8, (%rdi)
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: truncstore_v8i64_v8i32:			; AVX2-LABEL: truncstore_v8i64_v8i32:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3			; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3
	; AVX2-NEXT: vpcmpeqd %ymm3, %ymm2, %ymm2			; AVX2-NEXT: vpcmpeqd %ymm3, %ymm2, %ymm2
	; AVX2-NEXT: vpcmpeqd %ymm3, %ymm3, %ymm3			; AVX2-NEXT: vpcmpeqd %ymm3, %ymm3, %ymm3
	▲ Show 20 Lines • Show All 292 Lines • ▼ Show 20 Lines
	; SSE4-NEXT: .LBB1_16: # %else14			; SSE4-NEXT: .LBB1_16: # %else14
	; SSE4-NEXT: retq			; SSE4-NEXT: retq
	;			;
	; AVX1-LABEL: truncstore_v8i64_v8i16:			; AVX1-LABEL: truncstore_v8i64_v8i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpxor %xmm8, %xmm8, %xmm8			; AVX1-NEXT: vpxor %xmm8, %xmm8, %xmm8
	; AVX1-NEXT: vpcmpeqd %xmm8, %xmm2, %xmm5			; AVX1-NEXT: vpcmpeqd %xmm8, %xmm2, %xmm5
	; AVX1-NEXT: vpcmpeqd %xmm9, %xmm9, %xmm9			; AVX1-NEXT: vpcmpeqd %xmm9, %xmm9, %xmm9
	; AVX1-NEXT: vpxor %xmm9, %xmm5, %xmm5			; AVX1-NEXT: vpxor %xmm9, %xmm5, %xmm10
	; AVX1-NEXT: vmovapd {{.*#+}} ymm10 = [65535,65535,65535,65535]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm7			; AVX1-NEXT: vpxor %xmm6, %xmm0, %xmm7
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854841343,9223372036854841343]
	; AVX1-NEXT: vpxor %xmm3, %xmm7, %xmm7			; AVX1-NEXT: vpcmpgtq %xmm7, %xmm3, %xmm11
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854841343,9223372036854841343]			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm7, %xmm4, %xmm7			; AVX1-NEXT: vpxor %xmm6, %xmm4, %xmm5
	; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm6			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm3, %xmm12
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm4, %xmm6			; AVX1-NEXT: vpxor %xmm6, %xmm1, %xmm7
	; AVX1-NEXT: vinsertf128 $1, %xmm7, %ymm6, %ymm6			; AVX1-NEXT: vpcmpgtq %xmm7, %xmm3, %xmm7
	; AVX1-NEXT: vblendvpd %ymm6, %ymm0, %ymm10, %ymm0			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm6			; AVX1-NEXT: vpxor %xmm6, %xmm5, %xmm6
	; AVX1-NEXT: vpxor %xmm3, %xmm6, %xmm6			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm3, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm4, %xmm6			; AVX1-NEXT: vmovapd {{.*#+}} xmm6 = [65535,65535]
	; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm3			; AVX1-NEXT: vblendvpd %xmm3, %xmm5, %xmm6, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vblendvpd %xmm7, %xmm1, %xmm6, %xmm1
	; AVX1-NEXT: vinsertf128 $1, %xmm6, %ymm3, %ymm3
	; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm10, %ymm1
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vpackusdw %xmm3, %xmm1, %xmm1			; AVX1-NEXT: vpackusdw %xmm3, %xmm1, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm12, %xmm4, %xmm6, %xmm3
				; AVX1-NEXT: vblendvpd %xmm11, %xmm0, %xmm6, %xmm0
	; AVX1-NEXT: vpackusdw %xmm3, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm3, %xmm0, %xmm0
	; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpextrb $0, %xmm5, %eax			; AVX1-NEXT: vpextrb $0, %xmm10, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB1_2			; AVX1-NEXT: je .LBB1_2
	; AVX1-NEXT: # %bb.1: # %cond.store			; AVX1-NEXT: # %bb.1: # %cond.store
	; AVX1-NEXT: vpextrw $0, %xmm0, (%rdi)			; AVX1-NEXT: vpextrw $0, %xmm0, (%rdi)
	; AVX1-NEXT: .LBB1_2: # %else			; AVX1-NEXT: .LBB1_2: # %else
	; AVX1-NEXT: vpcmpeqd %xmm8, %xmm2, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm8, %xmm2, %xmm1
	; AVX1-NEXT: vpxor %xmm9, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm9, %xmm1, %xmm1
	; AVX1-NEXT: vpextrb $4, %xmm1, %eax			; AVX1-NEXT: vpextrb $4, %xmm1, %eax
	▲ Show 20 Lines • Show All 472 Lines • ▼ Show 20 Lines
	; SSE4-NEXT: .LBB2_16: # %else14			; SSE4-NEXT: .LBB2_16: # %else14
	; SSE4-NEXT: retq			; SSE4-NEXT: retq
	;			;
	; AVX1-LABEL: truncstore_v8i64_v8i8:			; AVX1-LABEL: truncstore_v8i64_v8i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpxor %xmm8, %xmm8, %xmm8			; AVX1-NEXT: vpxor %xmm8, %xmm8, %xmm8
	; AVX1-NEXT: vpcmpeqd %xmm8, %xmm2, %xmm5			; AVX1-NEXT: vpcmpeqd %xmm8, %xmm2, %xmm5
	; AVX1-NEXT: vpcmpeqd %xmm9, %xmm9, %xmm9			; AVX1-NEXT: vpcmpeqd %xmm9, %xmm9, %xmm9
	; AVX1-NEXT: vpxor %xmm9, %xmm5, %xmm5			; AVX1-NEXT: vpxor %xmm9, %xmm5, %xmm10
	; AVX1-NEXT: vmovapd {{.*#+}} ymm10 = [255,255,255,255]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm7			; AVX1-NEXT: vpxor %xmm6, %xmm0, %xmm7
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854776063,9223372036854776063]
	; AVX1-NEXT: vpxor %xmm3, %xmm7, %xmm7			; AVX1-NEXT: vpcmpgtq %xmm7, %xmm3, %xmm11
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854776063,9223372036854776063]			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm7, %xmm4, %xmm7			; AVX1-NEXT: vpxor %xmm6, %xmm4, %xmm5
	; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm6			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm3, %xmm12
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm4, %xmm6			; AVX1-NEXT: vpxor %xmm6, %xmm1, %xmm7
	; AVX1-NEXT: vinsertf128 $1, %xmm7, %ymm6, %ymm6			; AVX1-NEXT: vpcmpgtq %xmm7, %xmm3, %xmm7
	; AVX1-NEXT: vblendvpd %ymm6, %ymm0, %ymm10, %ymm0			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm6			; AVX1-NEXT: vpxor %xmm6, %xmm5, %xmm6
	; AVX1-NEXT: vpxor %xmm3, %xmm6, %xmm6			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm3, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm4, %xmm6			; AVX1-NEXT: vmovapd {{.*#+}} xmm6 = [255,255]
	; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm3			; AVX1-NEXT: vblendvpd %xmm3, %xmm5, %xmm6, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vblendvpd %xmm7, %xmm1, %xmm6, %xmm1
	; AVX1-NEXT: vinsertf128 $1, %xmm6, %ymm3, %ymm3
	; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm10, %ymm1
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vpackusdw %xmm3, %xmm1, %xmm1			; AVX1-NEXT: vpackusdw %xmm3, %xmm1, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm12, %xmm4, %xmm6, %xmm3
				; AVX1-NEXT: vblendvpd %xmm11, %xmm0, %xmm6, %xmm0
	; AVX1-NEXT: vpackusdw %xmm3, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm3, %xmm0, %xmm0
	; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpextrb $0, %xmm5, %eax			; AVX1-NEXT: vpextrb $0, %xmm10, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB2_2			; AVX1-NEXT: je .LBB2_2
	; AVX1-NEXT: # %bb.1: # %cond.store			; AVX1-NEXT: # %bb.1: # %cond.store
	; AVX1-NEXT: vpextrb $0, %xmm0, (%rdi)			; AVX1-NEXT: vpextrb $0, %xmm0, (%rdi)
	; AVX1-NEXT: .LBB2_2: # %else			; AVX1-NEXT: .LBB2_2: # %else
	; AVX1-NEXT: vpcmpeqd %xmm8, %xmm2, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm8, %xmm2, %xmm1
	; AVX1-NEXT: vpxor %xmm9, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm9, %xmm1, %xmm1
	; AVX1-NEXT: vpextrb $4, %xmm1, %eax			; AVX1-NEXT: vpextrb $4, %xmm1, %eax
	▲ Show 20 Lines • Show All 360 Lines • ▼ Show 20 Lines
	; SSE4-NEXT: retq			; SSE4-NEXT: retq
	;			;
	; AVX1-LABEL: truncstore_v4i64_v4i32:			; AVX1-LABEL: truncstore_v4i64_v4i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [4294967295,4294967295,4294967295,4294967295]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372041149743103,9223372041149743103]
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372041149743103,9223372041149743103]			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm5, %xmm2
	; AVX1-NEXT: vpxor %xmm4, %xmm0, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vmovapd {{.*#+}} xmm4 = [4294967295,4294967295]
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3			; AVX1-NEXT: vblendvpd %xmm2, %xmm5, %xmm4, %xmm2
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0			; AVX1-NEXT: vblendvpd %xmm3, %xmm0, %xmm4, %xmm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm2[0,2]			; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm2[0,2]
	; AVX1-NEXT: vmaskmovps %xmm0, %xmm1, (%rdi)			; AVX1-NEXT: vmaskmovps %xmm0, %xmm1, (%rdi)
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: truncstore_v4i64_v4i32:			; AVX2-LABEL: truncstore_v4i64_v4i32:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
	▲ Show 20 Lines • Show All 179 Lines • ▼ Show 20 Lines
	; SSE4-NEXT: retq			; SSE4-NEXT: retq
	;			;
	; AVX1-LABEL: truncstore_v4i64_v4i16:			; AVX1-LABEL: truncstore_v4i64_v4i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vmovapd {{.*#+}} ymm3 = [65535,65535,65535,65535]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm4
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854841343,9223372036854841343]
	; AVX1-NEXT: vpxor %xmm5, %xmm4, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [9223372036854841343,9223372036854841343]			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm4			; AVX1-NEXT: vpxor %xmm3, %xmm6, %xmm3
	; AVX1-NEXT: vpxor %xmm5, %xmm0, %xmm5			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5			; AVX1-NEXT: vmovapd {{.*#+}} xmm5 = [65535,65535]
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4			; AVX1-NEXT: vblendvpd %xmm3, %xmm6, %xmm5, %xmm3
	; AVX1-NEXT: vblendvpd %ymm4, %ymm0, %ymm3, %ymm0			; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm5, %xmm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpackusdw %xmm3, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm3, %xmm0, %xmm0
	; AVX1-NEXT: vpextrb $0, %xmm2, %eax			; AVX1-NEXT: vpextrb $0, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB4_2			; AVX1-NEXT: je .LBB4_2
	; AVX1-NEXT: # %bb.1: # %cond.store			; AVX1-NEXT: # %bb.1: # %cond.store
	; AVX1-NEXT: vpextrw $0, %xmm0, (%rdi)			; AVX1-NEXT: vpextrw $0, %xmm0, (%rdi)
	; AVX1-NEXT: .LBB4_2: # %else			; AVX1-NEXT: .LBB4_2: # %else
	; AVX1-NEXT: vpextrb $4, %xmm2, %eax			; AVX1-NEXT: vpextrb $4, %xmm2, %eax
	▲ Show 20 Lines • Show All 261 Lines • ▼ Show 20 Lines
	; SSE4-NEXT: retq			; SSE4-NEXT: retq
	;			;
	; AVX1-LABEL: truncstore_v4i64_v4i8:			; AVX1-LABEL: truncstore_v4i64_v4i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vmovapd {{.*#+}} ymm3 = [255,255,255,255]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm4
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854776063,9223372036854776063]
	; AVX1-NEXT: vpxor %xmm5, %xmm4, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [9223372036854776063,9223372036854776063]			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm4			; AVX1-NEXT: vpxor %xmm3, %xmm6, %xmm3
	; AVX1-NEXT: vpxor %xmm5, %xmm0, %xmm5			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5			; AVX1-NEXT: vmovapd {{.*#+}} xmm5 = [255,255]
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4			; AVX1-NEXT: vblendvpd %xmm3, %xmm6, %xmm5, %xmm3
	; AVX1-NEXT: vblendvpd %ymm4, %ymm0, %ymm3, %ymm0			; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm5, %xmm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpackusdw %xmm3, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm3, %xmm0, %xmm0
	; AVX1-NEXT: vpextrb $0, %xmm2, %eax			; AVX1-NEXT: vpextrb $0, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB5_2			; AVX1-NEXT: je .LBB5_2
	; AVX1-NEXT: # %bb.1: # %cond.store			; AVX1-NEXT: # %bb.1: # %cond.store
	; AVX1-NEXT: vpextrb $0, %xmm0, (%rdi)			; AVX1-NEXT: vpextrb $0, %xmm0, (%rdi)
	; AVX1-NEXT: .LBB5_2: # %else			; AVX1-NEXT: .LBB5_2: # %else
	; AVX1-NEXT: vpextrb $4, %xmm2, %eax			; AVX1-NEXT: vpextrb $4, %xmm2, %eax
	▲ Show 20 Lines • Show All 6,348 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/midpoint-int-vec-256.ll

Show First 20 Lines • Show All 469 Lines • ▼ Show 20 Lines
; 64-bit width. 256 / 64 = 4 elts.		; 64-bit width. 256 / 64 = 4 elts.
; ---------------------------------------------------------------------------- ;		; ---------------------------------------------------------------------------- ;

; Values come from regs		; Values come from regs

define <4 x i64> @vec256_i64_signed_reg_reg(<4 x i64> %a1, <4 x i64> %a2) nounwind {		define <4 x i64> @vec256_i64_signed_reg_reg(<4 x i64> %a1, <4 x i64> %a2) nounwind {
; AVX1-FALLBACK-LABEL: vec256_i64_signed_reg_reg:		; AVX1-FALLBACK-LABEL: vec256_i64_signed_reg_reg:
; AVX1-FALLBACK: # %bb.0:		; AVX1-FALLBACK: # %bb.0:
; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm1, %xmm2
; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm0, %xmm3
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm4		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm4
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm5		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm5
; AVX1-FALLBACK-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm6		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm6
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm3
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm7		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm7
; AVX1-FALLBACK-NEXT: vinsertf128 $1, %xmm3, %ymm7, %ymm3		; AVX1-FALLBACK-NEXT: vblendvpd %xmm7, %xmm0, %xmm1, %xmm7
; AVX1-FALLBACK-NEXT: vblendvpd %ymm3, %ymm0, %ymm1, %ymm3		; AVX1-FALLBACK-NEXT: vblendvpd %xmm5, %xmm0, %xmm1, %xmm1
; AVX1-FALLBACK-NEXT: vblendvpd %ymm6, %ymm0, %ymm1, %ymm1		; AVX1-FALLBACK-NEXT: vpsubq %xmm7, %xmm1, %xmm1
; AVX1-FALLBACK-NEXT: vpsubq %xmm3, %xmm1, %xmm6		; AVX1-FALLBACK-NEXT: vblendvpd %xmm6, %xmm3, %xmm2, %xmm6
; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm3, %xmm3		; AVX1-FALLBACK-NEXT: vblendvpd %xmm4, %xmm3, %xmm2, %xmm2
; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm1, %xmm1		; AVX1-FALLBACK-NEXT: vpsubq %xmm6, %xmm2, %xmm2
; AVX1-FALLBACK-NEXT: vpsubq %xmm3, %xmm1, %xmm1		; AVX1-FALLBACK-NEXT: vpsrlq $1, %xmm2, %xmm2
; AVX1-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm1		; AVX1-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm1
; AVX1-FALLBACK-NEXT: vpsrlq $1, %xmm6, %xmm3
; AVX1-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]		; AVX1-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]
; AVX1-FALLBACK-NEXT: vpor %xmm8, %xmm5, %xmm5		; AVX1-FALLBACK-NEXT: vpor %xmm8, %xmm5, %xmm5
; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm7		; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm7
; AVX1-FALLBACK-NEXT: vpmuludq %xmm7, %xmm3, %xmm7		; AVX1-FALLBACK-NEXT: vpmuludq %xmm7, %xmm1, %xmm7
; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm6		; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm1, %xmm6
; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm6, %xmm6		; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm6, %xmm6
; AVX1-FALLBACK-NEXT: vpaddq %xmm6, %xmm7, %xmm6		; AVX1-FALLBACK-NEXT: vpaddq %xmm6, %xmm7, %xmm6
; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm6, %xmm6		; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm6, %xmm6
; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm3, %xmm3		; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm1, %xmm1
; AVX1-FALLBACK-NEXT: vpor %xmm8, %xmm4, %xmm4		; AVX1-FALLBACK-NEXT: vpor %xmm8, %xmm4, %xmm4
; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm4, %xmm5		; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm4, %xmm5
; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm1, %xmm5		; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm2, %xmm5
; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm1, %xmm7		; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm2, %xmm7
; AVX1-FALLBACK-NEXT: vpmuludq %xmm4, %xmm7, %xmm7		; AVX1-FALLBACK-NEXT: vpmuludq %xmm4, %xmm7, %xmm7
; AVX1-FALLBACK-NEXT: vpaddq %xmm7, %xmm5, %xmm5		; AVX1-FALLBACK-NEXT: vpaddq %xmm7, %xmm5, %xmm5
; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm5, %xmm5		; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm5, %xmm5
; AVX1-FALLBACK-NEXT: vpmuludq %xmm4, %xmm1, %xmm1		; AVX1-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm2
; AVX1-FALLBACK-NEXT: vpaddq %xmm2, %xmm5, %xmm2		; AVX1-FALLBACK-NEXT: vpaddq %xmm3, %xmm5, %xmm3
; AVX1-FALLBACK-NEXT: vpaddq %xmm2, %xmm1, %xmm1		; AVX1-FALLBACK-NEXT: vpaddq %xmm3, %xmm2, %xmm2
; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm6, %xmm0		; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm6, %xmm0
; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm3, %xmm0		; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0
; AVX1-FALLBACK-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0		; AVX1-FALLBACK-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX1-FALLBACK-NEXT: retq		; AVX1-FALLBACK-NEXT: retq
;		;
; AVX2-LABEL: vec256_i64_signed_reg_reg:		; AVX2-LABEL: vec256_i64_signed_reg_reg:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2		; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2
; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm3 = [1,1,1,1]		; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm3 = [1,1,1,1]
; AVX2-NEXT: vpor %ymm3, %ymm2, %ymm3		; AVX2-NEXT: vpor %ymm3, %ymm2, %ymm3
; AVX2-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm4		; AVX2-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm4
Show All 9 Lines
; AVX2-NEXT: vpsllq $32, %ymm2, %ymm2		; AVX2-NEXT: vpsllq $32, %ymm2, %ymm2
; AVX2-NEXT: vpmuludq %ymm3, %ymm1, %ymm1		; AVX2-NEXT: vpmuludq %ymm3, %ymm1, %ymm1
; AVX2-NEXT: vpaddq %ymm0, %ymm2, %ymm0		; AVX2-NEXT: vpaddq %ymm0, %ymm2, %ymm0
; AVX2-NEXT: vpaddq %ymm0, %ymm1, %ymm0		; AVX2-NEXT: vpaddq %ymm0, %ymm1, %ymm0
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; XOP-FALLBACK-LABEL: vec256_i64_signed_reg_reg:		; XOP-FALLBACK-LABEL: vec256_i64_signed_reg_reg:
; XOP-FALLBACK: # %bb.0:		; XOP-FALLBACK: # %bb.0:
; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm1, %xmm3		; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm1, %xmm2
; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm0, %xmm2		; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm0, %xmm3
; XOP-FALLBACK-NEXT: vpcomgtq %xmm3, %xmm2, %xmm4		; XOP-FALLBACK-NEXT: vpcomgtq %xmm2, %xmm3, %xmm4
; XOP-FALLBACK-NEXT: vpcomgtq %xmm1, %xmm0, %xmm5		; XOP-FALLBACK-NEXT: vpcomgtq %xmm1, %xmm0, %xmm5
; XOP-FALLBACK-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm6		; XOP-FALLBACK-NEXT: vpcomltq %xmm2, %xmm3, %xmm6
; XOP-FALLBACK-NEXT: vpcomltq %xmm3, %xmm2, %xmm3
; XOP-FALLBACK-NEXT: vpcomltq %xmm1, %xmm0, %xmm7		; XOP-FALLBACK-NEXT: vpcomltq %xmm1, %xmm0, %xmm7
; XOP-FALLBACK-NEXT: vinsertf128 $1, %xmm3, %ymm7, %ymm3		; XOP-FALLBACK-NEXT: vblendvpd %xmm7, %xmm0, %xmm1, %xmm7
; XOP-FALLBACK-NEXT: vblendvpd %ymm3, %ymm0, %ymm1, %ymm3		; XOP-FALLBACK-NEXT: vblendvpd %xmm5, %xmm0, %xmm1, %xmm1
; XOP-FALLBACK-NEXT: vblendvpd %ymm6, %ymm0, %ymm1, %ymm1		; XOP-FALLBACK-NEXT: vpsubq %xmm7, %xmm1, %xmm1
; XOP-FALLBACK-NEXT: vpsubq %xmm3, %xmm1, %xmm6		; XOP-FALLBACK-NEXT: vblendvpd %xmm6, %xmm3, %xmm2, %xmm6
; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm3, %xmm3		; XOP-FALLBACK-NEXT: vblendvpd %xmm4, %xmm3, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm1, %xmm1		; XOP-FALLBACK-NEXT: vpsubq %xmm6, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vpsubq %xmm3, %xmm1, %xmm1		; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm1		; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm1
; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm6, %xmm3
; XOP-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]		; XOP-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]
; XOP-FALLBACK-NEXT: vpor %xmm8, %xmm5, %xmm5		; XOP-FALLBACK-NEXT: vpor %xmm8, %xmm5, %xmm5
; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm7		; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm7
; XOP-FALLBACK-NEXT: vpmuludq %xmm7, %xmm3, %xmm7		; XOP-FALLBACK-NEXT: vpmuludq %xmm7, %xmm1, %xmm7
; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm6		; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm1, %xmm6
; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm6, %xmm6		; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm6, %xmm6
; XOP-FALLBACK-NEXT: vpaddq %xmm6, %xmm7, %xmm6		; XOP-FALLBACK-NEXT: vpaddq %xmm6, %xmm7, %xmm6
; XOP-FALLBACK-NEXT: vpsllq $32, %xmm6, %xmm6		; XOP-FALLBACK-NEXT: vpsllq $32, %xmm6, %xmm6
; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm3, %xmm3		; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm1, %xmm1
; XOP-FALLBACK-NEXT: vpor %xmm8, %xmm4, %xmm4		; XOP-FALLBACK-NEXT: vpor %xmm8, %xmm4, %xmm4
; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm4, %xmm5		; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm4, %xmm5
; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm1, %xmm5		; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm2, %xmm5
; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm1, %xmm7		; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm2, %xmm7
; XOP-FALLBACK-NEXT: vpmuludq %xmm4, %xmm7, %xmm7		; XOP-FALLBACK-NEXT: vpmuludq %xmm4, %xmm7, %xmm7
; XOP-FALLBACK-NEXT: vpaddq %xmm7, %xmm5, %xmm5		; XOP-FALLBACK-NEXT: vpaddq %xmm7, %xmm5, %xmm5
; XOP-FALLBACK-NEXT: vpsllq $32, %xmm5, %xmm5		; XOP-FALLBACK-NEXT: vpsllq $32, %xmm5, %xmm5
; XOP-FALLBACK-NEXT: vpmuludq %xmm4, %xmm1, %xmm1		; XOP-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vpaddq %xmm2, %xmm5, %xmm2		; XOP-FALLBACK-NEXT: vpaddq %xmm3, %xmm5, %xmm3
; XOP-FALLBACK-NEXT: vpaddq %xmm2, %xmm1, %xmm1		; XOP-FALLBACK-NEXT: vpaddq %xmm3, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm6, %xmm0		; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm6, %xmm0
; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm3, %xmm0		; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0
; XOP-FALLBACK-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0		; XOP-FALLBACK-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; XOP-FALLBACK-NEXT: retq		; XOP-FALLBACK-NEXT: retq
;		;
; XOPAVX1-LABEL: vec256_i64_signed_reg_reg:		; XOPAVX1-LABEL: vec256_i64_signed_reg_reg:
; XOPAVX1: # %bb.0:		; XOPAVX1: # %bb.0:
; XOPAVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; XOPAVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
; XOPAVX1-NEXT: vpcomgtq %xmm3, %xmm2, %xmm4		; XOPAVX1-NEXT: vpcomgtq %xmm2, %xmm3, %xmm4
; XOPAVX1-NEXT: vpcomgtq %xmm1, %xmm0, %xmm5		; XOPAVX1-NEXT: vpcomgtq %xmm1, %xmm0, %xmm5
; XOPAVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm6		; XOPAVX1-NEXT: vpcomltq %xmm2, %xmm3, %xmm6
; XOPAVX1-NEXT: vpcomltq %xmm3, %xmm2, %xmm3
; XOPAVX1-NEXT: vpcomltq %xmm1, %xmm0, %xmm7		; XOPAVX1-NEXT: vpcomltq %xmm1, %xmm0, %xmm7
; XOPAVX1-NEXT: vinsertf128 $1, %xmm3, %ymm7, %ymm3		; XOPAVX1-NEXT: vblendvpd %xmm7, %xmm0, %xmm1, %xmm7
; XOPAVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm1, %ymm3		; XOPAVX1-NEXT: vblendvpd %xmm5, %xmm0, %xmm1, %xmm1
; XOPAVX1-NEXT: vblendvpd %ymm6, %ymm0, %ymm1, %ymm1		; XOPAVX1-NEXT: vpsubq %xmm7, %xmm1, %xmm1
; XOPAVX1-NEXT: vpsubq %xmm3, %xmm1, %xmm6		; XOPAVX1-NEXT: vblendvpd %xmm6, %xmm3, %xmm2, %xmm6
; XOPAVX1-NEXT: vextractf128 $1, %ymm3, %xmm3		; XOPAVX1-NEXT: vblendvpd %xmm4, %xmm3, %xmm2, %xmm2
; XOPAVX1-NEXT: vextractf128 $1, %ymm1, %xmm1		; XOPAVX1-NEXT: vpsubq %xmm6, %xmm2, %xmm2
; XOPAVX1-NEXT: vpsubq %xmm3, %xmm1, %xmm1		; XOPAVX1-NEXT: vpsrlq $1, %xmm2, %xmm2
; XOPAVX1-NEXT: vpsrlq $1, %xmm1, %xmm1		; XOPAVX1-NEXT: vpsrlq $1, %xmm1, %xmm1
; XOPAVX1-NEXT: vpsrlq $1, %xmm6, %xmm3
; XOPAVX1-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]		; XOPAVX1-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]
; XOPAVX1-NEXT: vpor %xmm8, %xmm5, %xmm5		; XOPAVX1-NEXT: vpor %xmm8, %xmm5, %xmm5
; XOPAVX1-NEXT: vpsrlq $32, %xmm5, %xmm7		; XOPAVX1-NEXT: vpsrlq $32, %xmm5, %xmm7
; XOPAVX1-NEXT: vpmuludq %xmm7, %xmm3, %xmm7		; XOPAVX1-NEXT: vpmuludq %xmm7, %xmm1, %xmm7
; XOPAVX1-NEXT: vpsrlq $32, %xmm3, %xmm6		; XOPAVX1-NEXT: vpsrlq $32, %xmm1, %xmm6
; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm6, %xmm6		; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm6, %xmm6
; XOPAVX1-NEXT: vpaddq %xmm6, %xmm7, %xmm6		; XOPAVX1-NEXT: vpaddq %xmm6, %xmm7, %xmm6
; XOPAVX1-NEXT: vpsllq $32, %xmm6, %xmm6		; XOPAVX1-NEXT: vpsllq $32, %xmm6, %xmm6
; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm3, %xmm3		; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm1, %xmm1
; XOPAVX1-NEXT: vpor %xmm8, %xmm4, %xmm4		; XOPAVX1-NEXT: vpor %xmm8, %xmm4, %xmm4
; XOPAVX1-NEXT: vpsrlq $32, %xmm4, %xmm5		; XOPAVX1-NEXT: vpsrlq $32, %xmm4, %xmm5
; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm1, %xmm5		; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm2, %xmm5
; XOPAVX1-NEXT: vpsrlq $32, %xmm1, %xmm7		; XOPAVX1-NEXT: vpsrlq $32, %xmm2, %xmm7
; XOPAVX1-NEXT: vpmuludq %xmm4, %xmm7, %xmm7		; XOPAVX1-NEXT: vpmuludq %xmm4, %xmm7, %xmm7
; XOPAVX1-NEXT: vpaddq %xmm7, %xmm5, %xmm5		; XOPAVX1-NEXT: vpaddq %xmm7, %xmm5, %xmm5
; XOPAVX1-NEXT: vpsllq $32, %xmm5, %xmm5		; XOPAVX1-NEXT: vpsllq $32, %xmm5, %xmm5
; XOPAVX1-NEXT: vpmuludq %xmm4, %xmm1, %xmm1		; XOPAVX1-NEXT: vpmuludq %xmm4, %xmm2, %xmm2
; XOPAVX1-NEXT: vpaddq %xmm2, %xmm5, %xmm2		; XOPAVX1-NEXT: vpaddq %xmm3, %xmm5, %xmm3
; XOPAVX1-NEXT: vpaddq %xmm2, %xmm1, %xmm1		; XOPAVX1-NEXT: vpaddq %xmm3, %xmm2, %xmm2
; XOPAVX1-NEXT: vpaddq %xmm0, %xmm6, %xmm0		; XOPAVX1-NEXT: vpaddq %xmm0, %xmm6, %xmm0
; XOPAVX1-NEXT: vpaddq %xmm0, %xmm3, %xmm0		; XOPAVX1-NEXT: vpaddq %xmm0, %xmm1, %xmm0
; XOPAVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0		; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; XOPAVX1-NEXT: retq		; XOPAVX1-NEXT: retq
;		;
; AVX512F-LABEL: vec256_i64_signed_reg_reg:		; AVX512F-LABEL: vec256_i64_signed_reg_reg:
; AVX512F: # %bb.0:		; AVX512F: # %bb.0:
; AVX512F-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1		; AVX512F-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1
; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0		; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0
; AVX512F-NEXT: vpcmpgtq %zmm1, %zmm0, %k1		; AVX512F-NEXT: vpcmpgtq %zmm1, %zmm0, %k1
; AVX512F-NEXT: vpcmpeqd %ymm2, %ymm2, %ymm2		; AVX512F-NEXT: vpcmpeqd %ymm2, %ymm2, %ymm2
▲ Show 20 Lines • Show All 66 Lines • ▼ Show 20 Lines	; AVX512BW-FALLBACK-NEXT: retq
%t9 = mul nsw <4 x i64> %t8, %t4 ; signed		%t9 = mul nsw <4 x i64> %t8, %t4 ; signed
%a10 = add nsw <4 x i64> %t9, %a1 ; signed		%a10 = add nsw <4 x i64> %t9, %a1 ; signed
ret <4 x i64> %a10		ret <4 x i64> %a10
}		}

define <4 x i64> @vec256_i64_unsigned_reg_reg(<4 x i64> %a1, <4 x i64> %a2) nounwind {		define <4 x i64> @vec256_i64_unsigned_reg_reg(<4 x i64> %a1, <4 x i64> %a2) nounwind {
; AVX1-FALLBACK-LABEL: vec256_i64_unsigned_reg_reg:		; AVX1-FALLBACK-LABEL: vec256_i64_unsigned_reg_reg:
; AVX1-FALLBACK: # %bb.0:		; AVX1-FALLBACK: # %bb.0:
; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm1, %xmm3
; AVX1-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]		; AVX1-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]
; AVX1-FALLBACK-NEXT: vpxor %xmm3, %xmm2, %xmm4		; AVX1-FALLBACK-NEXT: vpxor %xmm4, %xmm3, %xmm5
; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-FALLBACK-NEXT: vpxor %xmm3, %xmm2, %xmm5		; AVX1-FALLBACK-NEXT: vpxor %xmm4, %xmm2, %xmm6
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm6		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm8
; AVX1-FALLBACK-NEXT: vpxor %xmm3, %xmm1, %xmm7		; AVX1-FALLBACK-NEXT: vpxor %xmm4, %xmm1, %xmm7
; AVX1-FALLBACK-NEXT: vpxor %xmm3, %xmm0, %xmm3		; AVX1-FALLBACK-NEXT: vpxor %xmm4, %xmm0, %xmm4
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm7, %xmm3, %xmm8		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm7, %xmm4, %xmm9
; AVX1-FALLBACK-NEXT: vinsertf128 $1, %xmm6, %ymm8, %ymm9		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm5
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm5, %xmm4, %xmm4		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm4, %xmm7, %xmm4
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm3, %xmm7, %xmm3		; AVX1-FALLBACK-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4
; AVX1-FALLBACK-NEXT: vinsertf128 $1, %xmm4, %ymm3, %ymm3		; AVX1-FALLBACK-NEXT: vblendvpd %xmm9, %xmm0, %xmm1, %xmm1
; AVX1-FALLBACK-NEXT: vblendvpd %ymm3, %ymm0, %ymm1, %ymm3		; AVX1-FALLBACK-NEXT: vpsubq %xmm4, %xmm1, %xmm1
; AVX1-FALLBACK-NEXT: vblendvpd %ymm9, %ymm0, %ymm1, %ymm1		; AVX1-FALLBACK-NEXT: vblendvpd %xmm5, %xmm2, %xmm3, %xmm4
; AVX1-FALLBACK-NEXT: vpsubq %xmm3, %xmm1, %xmm4		; AVX1-FALLBACK-NEXT: vblendvpd %xmm8, %xmm2, %xmm3, %xmm3
; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm3, %xmm3		; AVX1-FALLBACK-NEXT: vpsubq %xmm4, %xmm3, %xmm3
; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm1, %xmm1		; AVX1-FALLBACK-NEXT: vpsrlq $1, %xmm3, %xmm3
; AVX1-FALLBACK-NEXT: vpsubq %xmm3, %xmm1, %xmm1
; AVX1-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm1		; AVX1-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm1
; AVX1-FALLBACK-NEXT: vpsrlq $1, %xmm4, %xmm3		; AVX1-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm4 = [1,1]
; AVX1-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm9 = [1,1]		; AVX1-FALLBACK-NEXT: vpor %xmm4, %xmm9, %xmm5
; AVX1-FALLBACK-NEXT: vpor %xmm9, %xmm8, %xmm5
; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm7
; AVX1-FALLBACK-NEXT: vpmuludq %xmm7, %xmm3, %xmm7
; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm4
; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm4, %xmm4
; AVX1-FALLBACK-NEXT: vpaddq %xmm4, %xmm7, %xmm4
; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm4, %xmm4
; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm3, %xmm3
; AVX1-FALLBACK-NEXT: vpor %xmm9, %xmm6, %xmm5
; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm6		; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm6
; AVX1-FALLBACK-NEXT: vpmuludq %xmm6, %xmm1, %xmm6		; AVX1-FALLBACK-NEXT: vpmuludq %xmm6, %xmm1, %xmm6
; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm1, %xmm7		; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm1, %xmm7
; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm7, %xmm7		; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm7, %xmm7
; AVX1-FALLBACK-NEXT: vpaddq %xmm7, %xmm6, %xmm6		; AVX1-FALLBACK-NEXT: vpaddq %xmm7, %xmm6, %xmm6
; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm6, %xmm6		; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm6, %xmm6
; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm1, %xmm1		; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm1, %xmm1
; AVX1-FALLBACK-NEXT: vpaddq %xmm2, %xmm6, %xmm2		; AVX1-FALLBACK-NEXT: vpor %xmm4, %xmm8, %xmm4
; AVX1-FALLBACK-NEXT: vpaddq %xmm2, %xmm1, %xmm1		; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm4, %xmm5
; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm4, %xmm0		; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm3, %xmm5
; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm3, %xmm0		; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm7
; AVX1-FALLBACK-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0		; AVX1-FALLBACK-NEXT: vpmuludq %xmm4, %xmm7, %xmm7
		; AVX1-FALLBACK-NEXT: vpaddq %xmm7, %xmm5, %xmm5
		; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm5, %xmm5
		; AVX1-FALLBACK-NEXT: vpmuludq %xmm4, %xmm3, %xmm3
		; AVX1-FALLBACK-NEXT: vpaddq %xmm2, %xmm5, %xmm2
		; AVX1-FALLBACK-NEXT: vpaddq %xmm2, %xmm3, %xmm2
		; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm6, %xmm0
		; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0
		; AVX1-FALLBACK-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX1-FALLBACK-NEXT: retq		; AVX1-FALLBACK-NEXT: retq
;		;
; AVX2-LABEL: vec256_i64_unsigned_reg_reg:		; AVX2-LABEL: vec256_i64_unsigned_reg_reg:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]		; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
; AVX2-NEXT: vpxor %ymm2, %ymm1, %ymm3		; AVX2-NEXT: vpxor %ymm2, %ymm1, %ymm3
; AVX2-NEXT: vpxor %ymm2, %ymm0, %ymm2		; AVX2-NEXT: vpxor %ymm2, %ymm0, %ymm2
; AVX2-NEXT: vpcmpgtq %ymm3, %ymm2, %ymm4		; AVX2-NEXT: vpcmpgtq %ymm3, %ymm2, %ymm4
Show All 12 Lines
; AVX2-NEXT: vpsllq $32, %ymm2, %ymm2		; AVX2-NEXT: vpsllq $32, %ymm2, %ymm2
; AVX2-NEXT: vpmuludq %ymm5, %ymm1, %ymm1		; AVX2-NEXT: vpmuludq %ymm5, %ymm1, %ymm1
; AVX2-NEXT: vpaddq %ymm0, %ymm2, %ymm0		; AVX2-NEXT: vpaddq %ymm0, %ymm2, %ymm0
; AVX2-NEXT: vpaddq %ymm0, %ymm1, %ymm0		; AVX2-NEXT: vpaddq %ymm0, %ymm1, %ymm0
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; XOP-FALLBACK-LABEL: vec256_i64_unsigned_reg_reg:		; XOP-FALLBACK-LABEL: vec256_i64_unsigned_reg_reg:
; XOP-FALLBACK: # %bb.0:		; XOP-FALLBACK: # %bb.0:
; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm1, %xmm3		; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm1, %xmm2
; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm0, %xmm2		; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm0, %xmm3
; XOP-FALLBACK-NEXT: vpcomgtuq %xmm3, %xmm2, %xmm4		; XOP-FALLBACK-NEXT: vpcomgtuq %xmm2, %xmm3, %xmm4
; XOP-FALLBACK-NEXT: vpcomgtuq %xmm1, %xmm0, %xmm5		; XOP-FALLBACK-NEXT: vpcomgtuq %xmm1, %xmm0, %xmm5
; XOP-FALLBACK-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm6		; XOP-FALLBACK-NEXT: vpcomltuq %xmm2, %xmm3, %xmm6
; XOP-FALLBACK-NEXT: vpcomltuq %xmm3, %xmm2, %xmm3
; XOP-FALLBACK-NEXT: vpcomltuq %xmm1, %xmm0, %xmm7		; XOP-FALLBACK-NEXT: vpcomltuq %xmm1, %xmm0, %xmm7
; XOP-FALLBACK-NEXT: vinsertf128 $1, %xmm3, %ymm7, %ymm3		; XOP-FALLBACK-NEXT: vblendvpd %xmm7, %xmm0, %xmm1, %xmm7
; XOP-FALLBACK-NEXT: vblendvpd %ymm3, %ymm0, %ymm1, %ymm3		; XOP-FALLBACK-NEXT: vblendvpd %xmm5, %xmm0, %xmm1, %xmm1
; XOP-FALLBACK-NEXT: vblendvpd %ymm6, %ymm0, %ymm1, %ymm1		; XOP-FALLBACK-NEXT: vpsubq %xmm7, %xmm1, %xmm1
; XOP-FALLBACK-NEXT: vpsubq %xmm3, %xmm1, %xmm6		; XOP-FALLBACK-NEXT: vblendvpd %xmm6, %xmm3, %xmm2, %xmm6
; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm3, %xmm3		; XOP-FALLBACK-NEXT: vblendvpd %xmm4, %xmm3, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm1, %xmm1		; XOP-FALLBACK-NEXT: vpsubq %xmm6, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vpsubq %xmm3, %xmm1, %xmm1		; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm1		; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm1
; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm6, %xmm3
; XOP-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]		; XOP-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]
; XOP-FALLBACK-NEXT: vpor %xmm8, %xmm5, %xmm5		; XOP-FALLBACK-NEXT: vpor %xmm8, %xmm5, %xmm5
; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm7		; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm7
; XOP-FALLBACK-NEXT: vpmuludq %xmm7, %xmm3, %xmm7		; XOP-FALLBACK-NEXT: vpmuludq %xmm7, %xmm1, %xmm7
; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm6		; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm1, %xmm6
; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm6, %xmm6		; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm6, %xmm6
; XOP-FALLBACK-NEXT: vpaddq %xmm6, %xmm7, %xmm6		; XOP-FALLBACK-NEXT: vpaddq %xmm6, %xmm7, %xmm6
; XOP-FALLBACK-NEXT: vpsllq $32, %xmm6, %xmm6		; XOP-FALLBACK-NEXT: vpsllq $32, %xmm6, %xmm6
; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm3, %xmm3		; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm1, %xmm1
; XOP-FALLBACK-NEXT: vpor %xmm8, %xmm4, %xmm4		; XOP-FALLBACK-NEXT: vpor %xmm8, %xmm4, %xmm4
; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm4, %xmm5		; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm4, %xmm5
; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm1, %xmm5		; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm2, %xmm5
; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm1, %xmm7		; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm2, %xmm7
; XOP-FALLBACK-NEXT: vpmuludq %xmm4, %xmm7, %xmm7		; XOP-FALLBACK-NEXT: vpmuludq %xmm4, %xmm7, %xmm7
; XOP-FALLBACK-NEXT: vpaddq %xmm7, %xmm5, %xmm5		; XOP-FALLBACK-NEXT: vpaddq %xmm7, %xmm5, %xmm5
; XOP-FALLBACK-NEXT: vpsllq $32, %xmm5, %xmm5		; XOP-FALLBACK-NEXT: vpsllq $32, %xmm5, %xmm5
; XOP-FALLBACK-NEXT: vpmuludq %xmm4, %xmm1, %xmm1		; XOP-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vpaddq %xmm2, %xmm5, %xmm2		; XOP-FALLBACK-NEXT: vpaddq %xmm3, %xmm5, %xmm3
; XOP-FALLBACK-NEXT: vpaddq %xmm2, %xmm1, %xmm1		; XOP-FALLBACK-NEXT: vpaddq %xmm3, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm6, %xmm0		; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm6, %xmm0
; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm3, %xmm0		; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0
; XOP-FALLBACK-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0		; XOP-FALLBACK-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; XOP-FALLBACK-NEXT: retq		; XOP-FALLBACK-NEXT: retq
;		;
; XOPAVX1-LABEL: vec256_i64_unsigned_reg_reg:		; XOPAVX1-LABEL: vec256_i64_unsigned_reg_reg:
; XOPAVX1: # %bb.0:		; XOPAVX1: # %bb.0:
; XOPAVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; XOPAVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
; XOPAVX1-NEXT: vpcomgtuq %xmm3, %xmm2, %xmm4		; XOPAVX1-NEXT: vpcomgtuq %xmm2, %xmm3, %xmm4
; XOPAVX1-NEXT: vpcomgtuq %xmm1, %xmm0, %xmm5		; XOPAVX1-NEXT: vpcomgtuq %xmm1, %xmm0, %xmm5
; XOPAVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm6		; XOPAVX1-NEXT: vpcomltuq %xmm2, %xmm3, %xmm6
; XOPAVX1-NEXT: vpcomltuq %xmm3, %xmm2, %xmm3
; XOPAVX1-NEXT: vpcomltuq %xmm1, %xmm0, %xmm7		; XOPAVX1-NEXT: vpcomltuq %xmm1, %xmm0, %xmm7
; XOPAVX1-NEXT: vinsertf128 $1, %xmm3, %ymm7, %ymm3		; XOPAVX1-NEXT: vblendvpd %xmm7, %xmm0, %xmm1, %xmm7
; XOPAVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm1, %ymm3		; XOPAVX1-NEXT: vblendvpd %xmm5, %xmm0, %xmm1, %xmm1
; XOPAVX1-NEXT: vblendvpd %ymm6, %ymm0, %ymm1, %ymm1		; XOPAVX1-NEXT: vpsubq %xmm7, %xmm1, %xmm1
; XOPAVX1-NEXT: vpsubq %xmm3, %xmm1, %xmm6		; XOPAVX1-NEXT: vblendvpd %xmm6, %xmm3, %xmm2, %xmm6
; XOPAVX1-NEXT: vextractf128 $1, %ymm3, %xmm3		; XOPAVX1-NEXT: vblendvpd %xmm4, %xmm3, %xmm2, %xmm2
; XOPAVX1-NEXT: vextractf128 $1, %ymm1, %xmm1		; XOPAVX1-NEXT: vpsubq %xmm6, %xmm2, %xmm2
; XOPAVX1-NEXT: vpsubq %xmm3, %xmm1, %xmm1		; XOPAVX1-NEXT: vpsrlq $1, %xmm2, %xmm2
; XOPAVX1-NEXT: vpsrlq $1, %xmm1, %xmm1		; XOPAVX1-NEXT: vpsrlq $1, %xmm1, %xmm1
; XOPAVX1-NEXT: vpsrlq $1, %xmm6, %xmm3
; XOPAVX1-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]		; XOPAVX1-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]
; XOPAVX1-NEXT: vpor %xmm8, %xmm5, %xmm5		; XOPAVX1-NEXT: vpor %xmm8, %xmm5, %xmm5
; XOPAVX1-NEXT: vpsrlq $32, %xmm5, %xmm7		; XOPAVX1-NEXT: vpsrlq $32, %xmm5, %xmm7
; XOPAVX1-NEXT: vpmuludq %xmm7, %xmm3, %xmm7		; XOPAVX1-NEXT: vpmuludq %xmm7, %xmm1, %xmm7
; XOPAVX1-NEXT: vpsrlq $32, %xmm3, %xmm6		; XOPAVX1-NEXT: vpsrlq $32, %xmm1, %xmm6
; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm6, %xmm6		; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm6, %xmm6
; XOPAVX1-NEXT: vpaddq %xmm6, %xmm7, %xmm6		; XOPAVX1-NEXT: vpaddq %xmm6, %xmm7, %xmm6
; XOPAVX1-NEXT: vpsllq $32, %xmm6, %xmm6		; XOPAVX1-NEXT: vpsllq $32, %xmm6, %xmm6
; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm3, %xmm3		; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm1, %xmm1
; XOPAVX1-NEXT: vpor %xmm8, %xmm4, %xmm4		; XOPAVX1-NEXT: vpor %xmm8, %xmm4, %xmm4
; XOPAVX1-NEXT: vpsrlq $32, %xmm4, %xmm5		; XOPAVX1-NEXT: vpsrlq $32, %xmm4, %xmm5
; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm1, %xmm5		; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm2, %xmm5
; XOPAVX1-NEXT: vpsrlq $32, %xmm1, %xmm7		; XOPAVX1-NEXT: vpsrlq $32, %xmm2, %xmm7
; XOPAVX1-NEXT: vpmuludq %xmm4, %xmm7, %xmm7		; XOPAVX1-NEXT: vpmuludq %xmm4, %xmm7, %xmm7
; XOPAVX1-NEXT: vpaddq %xmm7, %xmm5, %xmm5		; XOPAVX1-NEXT: vpaddq %xmm7, %xmm5, %xmm5
; XOPAVX1-NEXT: vpsllq $32, %xmm5, %xmm5		; XOPAVX1-NEXT: vpsllq $32, %xmm5, %xmm5
; XOPAVX1-NEXT: vpmuludq %xmm4, %xmm1, %xmm1		; XOPAVX1-NEXT: vpmuludq %xmm4, %xmm2, %xmm2
; XOPAVX1-NEXT: vpaddq %xmm2, %xmm5, %xmm2		; XOPAVX1-NEXT: vpaddq %xmm3, %xmm5, %xmm3
; XOPAVX1-NEXT: vpaddq %xmm2, %xmm1, %xmm1		; XOPAVX1-NEXT: vpaddq %xmm3, %xmm2, %xmm2
; XOPAVX1-NEXT: vpaddq %xmm0, %xmm6, %xmm0		; XOPAVX1-NEXT: vpaddq %xmm0, %xmm6, %xmm0
; XOPAVX1-NEXT: vpaddq %xmm0, %xmm3, %xmm0		; XOPAVX1-NEXT: vpaddq %xmm0, %xmm1, %xmm0
; XOPAVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0		; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; XOPAVX1-NEXT: retq		; XOPAVX1-NEXT: retq
;		;
; AVX512F-LABEL: vec256_i64_unsigned_reg_reg:		; AVX512F-LABEL: vec256_i64_unsigned_reg_reg:
; AVX512F: # %bb.0:		; AVX512F: # %bb.0:
; AVX512F-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1		; AVX512F-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1
; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0		; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0
; AVX512F-NEXT: vpcmpnleuq %zmm1, %zmm0, %k1		; AVX512F-NEXT: vpcmpnleuq %zmm1, %zmm0, %k1
; AVX512F-NEXT: vpcmpeqd %ymm2, %ymm2, %ymm2		; AVX512F-NEXT: vpcmpeqd %ymm2, %ymm2, %ymm2
▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines	; AVX512BW-FALLBACK-NEXT: retq
ret <4 x i64> %a10		ret <4 x i64> %a10
}		}

; Values are loaded. Only check signed case.		; Values are loaded. Only check signed case.

define <4 x i64> @vec256_i64_signed_mem_reg(<4 x i64>* %a1_addr, <4 x i64> %a2) nounwind {		define <4 x i64> @vec256_i64_signed_mem_reg(<4 x i64>* %a1_addr, <4 x i64> %a2) nounwind {
; AVX1-FALLBACK-LABEL: vec256_i64_signed_mem_reg:		; AVX1-FALLBACK-LABEL: vec256_i64_signed_mem_reg:
; AVX1-FALLBACK: # %bb.0:		; AVX1-FALLBACK: # %bb.0:
; AVX1-FALLBACK-NEXT: vmovapd (%rdi), %ymm3		; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm0, %xmm4
; AVX1-FALLBACK-NEXT: vmovdqa (%rdi), %xmm1		; AVX1-FALLBACK-NEXT: vmovdqa (%rdi), %xmm1
; AVX1-FALLBACK-NEXT: vmovdqa 16(%rdi), %xmm2		; AVX1-FALLBACK-NEXT: vmovdqa 16(%rdi), %xmm3
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm4, %xmm2, %xmm5		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm4
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm6		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm5
; AVX1-FALLBACK-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm7		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm6
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm4		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm7
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm8		; AVX1-FALLBACK-NEXT: vblendvpd %xmm7, %xmm1, %xmm0, %xmm7
; AVX1-FALLBACK-NEXT: vinsertf128 $1, %xmm4, %ymm8, %ymm4		; AVX1-FALLBACK-NEXT: vblendvpd %xmm5, %xmm1, %xmm0, %xmm0
; AVX1-FALLBACK-NEXT: vblendvpd %ymm4, %ymm3, %ymm0, %ymm4		; AVX1-FALLBACK-NEXT: vpsubq %xmm7, %xmm0, %xmm0
; AVX1-FALLBACK-NEXT: vblendvpd %ymm7, %ymm3, %ymm0, %ymm0		; AVX1-FALLBACK-NEXT: vblendvpd %xmm6, %xmm3, %xmm2, %xmm6
; AVX1-FALLBACK-NEXT: vpsubq %xmm4, %xmm0, %xmm3		; AVX1-FALLBACK-NEXT: vblendvpd %xmm4, %xmm3, %xmm2, %xmm2
; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm4, %xmm4		; AVX1-FALLBACK-NEXT: vpsubq %xmm6, %xmm2, %xmm2
; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm0, %xmm0		; AVX1-FALLBACK-NEXT: vpsrlq $1, %xmm2, %xmm2
; AVX1-FALLBACK-NEXT: vpsubq %xmm4, %xmm0, %xmm0
; AVX1-FALLBACK-NEXT: vpsrlq $1, %xmm0, %xmm0		; AVX1-FALLBACK-NEXT: vpsrlq $1, %xmm0, %xmm0
; AVX1-FALLBACK-NEXT: vpsrlq $1, %xmm3, %xmm3
; AVX1-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]		; AVX1-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]
; AVX1-FALLBACK-NEXT: vpor %xmm8, %xmm6, %xmm6
; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm6, %xmm7
; AVX1-FALLBACK-NEXT: vpmuludq %xmm7, %xmm3, %xmm7
; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm4
; AVX1-FALLBACK-NEXT: vpmuludq %xmm6, %xmm4, %xmm4
; AVX1-FALLBACK-NEXT: vpaddq %xmm4, %xmm7, %xmm4
; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm4, %xmm4
; AVX1-FALLBACK-NEXT: vpmuludq %xmm6, %xmm3, %xmm3
; AVX1-FALLBACK-NEXT: vpor %xmm8, %xmm5, %xmm5		; AVX1-FALLBACK-NEXT: vpor %xmm8, %xmm5, %xmm5
; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm6		; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm7
; AVX1-FALLBACK-NEXT: vpmuludq %xmm6, %xmm0, %xmm6		; AVX1-FALLBACK-NEXT: vpmuludq %xmm7, %xmm0, %xmm7
; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm0, %xmm7		; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm0, %xmm6
; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm7, %xmm7		; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm6, %xmm6
; AVX1-FALLBACK-NEXT: vpaddq %xmm7, %xmm6, %xmm6		; AVX1-FALLBACK-NEXT: vpaddq %xmm6, %xmm7, %xmm6
; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm6, %xmm6		; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm6, %xmm6
; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm0, %xmm0		; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm0, %xmm0
; AVX1-FALLBACK-NEXT: vpaddq %xmm2, %xmm6, %xmm2		; AVX1-FALLBACK-NEXT: vpor %xmm8, %xmm4, %xmm4
; AVX1-FALLBACK-NEXT: vpaddq %xmm2, %xmm0, %xmm0		; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm4, %xmm5
; AVX1-FALLBACK-NEXT: vpaddq %xmm1, %xmm4, %xmm1		; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm2, %xmm5
; AVX1-FALLBACK-NEXT: vpaddq %xmm1, %xmm3, %xmm1		; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm2, %xmm7
; AVX1-FALLBACK-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0		; AVX1-FALLBACK-NEXT: vpmuludq %xmm4, %xmm7, %xmm7
		; AVX1-FALLBACK-NEXT: vpaddq %xmm7, %xmm5, %xmm5
		; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm5, %xmm5
		; AVX1-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm2
		; AVX1-FALLBACK-NEXT: vpaddq %xmm3, %xmm5, %xmm3
		; AVX1-FALLBACK-NEXT: vpaddq %xmm3, %xmm2, %xmm2
		; AVX1-FALLBACK-NEXT: vpaddq %xmm1, %xmm6, %xmm1
		; AVX1-FALLBACK-NEXT: vpaddq %xmm1, %xmm0, %xmm0
		; AVX1-FALLBACK-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX1-FALLBACK-NEXT: retq		; AVX1-FALLBACK-NEXT: retq
;		;
; AVX2-LABEL: vec256_i64_signed_mem_reg:		; AVX2-LABEL: vec256_i64_signed_mem_reg:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vmovdqa (%rdi), %ymm1		; AVX2-NEXT: vmovdqa (%rdi), %ymm1
; AVX2-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2		; AVX2-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2
; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm3 = [1,1,1,1]		; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm3 = [1,1,1,1]
; AVX2-NEXT: vpor %ymm3, %ymm2, %ymm3		; AVX2-NEXT: vpor %ymm3, %ymm2, %ymm3
Show All 10 Lines
; AVX2-NEXT: vpsllq $32, %ymm2, %ymm2		; AVX2-NEXT: vpsllq $32, %ymm2, %ymm2
; AVX2-NEXT: vpmuludq %ymm3, %ymm0, %ymm0		; AVX2-NEXT: vpmuludq %ymm3, %ymm0, %ymm0
; AVX2-NEXT: vpaddq %ymm1, %ymm2, %ymm1		; AVX2-NEXT: vpaddq %ymm1, %ymm2, %ymm1
; AVX2-NEXT: vpaddq %ymm1, %ymm0, %ymm0		; AVX2-NEXT: vpaddq %ymm1, %ymm0, %ymm0
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; XOP-FALLBACK-LABEL: vec256_i64_signed_mem_reg:		; XOP-FALLBACK-LABEL: vec256_i64_signed_mem_reg:
; XOP-FALLBACK: # %bb.0:		; XOP-FALLBACK: # %bb.0:
; XOP-FALLBACK-NEXT: vmovapd (%rdi), %ymm3		; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm0, %xmm2
; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm0, %xmm4
; XOP-FALLBACK-NEXT: vmovdqa (%rdi), %xmm1		; XOP-FALLBACK-NEXT: vmovdqa (%rdi), %xmm1
; XOP-FALLBACK-NEXT: vmovdqa 16(%rdi), %xmm2		; XOP-FALLBACK-NEXT: vmovdqa 16(%rdi), %xmm3
; XOP-FALLBACK-NEXT: vpcomgtq %xmm4, %xmm2, %xmm5		; XOP-FALLBACK-NEXT: vpcomgtq %xmm2, %xmm3, %xmm4
; XOP-FALLBACK-NEXT: vpcomgtq %xmm0, %xmm1, %xmm6		; XOP-FALLBACK-NEXT: vpcomgtq %xmm0, %xmm1, %xmm5
; XOP-FALLBACK-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm7		; XOP-FALLBACK-NEXT: vpcomltq %xmm2, %xmm3, %xmm6
; XOP-FALLBACK-NEXT: vpcomltq %xmm4, %xmm2, %xmm4		; XOP-FALLBACK-NEXT: vpcomltq %xmm0, %xmm1, %xmm7
; XOP-FALLBACK-NEXT: vpcomltq %xmm0, %xmm1, %xmm8		; XOP-FALLBACK-NEXT: vblendvpd %xmm7, %xmm1, %xmm0, %xmm7
; XOP-FALLBACK-NEXT: vinsertf128 $1, %xmm4, %ymm8, %ymm4		; XOP-FALLBACK-NEXT: vblendvpd %xmm5, %xmm1, %xmm0, %xmm0
; XOP-FALLBACK-NEXT: vblendvpd %ymm4, %ymm3, %ymm0, %ymm4		; XOP-FALLBACK-NEXT: vpsubq %xmm7, %xmm0, %xmm0
; XOP-FALLBACK-NEXT: vblendvpd %ymm7, %ymm3, %ymm0, %ymm0		; XOP-FALLBACK-NEXT: vblendvpd %xmm6, %xmm3, %xmm2, %xmm6
; XOP-FALLBACK-NEXT: vpsubq %xmm4, %xmm0, %xmm3		; XOP-FALLBACK-NEXT: vblendvpd %xmm4, %xmm3, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm4, %xmm4		; XOP-FALLBACK-NEXT: vpsubq %xmm6, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm0, %xmm0		; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vpsubq %xmm4, %xmm0, %xmm0
; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm0, %xmm0		; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm0, %xmm0
; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm3, %xmm3
; XOP-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]		; XOP-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]
; XOP-FALLBACK-NEXT: vpor %xmm8, %xmm6, %xmm6
; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm6, %xmm7
; XOP-FALLBACK-NEXT: vpmuludq %xmm7, %xmm3, %xmm7
; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm4
; XOP-FALLBACK-NEXT: vpmuludq %xmm6, %xmm4, %xmm4
; XOP-FALLBACK-NEXT: vpaddq %xmm4, %xmm7, %xmm4
; XOP-FALLBACK-NEXT: vpsllq $32, %xmm4, %xmm4
; XOP-FALLBACK-NEXT: vpmuludq %xmm6, %xmm3, %xmm3
; XOP-FALLBACK-NEXT: vpor %xmm8, %xmm5, %xmm5		; XOP-FALLBACK-NEXT: vpor %xmm8, %xmm5, %xmm5
; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm6		; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm7
; XOP-FALLBACK-NEXT: vpmuludq %xmm6, %xmm0, %xmm6		; XOP-FALLBACK-NEXT: vpmuludq %xmm7, %xmm0, %xmm7
; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm0, %xmm7		; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm0, %xmm6
; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm7, %xmm7		; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm6, %xmm6
; XOP-FALLBACK-NEXT: vpaddq %xmm7, %xmm6, %xmm6		; XOP-FALLBACK-NEXT: vpaddq %xmm6, %xmm7, %xmm6
; XOP-FALLBACK-NEXT: vpsllq $32, %xmm6, %xmm6		; XOP-FALLBACK-NEXT: vpsllq $32, %xmm6, %xmm6
; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm0, %xmm0		; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm0, %xmm0
; XOP-FALLBACK-NEXT: vpaddq %xmm2, %xmm6, %xmm2		; XOP-FALLBACK-NEXT: vpor %xmm8, %xmm4, %xmm4
; XOP-FALLBACK-NEXT: vpaddq %xmm2, %xmm0, %xmm0		; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm4, %xmm5
; XOP-FALLBACK-NEXT: vpaddq %xmm1, %xmm4, %xmm1		; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm2, %xmm5
; XOP-FALLBACK-NEXT: vpaddq %xmm1, %xmm3, %xmm1		; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm2, %xmm7
; XOP-FALLBACK-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0		; XOP-FALLBACK-NEXT: vpmuludq %xmm4, %xmm7, %xmm7
		; XOP-FALLBACK-NEXT: vpaddq %xmm7, %xmm5, %xmm5
		; XOP-FALLBACK-NEXT: vpsllq $32, %xmm5, %xmm5
		; XOP-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm2
		; XOP-FALLBACK-NEXT: vpaddq %xmm3, %xmm5, %xmm3
		; XOP-FALLBACK-NEXT: vpaddq %xmm3, %xmm2, %xmm2
		; XOP-FALLBACK-NEXT: vpaddq %xmm1, %xmm6, %xmm1
		; XOP-FALLBACK-NEXT: vpaddq %xmm1, %xmm0, %xmm0
		; XOP-FALLBACK-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; XOP-FALLBACK-NEXT: retq		; XOP-FALLBACK-NEXT: retq
;		;
; XOPAVX1-LABEL: vec256_i64_signed_mem_reg:		; XOPAVX1-LABEL: vec256_i64_signed_mem_reg:
; XOPAVX1: # %bb.0:		; XOPAVX1: # %bb.0:
; XOPAVX1-NEXT: vmovapd (%rdi), %ymm3		; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
; XOPAVX1-NEXT: vmovdqa (%rdi), %xmm1		; XOPAVX1-NEXT: vmovdqa (%rdi), %xmm1
; XOPAVX1-NEXT: vmovdqa 16(%rdi), %xmm2		; XOPAVX1-NEXT: vmovdqa 16(%rdi), %xmm3
; XOPAVX1-NEXT: vpcomgtq %xmm4, %xmm2, %xmm5		; XOPAVX1-NEXT: vpcomgtq %xmm2, %xmm3, %xmm4
; XOPAVX1-NEXT: vpcomgtq %xmm0, %xmm1, %xmm6		; XOPAVX1-NEXT: vpcomgtq %xmm0, %xmm1, %xmm5
; XOPAVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm7		; XOPAVX1-NEXT: vpcomltq %xmm2, %xmm3, %xmm6
; XOPAVX1-NEXT: vpcomltq %xmm4, %xmm2, %xmm4		; XOPAVX1-NEXT: vpcomltq %xmm0, %xmm1, %xmm7
; XOPAVX1-NEXT: vpcomltq %xmm0, %xmm1, %xmm8		; XOPAVX1-NEXT: vblendvpd %xmm7, %xmm1, %xmm0, %xmm7
; XOPAVX1-NEXT: vinsertf128 $1, %xmm4, %ymm8, %ymm4		; XOPAVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm0, %xmm0
; XOPAVX1-NEXT: vblendvpd %ymm4, %ymm3, %ymm0, %ymm4		; XOPAVX1-NEXT: vpsubq %xmm7, %xmm0, %xmm0
; XOPAVX1-NEXT: vblendvpd %ymm7, %ymm3, %ymm0, %ymm0		; XOPAVX1-NEXT: vblendvpd %xmm6, %xmm3, %xmm2, %xmm6
; XOPAVX1-NEXT: vpsubq %xmm4, %xmm0, %xmm3		; XOPAVX1-NEXT: vblendvpd %xmm4, %xmm3, %xmm2, %xmm2
; XOPAVX1-NEXT: vextractf128 $1, %ymm4, %xmm4		; XOPAVX1-NEXT: vpsubq %xmm6, %xmm2, %xmm2
; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm0		; XOPAVX1-NEXT: vpsrlq $1, %xmm2, %xmm2
; XOPAVX1-NEXT: vpsubq %xmm4, %xmm0, %xmm0
; XOPAVX1-NEXT: vpsrlq $1, %xmm0, %xmm0		; XOPAVX1-NEXT: vpsrlq $1, %xmm0, %xmm0
; XOPAVX1-NEXT: vpsrlq $1, %xmm3, %xmm3
; XOPAVX1-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]		; XOPAVX1-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]
; XOPAVX1-NEXT: vpor %xmm8, %xmm6, %xmm6
; XOPAVX1-NEXT: vpsrlq $32, %xmm6, %xmm7
; XOPAVX1-NEXT: vpmuludq %xmm7, %xmm3, %xmm7
; XOPAVX1-NEXT: vpsrlq $32, %xmm3, %xmm4
; XOPAVX1-NEXT: vpmuludq %xmm6, %xmm4, %xmm4
; XOPAVX1-NEXT: vpaddq %xmm4, %xmm7, %xmm4
; XOPAVX1-NEXT: vpsllq $32, %xmm4, %xmm4
; XOPAVX1-NEXT: vpmuludq %xmm6, %xmm3, %xmm3
; XOPAVX1-NEXT: vpor %xmm8, %xmm5, %xmm5		; XOPAVX1-NEXT: vpor %xmm8, %xmm5, %xmm5
; XOPAVX1-NEXT: vpsrlq $32, %xmm5, %xmm6		; XOPAVX1-NEXT: vpsrlq $32, %xmm5, %xmm7
; XOPAVX1-NEXT: vpmuludq %xmm6, %xmm0, %xmm6		; XOPAVX1-NEXT: vpmuludq %xmm7, %xmm0, %xmm7
; XOPAVX1-NEXT: vpsrlq $32, %xmm0, %xmm7		; XOPAVX1-NEXT: vpsrlq $32, %xmm0, %xmm6
; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm7, %xmm7		; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm6, %xmm6
; XOPAVX1-NEXT: vpaddq %xmm7, %xmm6, %xmm6		; XOPAVX1-NEXT: vpaddq %xmm6, %xmm7, %xmm6
; XOPAVX1-NEXT: vpsllq $32, %xmm6, %xmm6		; XOPAVX1-NEXT: vpsllq $32, %xmm6, %xmm6
; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm0, %xmm0		; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm0, %xmm0
; XOPAVX1-NEXT: vpaddq %xmm2, %xmm6, %xmm2		; XOPAVX1-NEXT: vpor %xmm8, %xmm4, %xmm4
; XOPAVX1-NEXT: vpaddq %xmm2, %xmm0, %xmm0		; XOPAVX1-NEXT: vpsrlq $32, %xmm4, %xmm5
; XOPAVX1-NEXT: vpaddq %xmm1, %xmm4, %xmm1		; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm2, %xmm5
; XOPAVX1-NEXT: vpaddq %xmm1, %xmm3, %xmm1		; XOPAVX1-NEXT: vpsrlq $32, %xmm2, %xmm7
; XOPAVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0		; XOPAVX1-NEXT: vpmuludq %xmm4, %xmm7, %xmm7
		; XOPAVX1-NEXT: vpaddq %xmm7, %xmm5, %xmm5
		; XOPAVX1-NEXT: vpsllq $32, %xmm5, %xmm5
		; XOPAVX1-NEXT: vpmuludq %xmm4, %xmm2, %xmm2
		; XOPAVX1-NEXT: vpaddq %xmm3, %xmm5, %xmm3
		; XOPAVX1-NEXT: vpaddq %xmm3, %xmm2, %xmm2
		; XOPAVX1-NEXT: vpaddq %xmm1, %xmm6, %xmm1
		; XOPAVX1-NEXT: vpaddq %xmm1, %xmm0, %xmm0
		; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; XOPAVX1-NEXT: retq		; XOPAVX1-NEXT: retq
;		;
; AVX512F-LABEL: vec256_i64_signed_mem_reg:		; AVX512F-LABEL: vec256_i64_signed_mem_reg:
; AVX512F: # %bb.0:		; AVX512F: # %bb.0:
; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0		; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0
; AVX512F-NEXT: vmovdqa (%rdi), %ymm1		; AVX512F-NEXT: vmovdqa (%rdi), %ymm1
; AVX512F-NEXT: vpcmpgtq %zmm0, %zmm1, %k1		; AVX512F-NEXT: vpcmpgtq %zmm0, %zmm1, %k1
; AVX512F-NEXT: vpcmpeqd %ymm2, %ymm2, %ymm2		; AVX512F-NEXT: vpcmpeqd %ymm2, %ymm2, %ymm2
▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines	; AVX512BW-FALLBACK-NEXT: retq
%t9 = mul nsw <4 x i64> %t8, %t4 ; signed		%t9 = mul nsw <4 x i64> %t8, %t4 ; signed
%a10 = add nsw <4 x i64> %t9, %a1 ; signed		%a10 = add nsw <4 x i64> %t9, %a1 ; signed
ret <4 x i64> %a10		ret <4 x i64> %a10
}		}

define <4 x i64> @vec256_i64_signed_reg_mem(<4 x i64> %a1, <4 x i64>* %a2_addr) nounwind {		define <4 x i64> @vec256_i64_signed_reg_mem(<4 x i64> %a1, <4 x i64>* %a2_addr) nounwind {
; AVX1-FALLBACK-LABEL: vec256_i64_signed_reg_mem:		; AVX1-FALLBACK-LABEL: vec256_i64_signed_reg_mem:
; AVX1-FALLBACK: # %bb.0:		; AVX1-FALLBACK: # %bb.0:
; AVX1-FALLBACK-NEXT: vmovapd (%rdi), %ymm2		; AVX1-FALLBACK-NEXT: vmovdqa (%rdi), %xmm1
; AVX1-FALLBACK-NEXT: vmovdqa (%rdi), %xmm3		; AVX1-FALLBACK-NEXT: vmovdqa 16(%rdi), %xmm2
; AVX1-FALLBACK-NEXT: vmovdqa 16(%rdi), %xmm4		; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm0, %xmm3
; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm4
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm5		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm5
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm3, %xmm0, %xmm6		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm6
; AVX1-FALLBACK-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm7		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm7
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm4		; AVX1-FALLBACK-NEXT: vblendvpd %xmm7, %xmm0, %xmm1, %xmm7
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm3		; AVX1-FALLBACK-NEXT: vblendvpd %xmm5, %xmm0, %xmm1, %xmm1
; AVX1-FALLBACK-NEXT: vinsertf128 $1, %xmm4, %ymm3, %ymm3		; AVX1-FALLBACK-NEXT: vpsubq %xmm7, %xmm1, %xmm1
; AVX1-FALLBACK-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm3		; AVX1-FALLBACK-NEXT: vblendvpd %xmm6, %xmm3, %xmm2, %xmm6
; AVX1-FALLBACK-NEXT: vblendvpd %ymm7, %ymm0, %ymm2, %ymm2		; AVX1-FALLBACK-NEXT: vblendvpd %xmm4, %xmm3, %xmm2, %xmm2
; AVX1-FALLBACK-NEXT: vpsubq %xmm3, %xmm2, %xmm4		; AVX1-FALLBACK-NEXT: vpsubq %xmm6, %xmm2, %xmm2
; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm3, %xmm3
; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm2, %xmm2
; AVX1-FALLBACK-NEXT: vpsubq %xmm3, %xmm2, %xmm2
; AVX1-FALLBACK-NEXT: vpsrlq $1, %xmm2, %xmm2		; AVX1-FALLBACK-NEXT: vpsrlq $1, %xmm2, %xmm2
; AVX1-FALLBACK-NEXT: vpsrlq $1, %xmm4, %xmm3		; AVX1-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm1
; AVX1-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]		; AVX1-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]
; AVX1-FALLBACK-NEXT: vpor %xmm8, %xmm6, %xmm6
; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm6, %xmm7
; AVX1-FALLBACK-NEXT: vpmuludq %xmm7, %xmm3, %xmm7
; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm4
; AVX1-FALLBACK-NEXT: vpmuludq %xmm6, %xmm4, %xmm4
; AVX1-FALLBACK-NEXT: vpaddq %xmm4, %xmm7, %xmm4
; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm4, %xmm4
; AVX1-FALLBACK-NEXT: vpmuludq %xmm6, %xmm3, %xmm3
; AVX1-FALLBACK-NEXT: vpor %xmm8, %xmm5, %xmm5		; AVX1-FALLBACK-NEXT: vpor %xmm8, %xmm5, %xmm5
; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm6		; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm7
; AVX1-FALLBACK-NEXT: vpmuludq %xmm6, %xmm2, %xmm6		; AVX1-FALLBACK-NEXT: vpmuludq %xmm7, %xmm1, %xmm7
; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm2, %xmm7		; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm1, %xmm6
; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm7, %xmm7		; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm6, %xmm6
; AVX1-FALLBACK-NEXT: vpaddq %xmm7, %xmm6, %xmm6		; AVX1-FALLBACK-NEXT: vpaddq %xmm6, %xmm7, %xmm6
; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm6, %xmm6		; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm6, %xmm6
; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm2, %xmm2		; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm1, %xmm1
; AVX1-FALLBACK-NEXT: vpaddq %xmm1, %xmm6, %xmm1		; AVX1-FALLBACK-NEXT: vpor %xmm8, %xmm4, %xmm4
; AVX1-FALLBACK-NEXT: vpaddq %xmm1, %xmm2, %xmm1		; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm4, %xmm5
; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm4, %xmm0		; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm2, %xmm5
; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm3, %xmm0		; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm2, %xmm7
; AVX1-FALLBACK-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0		; AVX1-FALLBACK-NEXT: vpmuludq %xmm4, %xmm7, %xmm7
		; AVX1-FALLBACK-NEXT: vpaddq %xmm7, %xmm5, %xmm5
		; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm5, %xmm5
		; AVX1-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm2
		; AVX1-FALLBACK-NEXT: vpaddq %xmm3, %xmm5, %xmm3
		; AVX1-FALLBACK-NEXT: vpaddq %xmm3, %xmm2, %xmm2
		; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm6, %xmm0
		; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0
		; AVX1-FALLBACK-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX1-FALLBACK-NEXT: retq		; AVX1-FALLBACK-NEXT: retq
;		;
; AVX2-LABEL: vec256_i64_signed_reg_mem:		; AVX2-LABEL: vec256_i64_signed_reg_mem:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vmovdqa (%rdi), %ymm1		; AVX2-NEXT: vmovdqa (%rdi), %ymm1
; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2		; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2
; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm3 = [1,1,1,1]		; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm3 = [1,1,1,1]
; AVX2-NEXT: vpor %ymm3, %ymm2, %ymm3		; AVX2-NEXT: vpor %ymm3, %ymm2, %ymm3
Show All 10 Lines
; AVX2-NEXT: vpsllq $32, %ymm2, %ymm2		; AVX2-NEXT: vpsllq $32, %ymm2, %ymm2
; AVX2-NEXT: vpmuludq %ymm3, %ymm1, %ymm1		; AVX2-NEXT: vpmuludq %ymm3, %ymm1, %ymm1
; AVX2-NEXT: vpaddq %ymm0, %ymm2, %ymm0		; AVX2-NEXT: vpaddq %ymm0, %ymm2, %ymm0
; AVX2-NEXT: vpaddq %ymm0, %ymm1, %ymm0		; AVX2-NEXT: vpaddq %ymm0, %ymm1, %ymm0
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; XOP-FALLBACK-LABEL: vec256_i64_signed_reg_mem:		; XOP-FALLBACK-LABEL: vec256_i64_signed_reg_mem:
; XOP-FALLBACK: # %bb.0:		; XOP-FALLBACK: # %bb.0:
; XOP-FALLBACK-NEXT: vmovapd (%rdi), %ymm2		; XOP-FALLBACK-NEXT: vmovdqa (%rdi), %xmm1
; XOP-FALLBACK-NEXT: vmovdqa (%rdi), %xmm3		; XOP-FALLBACK-NEXT: vmovdqa 16(%rdi), %xmm2
; XOP-FALLBACK-NEXT: vmovdqa 16(%rdi), %xmm4		; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm0, %xmm3
; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm0, %xmm1		; XOP-FALLBACK-NEXT: vpcomgtq %xmm2, %xmm3, %xmm4
; XOP-FALLBACK-NEXT: vpcomgtq %xmm4, %xmm1, %xmm5		; XOP-FALLBACK-NEXT: vpcomgtq %xmm1, %xmm0, %xmm5
; XOP-FALLBACK-NEXT: vpcomgtq %xmm3, %xmm0, %xmm6		; XOP-FALLBACK-NEXT: vpcomltq %xmm2, %xmm3, %xmm6
; XOP-FALLBACK-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm7		; XOP-FALLBACK-NEXT: vpcomltq %xmm1, %xmm0, %xmm7
; XOP-FALLBACK-NEXT: vpcomltq %xmm4, %xmm1, %xmm4		; XOP-FALLBACK-NEXT: vblendvpd %xmm7, %xmm0, %xmm1, %xmm7
; XOP-FALLBACK-NEXT: vpcomltq %xmm3, %xmm0, %xmm3		; XOP-FALLBACK-NEXT: vblendvpd %xmm5, %xmm0, %xmm1, %xmm1
; XOP-FALLBACK-NEXT: vinsertf128 $1, %xmm4, %ymm3, %ymm3		; XOP-FALLBACK-NEXT: vpsubq %xmm7, %xmm1, %xmm1
; XOP-FALLBACK-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm3		; XOP-FALLBACK-NEXT: vblendvpd %xmm6, %xmm3, %xmm2, %xmm6
; XOP-FALLBACK-NEXT: vblendvpd %ymm7, %ymm0, %ymm2, %ymm2		; XOP-FALLBACK-NEXT: vblendvpd %xmm4, %xmm3, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vpsubq %xmm3, %xmm2, %xmm4		; XOP-FALLBACK-NEXT: vpsubq %xmm6, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm3, %xmm3
; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm2, %xmm2
; XOP-FALLBACK-NEXT: vpsubq %xmm3, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm2, %xmm2		; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm4, %xmm3		; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm1
; XOP-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]		; XOP-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]
; XOP-FALLBACK-NEXT: vpor %xmm8, %xmm6, %xmm6
; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm6, %xmm7
; XOP-FALLBACK-NEXT: vpmuludq %xmm7, %xmm3, %xmm7
; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm4
; XOP-FALLBACK-NEXT: vpmuludq %xmm6, %xmm4, %xmm4
; XOP-FALLBACK-NEXT: vpaddq %xmm4, %xmm7, %xmm4
; XOP-FALLBACK-NEXT: vpsllq $32, %xmm4, %xmm4
; XOP-FALLBACK-NEXT: vpmuludq %xmm6, %xmm3, %xmm3
; XOP-FALLBACK-NEXT: vpor %xmm8, %xmm5, %xmm5		; XOP-FALLBACK-NEXT: vpor %xmm8, %xmm5, %xmm5
; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm6		; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm7
; XOP-FALLBACK-NEXT: vpmuludq %xmm6, %xmm2, %xmm6		; XOP-FALLBACK-NEXT: vpmuludq %xmm7, %xmm1, %xmm7
; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm2, %xmm7		; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm1, %xmm6
; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm7, %xmm7		; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm6, %xmm6
; XOP-FALLBACK-NEXT: vpaddq %xmm7, %xmm6, %xmm6		; XOP-FALLBACK-NEXT: vpaddq %xmm6, %xmm7, %xmm6
; XOP-FALLBACK-NEXT: vpsllq $32, %xmm6, %xmm6		; XOP-FALLBACK-NEXT: vpsllq $32, %xmm6, %xmm6
; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm2, %xmm2		; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm1, %xmm1
; XOP-FALLBACK-NEXT: vpaddq %xmm1, %xmm6, %xmm1		; XOP-FALLBACK-NEXT: vpor %xmm8, %xmm4, %xmm4
; XOP-FALLBACK-NEXT: vpaddq %xmm1, %xmm2, %xmm1		; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm4, %xmm5
; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm4, %xmm0		; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm2, %xmm5
; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm3, %xmm0		; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm2, %xmm7
; XOP-FALLBACK-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0		; XOP-FALLBACK-NEXT: vpmuludq %xmm4, %xmm7, %xmm7
		; XOP-FALLBACK-NEXT: vpaddq %xmm7, %xmm5, %xmm5
		; XOP-FALLBACK-NEXT: vpsllq $32, %xmm5, %xmm5
		; XOP-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm2
		; XOP-FALLBACK-NEXT: vpaddq %xmm3, %xmm5, %xmm3
		; XOP-FALLBACK-NEXT: vpaddq %xmm3, %xmm2, %xmm2
		; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm6, %xmm0
		; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0
		; XOP-FALLBACK-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; XOP-FALLBACK-NEXT: retq		; XOP-FALLBACK-NEXT: retq
;		;
; XOPAVX1-LABEL: vec256_i64_signed_reg_mem:		; XOPAVX1-LABEL: vec256_i64_signed_reg_mem:
; XOPAVX1: # %bb.0:		; XOPAVX1: # %bb.0:
; XOPAVX1-NEXT: vmovapd (%rdi), %ymm2		; XOPAVX1-NEXT: vmovdqa (%rdi), %xmm1
; XOPAVX1-NEXT: vmovdqa (%rdi), %xmm3		; XOPAVX1-NEXT: vmovdqa 16(%rdi), %xmm2
; XOPAVX1-NEXT: vmovdqa 16(%rdi), %xmm4		; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm1		; XOPAVX1-NEXT: vpcomgtq %xmm2, %xmm3, %xmm4
; XOPAVX1-NEXT: vpcomgtq %xmm4, %xmm1, %xmm5		; XOPAVX1-NEXT: vpcomgtq %xmm1, %xmm0, %xmm5
; XOPAVX1-NEXT: vpcomgtq %xmm3, %xmm0, %xmm6		; XOPAVX1-NEXT: vpcomltq %xmm2, %xmm3, %xmm6
; XOPAVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm7		; XOPAVX1-NEXT: vpcomltq %xmm1, %xmm0, %xmm7
; XOPAVX1-NEXT: vpcomltq %xmm4, %xmm1, %xmm4		; XOPAVX1-NEXT: vblendvpd %xmm7, %xmm0, %xmm1, %xmm7
; XOPAVX1-NEXT: vpcomltq %xmm3, %xmm0, %xmm3		; XOPAVX1-NEXT: vblendvpd %xmm5, %xmm0, %xmm1, %xmm1
; XOPAVX1-NEXT: vinsertf128 $1, %xmm4, %ymm3, %ymm3		; XOPAVX1-NEXT: vpsubq %xmm7, %xmm1, %xmm1
; XOPAVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm3		; XOPAVX1-NEXT: vblendvpd %xmm6, %xmm3, %xmm2, %xmm6
; XOPAVX1-NEXT: vblendvpd %ymm7, %ymm0, %ymm2, %ymm2		; XOPAVX1-NEXT: vblendvpd %xmm4, %xmm3, %xmm2, %xmm2
; XOPAVX1-NEXT: vpsubq %xmm3, %xmm2, %xmm4		; XOPAVX1-NEXT: vpsubq %xmm6, %xmm2, %xmm2
; XOPAVX1-NEXT: vextractf128 $1, %ymm3, %xmm3
; XOPAVX1-NEXT: vextractf128 $1, %ymm2, %xmm2
; XOPAVX1-NEXT: vpsubq %xmm3, %xmm2, %xmm2
; XOPAVX1-NEXT: vpsrlq $1, %xmm2, %xmm2		; XOPAVX1-NEXT: vpsrlq $1, %xmm2, %xmm2
; XOPAVX1-NEXT: vpsrlq $1, %xmm4, %xmm3		; XOPAVX1-NEXT: vpsrlq $1, %xmm1, %xmm1
; XOPAVX1-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]		; XOPAVX1-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]
; XOPAVX1-NEXT: vpor %xmm8, %xmm6, %xmm6
; XOPAVX1-NEXT: vpsrlq $32, %xmm6, %xmm7
; XOPAVX1-NEXT: vpmuludq %xmm7, %xmm3, %xmm7
; XOPAVX1-NEXT: vpsrlq $32, %xmm3, %xmm4
; XOPAVX1-NEXT: vpmuludq %xmm6, %xmm4, %xmm4
; XOPAVX1-NEXT: vpaddq %xmm4, %xmm7, %xmm4
; XOPAVX1-NEXT: vpsllq $32, %xmm4, %xmm4
; XOPAVX1-NEXT: vpmuludq %xmm6, %xmm3, %xmm3
; XOPAVX1-NEXT: vpor %xmm8, %xmm5, %xmm5		; XOPAVX1-NEXT: vpor %xmm8, %xmm5, %xmm5
; XOPAVX1-NEXT: vpsrlq $32, %xmm5, %xmm6		; XOPAVX1-NEXT: vpsrlq $32, %xmm5, %xmm7
; XOPAVX1-NEXT: vpmuludq %xmm6, %xmm2, %xmm6		; XOPAVX1-NEXT: vpmuludq %xmm7, %xmm1, %xmm7
; XOPAVX1-NEXT: vpsrlq $32, %xmm2, %xmm7		; XOPAVX1-NEXT: vpsrlq $32, %xmm1, %xmm6
; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm7, %xmm7		; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm6, %xmm6
; XOPAVX1-NEXT: vpaddq %xmm7, %xmm6, %xmm6		; XOPAVX1-NEXT: vpaddq %xmm6, %xmm7, %xmm6
; XOPAVX1-NEXT: vpsllq $32, %xmm6, %xmm6		; XOPAVX1-NEXT: vpsllq $32, %xmm6, %xmm6
; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm2, %xmm2		; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm1, %xmm1
; XOPAVX1-NEXT: vpaddq %xmm1, %xmm6, %xmm1		; XOPAVX1-NEXT: vpor %xmm8, %xmm4, %xmm4
; XOPAVX1-NEXT: vpaddq %xmm1, %xmm2, %xmm1		; XOPAVX1-NEXT: vpsrlq $32, %xmm4, %xmm5
; XOPAVX1-NEXT: vpaddq %xmm0, %xmm4, %xmm0		; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm2, %xmm5
; XOPAVX1-NEXT: vpaddq %xmm0, %xmm3, %xmm0		; XOPAVX1-NEXT: vpsrlq $32, %xmm2, %xmm7
; XOPAVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0		; XOPAVX1-NEXT: vpmuludq %xmm4, %xmm7, %xmm7
		; XOPAVX1-NEXT: vpaddq %xmm7, %xmm5, %xmm5
		; XOPAVX1-NEXT: vpsllq $32, %xmm5, %xmm5
		; XOPAVX1-NEXT: vpmuludq %xmm4, %xmm2, %xmm2
		; XOPAVX1-NEXT: vpaddq %xmm3, %xmm5, %xmm3
		; XOPAVX1-NEXT: vpaddq %xmm3, %xmm2, %xmm2
		; XOPAVX1-NEXT: vpaddq %xmm0, %xmm6, %xmm0
		; XOPAVX1-NEXT: vpaddq %xmm0, %xmm1, %xmm0
		; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; XOPAVX1-NEXT: retq		; XOPAVX1-NEXT: retq
;		;
; AVX512F-LABEL: vec256_i64_signed_reg_mem:		; AVX512F-LABEL: vec256_i64_signed_reg_mem:
; AVX512F: # %bb.0:		; AVX512F: # %bb.0:
; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0		; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0
; AVX512F-NEXT: vmovdqa (%rdi), %ymm1		; AVX512F-NEXT: vmovdqa (%rdi), %ymm1
; AVX512F-NEXT: vpcmpgtq %zmm1, %zmm0, %k1		; AVX512F-NEXT: vpcmpgtq %zmm1, %zmm0, %k1
; AVX512F-NEXT: vpcmpeqd %ymm2, %ymm2, %ymm2		; AVX512F-NEXT: vpcmpeqd %ymm2, %ymm2, %ymm2
▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines	; AVX512BW-FALLBACK-NEXT: retq
%t9 = mul nsw <4 x i64> %t8, %t4 ; signed		%t9 = mul nsw <4 x i64> %t8, %t4 ; signed
%a10 = add nsw <4 x i64> %t9, %a1 ; signed		%a10 = add nsw <4 x i64> %t9, %a1 ; signed
ret <4 x i64> %a10		ret <4 x i64> %a10
}		}

define <4 x i64> @vec256_i64_signed_mem_mem(<4 x i64>* %a1_addr, <4 x i64>* %a2_addr) nounwind {		define <4 x i64> @vec256_i64_signed_mem_mem(<4 x i64>* %a1_addr, <4 x i64>* %a2_addr) nounwind {
; AVX1-FALLBACK-LABEL: vec256_i64_signed_mem_mem:		; AVX1-FALLBACK-LABEL: vec256_i64_signed_mem_mem:
; AVX1-FALLBACK: # %bb.0:		; AVX1-FALLBACK: # %bb.0:
; AVX1-FALLBACK-NEXT: vmovapd (%rdi), %ymm2		; AVX1-FALLBACK-NEXT: vmovdqa (%rsi), %xmm1
; AVX1-FALLBACK-NEXT: vmovapd (%rsi), %ymm3		; AVX1-FALLBACK-NEXT: vmovdqa 16(%rsi), %xmm2
; AVX1-FALLBACK-NEXT: vmovdqa (%rsi), %xmm4
; AVX1-FALLBACK-NEXT: vmovdqa 16(%rsi), %xmm5
; AVX1-FALLBACK-NEXT: vmovdqa (%rdi), %xmm0		; AVX1-FALLBACK-NEXT: vmovdqa (%rdi), %xmm0
; AVX1-FALLBACK-NEXT: vmovdqa 16(%rdi), %xmm1		; AVX1-FALLBACK-NEXT: vmovdqa 16(%rdi), %xmm3
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm5, %xmm1, %xmm6		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm4
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm7		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm5
; AVX1-FALLBACK-NEXT: vinsertf128 $1, %xmm6, %ymm7, %ymm8		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm6
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm1, %xmm5, %xmm5		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm7
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm4		; AVX1-FALLBACK-NEXT: vblendvpd %xmm7, %xmm0, %xmm1, %xmm7
; AVX1-FALLBACK-NEXT: vinsertf128 $1, %xmm5, %ymm4, %ymm4		; AVX1-FALLBACK-NEXT: vblendvpd %xmm5, %xmm0, %xmm1, %xmm1
; AVX1-FALLBACK-NEXT: vblendvpd %ymm4, %ymm2, %ymm3, %ymm4		; AVX1-FALLBACK-NEXT: vpsubq %xmm7, %xmm1, %xmm1
; AVX1-FALLBACK-NEXT: vblendvpd %ymm8, %ymm2, %ymm3, %ymm2		; AVX1-FALLBACK-NEXT: vblendvpd %xmm6, %xmm3, %xmm2, %xmm6
; AVX1-FALLBACK-NEXT: vpsubq %xmm4, %xmm2, %xmm3		; AVX1-FALLBACK-NEXT: vblendvpd %xmm4, %xmm3, %xmm2, %xmm2
; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm4, %xmm4		; AVX1-FALLBACK-NEXT: vpsubq %xmm6, %xmm2, %xmm2
; AVX1-FALLBACK-NEXT: vextractf128 $1, %ymm2, %xmm2
; AVX1-FALLBACK-NEXT: vpsubq %xmm4, %xmm2, %xmm2
; AVX1-FALLBACK-NEXT: vpsrlq $1, %xmm2, %xmm2		; AVX1-FALLBACK-NEXT: vpsrlq $1, %xmm2, %xmm2
; AVX1-FALLBACK-NEXT: vpsrlq $1, %xmm3, %xmm3		; AVX1-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm1
; AVX1-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]		; AVX1-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]
; AVX1-FALLBACK-NEXT: vpor %xmm8, %xmm7, %xmm5		; AVX1-FALLBACK-NEXT: vpor %xmm8, %xmm5, %xmm5
; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm7		; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm7
; AVX1-FALLBACK-NEXT: vpmuludq %xmm7, %xmm3, %xmm7		; AVX1-FALLBACK-NEXT: vpmuludq %xmm7, %xmm1, %xmm7
; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm4		; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm1, %xmm6
; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm4, %xmm4		; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm6, %xmm6
; AVX1-FALLBACK-NEXT: vpaddq %xmm4, %xmm7, %xmm4		; AVX1-FALLBACK-NEXT: vpaddq %xmm6, %xmm7, %xmm6
; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm4, %xmm4
; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm3, %xmm3
; AVX1-FALLBACK-NEXT: vpor %xmm8, %xmm6, %xmm5
; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm6
; AVX1-FALLBACK-NEXT: vpmuludq %xmm6, %xmm2, %xmm6
; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm2, %xmm7
; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm7, %xmm7
; AVX1-FALLBACK-NEXT: vpaddq %xmm7, %xmm6, %xmm6
; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm6, %xmm6		; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm6, %xmm6
; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm2, %xmm2		; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm1, %xmm1
; AVX1-FALLBACK-NEXT: vpaddq %xmm1, %xmm6, %xmm1		; AVX1-FALLBACK-NEXT: vpor %xmm8, %xmm4, %xmm4
; AVX1-FALLBACK-NEXT: vpaddq %xmm1, %xmm2, %xmm1		; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm4, %xmm5
; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm4, %xmm0		; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm2, %xmm5
; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm3, %xmm0		; AVX1-FALLBACK-NEXT: vpsrlq $32, %xmm2, %xmm7
; AVX1-FALLBACK-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0		; AVX1-FALLBACK-NEXT: vpmuludq %xmm4, %xmm7, %xmm7
		; AVX1-FALLBACK-NEXT: vpaddq %xmm7, %xmm5, %xmm5
		; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm5, %xmm5
		; AVX1-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm2
		; AVX1-FALLBACK-NEXT: vpaddq %xmm3, %xmm5, %xmm3
		; AVX1-FALLBACK-NEXT: vpaddq %xmm3, %xmm2, %xmm2
		; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm6, %xmm0
		; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0
		; AVX1-FALLBACK-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX1-FALLBACK-NEXT: retq		; AVX1-FALLBACK-NEXT: retq
;		;
; AVX2-LABEL: vec256_i64_signed_mem_mem:		; AVX2-LABEL: vec256_i64_signed_mem_mem:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vmovdqa (%rdi), %ymm0		; AVX2-NEXT: vmovdqa (%rdi), %ymm0
; AVX2-NEXT: vmovdqa (%rsi), %ymm1		; AVX2-NEXT: vmovdqa (%rsi), %ymm1
; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2		; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2
; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm3 = [1,1,1,1]		; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm3 = [1,1,1,1]
Show All 11 Lines
; AVX2-NEXT: vpsllq $32, %ymm2, %ymm2		; AVX2-NEXT: vpsllq $32, %ymm2, %ymm2
; AVX2-NEXT: vpmuludq %ymm3, %ymm1, %ymm1		; AVX2-NEXT: vpmuludq %ymm3, %ymm1, %ymm1
; AVX2-NEXT: vpaddq %ymm0, %ymm2, %ymm0		; AVX2-NEXT: vpaddq %ymm0, %ymm2, %ymm0
; AVX2-NEXT: vpaddq %ymm0, %ymm1, %ymm0		; AVX2-NEXT: vpaddq %ymm0, %ymm1, %ymm0
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; XOP-FALLBACK-LABEL: vec256_i64_signed_mem_mem:		; XOP-FALLBACK-LABEL: vec256_i64_signed_mem_mem:
; XOP-FALLBACK: # %bb.0:		; XOP-FALLBACK: # %bb.0:
; XOP-FALLBACK-NEXT: vmovapd (%rdi), %ymm2		; XOP-FALLBACK-NEXT: vmovdqa (%rsi), %xmm1
; XOP-FALLBACK-NEXT: vmovapd (%rsi), %ymm3		; XOP-FALLBACK-NEXT: vmovdqa 16(%rsi), %xmm2
; XOP-FALLBACK-NEXT: vmovdqa (%rsi), %xmm4
; XOP-FALLBACK-NEXT: vmovdqa 16(%rsi), %xmm5
; XOP-FALLBACK-NEXT: vmovdqa (%rdi), %xmm0		; XOP-FALLBACK-NEXT: vmovdqa (%rdi), %xmm0
; XOP-FALLBACK-NEXT: vmovdqa 16(%rdi), %xmm1		; XOP-FALLBACK-NEXT: vmovdqa 16(%rdi), %xmm3
; XOP-FALLBACK-NEXT: vpcomgtq %xmm5, %xmm1, %xmm6		; XOP-FALLBACK-NEXT: vpcomgtq %xmm2, %xmm3, %xmm4
; XOP-FALLBACK-NEXT: vpcomgtq %xmm4, %xmm0, %xmm7		; XOP-FALLBACK-NEXT: vpcomgtq %xmm1, %xmm0, %xmm5
; XOP-FALLBACK-NEXT: vinsertf128 $1, %xmm6, %ymm7, %ymm8		; XOP-FALLBACK-NEXT: vpcomltq %xmm2, %xmm3, %xmm6
; XOP-FALLBACK-NEXT: vpcomltq %xmm5, %xmm1, %xmm5		; XOP-FALLBACK-NEXT: vpcomltq %xmm1, %xmm0, %xmm7
; XOP-FALLBACK-NEXT: vpcomltq %xmm4, %xmm0, %xmm4		; XOP-FALLBACK-NEXT: vblendvpd %xmm7, %xmm0, %xmm1, %xmm7
; XOP-FALLBACK-NEXT: vinsertf128 $1, %xmm5, %ymm4, %ymm4		; XOP-FALLBACK-NEXT: vblendvpd %xmm5, %xmm0, %xmm1, %xmm1
; XOP-FALLBACK-NEXT: vblendvpd %ymm4, %ymm2, %ymm3, %ymm4		; XOP-FALLBACK-NEXT: vpsubq %xmm7, %xmm1, %xmm1
; XOP-FALLBACK-NEXT: vblendvpd %ymm8, %ymm2, %ymm3, %ymm2		; XOP-FALLBACK-NEXT: vblendvpd %xmm6, %xmm3, %xmm2, %xmm6
; XOP-FALLBACK-NEXT: vpsubq %xmm4, %xmm2, %xmm3		; XOP-FALLBACK-NEXT: vblendvpd %xmm4, %xmm3, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm4, %xmm4		; XOP-FALLBACK-NEXT: vpsubq %xmm6, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vextractf128 $1, %ymm2, %xmm2
; XOP-FALLBACK-NEXT: vpsubq %xmm4, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm2, %xmm2		; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm2, %xmm2
; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm3, %xmm3		; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm1
; XOP-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]		; XOP-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]
; XOP-FALLBACK-NEXT: vpor %xmm8, %xmm7, %xmm5		; XOP-FALLBACK-NEXT: vpor %xmm8, %xmm5, %xmm5
; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm7		; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm7
; XOP-FALLBACK-NEXT: vpmuludq %xmm7, %xmm3, %xmm7		; XOP-FALLBACK-NEXT: vpmuludq %xmm7, %xmm1, %xmm7
; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm4		; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm1, %xmm6
; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm4, %xmm4		; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm6, %xmm6
; XOP-FALLBACK-NEXT: vpaddq %xmm4, %xmm7, %xmm4		; XOP-FALLBACK-NEXT: vpaddq %xmm6, %xmm7, %xmm6
; XOP-FALLBACK-NEXT: vpsllq $32, %xmm4, %xmm4
; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm3, %xmm3
; XOP-FALLBACK-NEXT: vpor %xmm8, %xmm6, %xmm5
; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm6
; XOP-FALLBACK-NEXT: vpmuludq %xmm6, %xmm2, %xmm6
; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm2, %xmm7
; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm7, %xmm7
; XOP-FALLBACK-NEXT: vpaddq %xmm7, %xmm6, %xmm6
; XOP-FALLBACK-NEXT: vpsllq $32, %xmm6, %xmm6		; XOP-FALLBACK-NEXT: vpsllq $32, %xmm6, %xmm6
; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm2, %xmm2		; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm1, %xmm1
; XOP-FALLBACK-NEXT: vpaddq %xmm1, %xmm6, %xmm1		; XOP-FALLBACK-NEXT: vpor %xmm8, %xmm4, %xmm4
; XOP-FALLBACK-NEXT: vpaddq %xmm1, %xmm2, %xmm1		; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm4, %xmm5
; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm4, %xmm0		; XOP-FALLBACK-NEXT: vpmuludq %xmm5, %xmm2, %xmm5
; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm3, %xmm0		; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm2, %xmm7
; XOP-FALLBACK-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0		; XOP-FALLBACK-NEXT: vpmuludq %xmm4, %xmm7, %xmm7
		; XOP-FALLBACK-NEXT: vpaddq %xmm7, %xmm5, %xmm5
		; XOP-FALLBACK-NEXT: vpsllq $32, %xmm5, %xmm5
		; XOP-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm2
		; XOP-FALLBACK-NEXT: vpaddq %xmm3, %xmm5, %xmm3
		; XOP-FALLBACK-NEXT: vpaddq %xmm3, %xmm2, %xmm2
		; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm6, %xmm0
		; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0
		; XOP-FALLBACK-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; XOP-FALLBACK-NEXT: retq		; XOP-FALLBACK-NEXT: retq
;		;
; XOPAVX1-LABEL: vec256_i64_signed_mem_mem:		; XOPAVX1-LABEL: vec256_i64_signed_mem_mem:
; XOPAVX1: # %bb.0:		; XOPAVX1: # %bb.0:
; XOPAVX1-NEXT: vmovapd (%rdi), %ymm2		; XOPAVX1-NEXT: vmovdqa (%rsi), %xmm1
; XOPAVX1-NEXT: vmovapd (%rsi), %ymm3		; XOPAVX1-NEXT: vmovdqa 16(%rsi), %xmm2
; XOPAVX1-NEXT: vmovdqa (%rsi), %xmm4
; XOPAVX1-NEXT: vmovdqa 16(%rsi), %xmm5
; XOPAVX1-NEXT: vmovdqa (%rdi), %xmm0		; XOPAVX1-NEXT: vmovdqa (%rdi), %xmm0
; XOPAVX1-NEXT: vmovdqa 16(%rdi), %xmm1		; XOPAVX1-NEXT: vmovdqa 16(%rdi), %xmm3
; XOPAVX1-NEXT: vpcomgtq %xmm5, %xmm1, %xmm6		; XOPAVX1-NEXT: vpcomgtq %xmm2, %xmm3, %xmm4
; XOPAVX1-NEXT: vpcomgtq %xmm4, %xmm0, %xmm7		; XOPAVX1-NEXT: vpcomgtq %xmm1, %xmm0, %xmm5
; XOPAVX1-NEXT: vinsertf128 $1, %xmm6, %ymm7, %ymm8		; XOPAVX1-NEXT: vpcomltq %xmm2, %xmm3, %xmm6
; XOPAVX1-NEXT: vpcomltq %xmm5, %xmm1, %xmm5		; XOPAVX1-NEXT: vpcomltq %xmm1, %xmm0, %xmm7
; XOPAVX1-NEXT: vpcomltq %xmm4, %xmm0, %xmm4		; XOPAVX1-NEXT: vblendvpd %xmm7, %xmm0, %xmm1, %xmm7
; XOPAVX1-NEXT: vinsertf128 $1, %xmm5, %ymm4, %ymm4		; XOPAVX1-NEXT: vblendvpd %xmm5, %xmm0, %xmm1, %xmm1
; XOPAVX1-NEXT: vblendvpd %ymm4, %ymm2, %ymm3, %ymm4		; XOPAVX1-NEXT: vpsubq %xmm7, %xmm1, %xmm1
; XOPAVX1-NEXT: vblendvpd %ymm8, %ymm2, %ymm3, %ymm2		; XOPAVX1-NEXT: vblendvpd %xmm6, %xmm3, %xmm2, %xmm6
; XOPAVX1-NEXT: vpsubq %xmm4, %xmm2, %xmm3		; XOPAVX1-NEXT: vblendvpd %xmm4, %xmm3, %xmm2, %xmm2
; XOPAVX1-NEXT: vextractf128 $1, %ymm4, %xmm4		; XOPAVX1-NEXT: vpsubq %xmm6, %xmm2, %xmm2
; XOPAVX1-NEXT: vextractf128 $1, %ymm2, %xmm2
; XOPAVX1-NEXT: vpsubq %xmm4, %xmm2, %xmm2
; XOPAVX1-NEXT: vpsrlq $1, %xmm2, %xmm2		; XOPAVX1-NEXT: vpsrlq $1, %xmm2, %xmm2
; XOPAVX1-NEXT: vpsrlq $1, %xmm3, %xmm3		; XOPAVX1-NEXT: vpsrlq $1, %xmm1, %xmm1
; XOPAVX1-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]		; XOPAVX1-NEXT: vmovdqa {{.*#+}} xmm8 = [1,1]
; XOPAVX1-NEXT: vpor %xmm8, %xmm7, %xmm5		; XOPAVX1-NEXT: vpor %xmm8, %xmm5, %xmm5
; XOPAVX1-NEXT: vpsrlq $32, %xmm5, %xmm7		; XOPAVX1-NEXT: vpsrlq $32, %xmm5, %xmm7
; XOPAVX1-NEXT: vpmuludq %xmm7, %xmm3, %xmm7		; XOPAVX1-NEXT: vpmuludq %xmm7, %xmm1, %xmm7
; XOPAVX1-NEXT: vpsrlq $32, %xmm3, %xmm4		; XOPAVX1-NEXT: vpsrlq $32, %xmm1, %xmm6
; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm4, %xmm4		; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm6, %xmm6
; XOPAVX1-NEXT: vpaddq %xmm4, %xmm7, %xmm4		; XOPAVX1-NEXT: vpaddq %xmm6, %xmm7, %xmm6
; XOPAVX1-NEXT: vpsllq $32, %xmm4, %xmm4
; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm3, %xmm3
; XOPAVX1-NEXT: vpor %xmm8, %xmm6, %xmm5
; XOPAVX1-NEXT: vpsrlq $32, %xmm5, %xmm6
; XOPAVX1-NEXT: vpmuludq %xmm6, %xmm2, %xmm6
; XOPAVX1-NEXT: vpsrlq $32, %xmm2, %xmm7
; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm7, %xmm7
; XOPAVX1-NEXT: vpaddq %xmm7, %xmm6, %xmm6
; XOPAVX1-NEXT: vpsllq $32, %xmm6, %xmm6		; XOPAVX1-NEXT: vpsllq $32, %xmm6, %xmm6
; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm2, %xmm2		; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm1, %xmm1
; XOPAVX1-NEXT: vpaddq %xmm1, %xmm6, %xmm1		; XOPAVX1-NEXT: vpor %xmm8, %xmm4, %xmm4
; XOPAVX1-NEXT: vpaddq %xmm1, %xmm2, %xmm1		; XOPAVX1-NEXT: vpsrlq $32, %xmm4, %xmm5
; XOPAVX1-NEXT: vpaddq %xmm0, %xmm4, %xmm0		; XOPAVX1-NEXT: vpmuludq %xmm5, %xmm2, %xmm5
; XOPAVX1-NEXT: vpaddq %xmm0, %xmm3, %xmm0		; XOPAVX1-NEXT: vpsrlq $32, %xmm2, %xmm7
; XOPAVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0		; XOPAVX1-NEXT: vpmuludq %xmm4, %xmm7, %xmm7
		; XOPAVX1-NEXT: vpaddq %xmm7, %xmm5, %xmm5
		; XOPAVX1-NEXT: vpsllq $32, %xmm5, %xmm5
		; XOPAVX1-NEXT: vpmuludq %xmm4, %xmm2, %xmm2
		; XOPAVX1-NEXT: vpaddq %xmm3, %xmm5, %xmm3
		; XOPAVX1-NEXT: vpaddq %xmm3, %xmm2, %xmm2
		; XOPAVX1-NEXT: vpaddq %xmm0, %xmm6, %xmm0
		; XOPAVX1-NEXT: vpaddq %xmm0, %xmm1, %xmm0
		; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; XOPAVX1-NEXT: retq		; XOPAVX1-NEXT: retq
;		;
; AVX512F-LABEL: vec256_i64_signed_mem_mem:		; AVX512F-LABEL: vec256_i64_signed_mem_mem:
; AVX512F: # %bb.0:		; AVX512F: # %bb.0:
; AVX512F-NEXT: vmovdqa (%rdi), %ymm0		; AVX512F-NEXT: vmovdqa (%rdi), %ymm0
; AVX512F-NEXT: vmovdqa (%rsi), %ymm1		; AVX512F-NEXT: vmovdqa (%rsi), %ymm1
; AVX512F-NEXT: vpcmpgtq %zmm1, %zmm0, %k1		; AVX512F-NEXT: vpcmpgtq %zmm1, %zmm0, %k1
; AVX512F-NEXT: vpcmpeqd %ymm2, %ymm2, %ymm2		; AVX512F-NEXT: vpcmpeqd %ymm2, %ymm2, %ymm2
▲ Show 20 Lines • Show All 2,068 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/psubus.ll

	Show First 20 Lines • Show All 1,718 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: packusdw %xmm3, %xmm7			; SSE41-NEXT: packusdw %xmm3, %xmm7
	; SSE41-NEXT: packusdw %xmm4, %xmm7			; SSE41-NEXT: packusdw %xmm4, %xmm7
	; SSE41-NEXT: psubusw %xmm7, %xmm8			; SSE41-NEXT: psubusw %xmm7, %xmm8
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: psubus_8i64_max:			; AVX1-LABEL: psubus_8i64_max:
	; AVX1: # %bb.0: # %vector.ph			; AVX1: # %bb.0: # %vector.ph
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm3			; AVX1-NEXT: vmovapd {{.*#+}} xmm3 = [65535,65535]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854841343,9223372036854841343]			; AVX1-NEXT: vpxor %xmm5, %xmm4, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vmovdqa {{.*#+}} xmm7 = [9223372036854841343,9223372036854841343]
	; AVX1-NEXT: vpxor %xmm4, %xmm2, %xmm6			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm7, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm6			; AVX1-NEXT: vblendvpd %xmm6, %xmm4, %xmm3, %xmm4
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm6, %ymm3			; AVX1-NEXT: vpxor %xmm5, %xmm2, %xmm6
	; AVX1-NEXT: vmovapd {{.*#+}} ymm6 = [65535,65535,65535,65535]			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm7, %xmm6
	; AVX1-NEXT: vblendvpd %ymm3, %ymm2, %ymm6, %ymm2			; AVX1-NEXT: vblendvpd %xmm6, %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm3			; AVX1-NEXT: vpackusdw %xmm4, %xmm2, %xmm2
	; AVX1-NEXT: vpackusdw %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vpxor %xmm5, %xmm4, %xmm6
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm7, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vblendvpd %xmm6, %xmm4, %xmm3, %xmm4
	; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm4			; AVX1-NEXT: vpxor %xmm5, %xmm1, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm5
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3			; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm6, %ymm1			; AVX1-NEXT: vpackusdw %xmm4, %xmm1, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vpackusdw %xmm3, %xmm1, %xmm1
	; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpsubusw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpsubusw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: psubus_8i64_max:			; AVX2-LABEL: psubus_8i64_max:
	; AVX2: # %bb.0: # %vector.ph			; AVX2: # %bb.0: # %vector.ph
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm3 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm3 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 1,010 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/uadd_sat_vec.ll

	Show First 20 Lines • Show All 1,161 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movapd %xmm2, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm0
	; SSE41-NEXT: movapd %xmm3, %xmm1			; SSE41-NEXT: movapd %xmm3, %xmm1
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: v4i64:			; AVX1-LABEL: v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm4
	; AVX1-NEXT: vxorps %xmm4, %xmm4, %xmm4			; AVX1-NEXT: vxorps %xmm5, %xmm5, %xmm5
	; AVX1-NEXT: vcmptrueps %ymm4, %ymm4, %ymm4			; AVX1-NEXT: vcmptrueps %ymm5, %ymm5, %ymm5
	; AVX1-NEXT: vxorps %ymm4, %ymm1, %ymm4			; AVX1-NEXT: vxorps %ymm5, %ymm1, %ymm5
	; AVX1-NEXT: vextractf128 $1, %ymm4, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm5, %xmm6
	; AVX1-NEXT: vpxor %xmm3, %xmm5, %xmm5			; AVX1-NEXT: vpxor %xmm3, %xmm6, %xmm7
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm5, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm7, %xmm4
	; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm5			; AVX1-NEXT: vblendvpd %xmm4, %xmm2, %xmm6, %xmm2
	; AVX1-NEXT: vxorps %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm3, %xmm3			; AVX1-NEXT: vpaddq %xmm4, %xmm2, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2			; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm4
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm4, %ymm0			; AVX1-NEXT: vxorps %xmm3, %xmm5, %xmm3
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vblendvpd %xmm3, %xmm0, %xmm5, %xmm0
	; AVX1-NEXT: vpaddq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpaddq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: v4i64:			; AVX2-LABEL: v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %ymm2, %ymm0, %ymm2			; AVX2-NEXT: vpxor %ymm2, %ymm0, %ymm2
	▲ Show 20 Lines • Show All 191 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movapd %xmm10, %xmm2			; SSE41-NEXT: movapd %xmm10, %xmm2
	; SSE41-NEXT: movapd %xmm8, %xmm3			; SSE41-NEXT: movapd %xmm8, %xmm3
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: v8i64:			; AVX1-LABEL: v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vpxor %xmm4, %xmm5, %xmm5			; AVX1-NEXT: vpxor %xmm4, %xmm5, %xmm9
	; AVX1-NEXT: vxorps %xmm6, %xmm6, %xmm6			; AVX1-NEXT: vxorps %xmm7, %xmm7, %xmm7
	; AVX1-NEXT: vcmptrueps %ymm6, %ymm6, %ymm8			; AVX1-NEXT: vcmptrueps %ymm7, %ymm7, %ymm10
	; AVX1-NEXT: vxorps %ymm8, %ymm2, %ymm7			; AVX1-NEXT: vxorps %ymm10, %ymm2, %ymm8
	; AVX1-NEXT: vextractf128 $1, %ymm7, %xmm6			; AVX1-NEXT: vextractf128 $1, %ymm8, %xmm6
	; AVX1-NEXT: vpxor %xmm4, %xmm6, %xmm6			; AVX1-NEXT: vpxor %xmm4, %xmm6, %xmm7
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm9			; AVX1-NEXT: vpcmpgtq %xmm9, %xmm7, %xmm7
	; AVX1-NEXT: vpxor %xmm4, %xmm0, %xmm6			; AVX1-NEXT: vblendvpd %xmm7, %xmm5, %xmm6, %xmm5
	; AVX1-NEXT: vxorps %xmm4, %xmm7, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm5
	; AVX1-NEXT: vinsertf128 $1, %xmm9, %ymm5, %ymm5
	; AVX1-NEXT: vblendvpd %ymm5, %ymm0, %ymm7, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm6			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm6
	; AVX1-NEXT: vpaddq %xmm6, %xmm5, %xmm5			; AVX1-NEXT: vpaddq %xmm6, %xmm5, %xmm5
				; AVX1-NEXT: vpxor %xmm4, %xmm0, %xmm6
				; AVX1-NEXT: vxorps %xmm4, %xmm8, %xmm7
				; AVX1-NEXT: vpcmpgtq %xmm6, %xmm7, %xmm6
				; AVX1-NEXT: vblendvpd %xmm6, %xmm0, %xmm8, %xmm0
	; AVX1-NEXT: vpaddq %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpaddq %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vpxor %xmm4, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm4, %xmm2, %xmm8
	; AVX1-NEXT: vxorps %ymm8, %ymm3, %ymm5			; AVX1-NEXT: vxorps %ymm10, %ymm3, %ymm6
	; AVX1-NEXT: vextractf128 $1, %ymm5, %xmm6			; AVX1-NEXT: vextractf128 $1, %ymm6, %xmm7
	; AVX1-NEXT: vpxor %xmm4, %xmm6, %xmm6			; AVX1-NEXT: vpxor %xmm4, %xmm7, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm6, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm8, %xmm5, %xmm5
	; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm6			; AVX1-NEXT: vblendvpd %xmm5, %xmm2, %xmm7, %xmm2
	; AVX1-NEXT: vxorps %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm4, %xmm4			; AVX1-NEXT: vpaddq %xmm5, %xmm2, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm4, %ymm2			; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm5
	; AVX1-NEXT: vblendvpd %ymm2, %ymm1, %ymm5, %ymm1			; AVX1-NEXT: vxorps %xmm4, %xmm6, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm4, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm4			; AVX1-NEXT: vblendvpd %xmm4, %xmm1, %xmm6, %xmm1
	; AVX1-NEXT: vpaddq %xmm4, %xmm2, %xmm2
	; AVX1-NEXT: vpaddq %xmm3, %xmm1, %xmm1			; AVX1-NEXT: vpaddq %xmm3, %xmm1, %xmm1
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1			; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: v8i64:			; AVX2-LABEL: v8i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm4 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm4 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %ymm4, %ymm0, %ymm5			; AVX2-NEXT: vpxor %ymm4, %ymm0, %ymm5
	▲ Show 20 Lines • Show All 65 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/usub_sat_vec.ll

	Show First 20 Lines • Show All 1,124 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: v4i64:			; AVX1-LABEL: v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm4			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vpxor %xmm3, %xmm5, %xmm5			; AVX1-NEXT: vpxor %xmm3, %xmm5, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm4
	; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm5			; AVX1-NEXT: vblendvpd %xmm4, %xmm5, %xmm2, %xmm4
				; AVX1-NEXT: vpsubq %xmm2, %xmm4, %xmm2
				; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm4
	; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm3			; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm3, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm3, %ymm3			; AVX1-NEXT: vblendvpd %xmm3, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpsubq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpsubq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpsubq %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: v4i64:			; AVX2-LABEL: v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %ymm2, %ymm1, %ymm3			; AVX2-NEXT: vpxor %ymm2, %ymm1, %ymm3
	▲ Show 20 Lines • Show All 188 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movapd %xmm6, %xmm2			; SSE41-NEXT: movapd %xmm6, %xmm2
	; SSE41-NEXT: movapd %xmm8, %xmm3			; SSE41-NEXT: movapd %xmm8, %xmm3
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: v8i64:			; AVX1-LABEL: v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vpxor %xmm5, %xmm4, %xmm6			; AVX1-NEXT: vpxor %xmm5, %xmm4, %xmm8
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm7			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm7
	; AVX1-NEXT: vpxor %xmm5, %xmm7, %xmm7			; AVX1-NEXT: vpxor %xmm5, %xmm7, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm7, %xmm8			; AVX1-NEXT: vpcmpgtq %xmm8, %xmm6, %xmm6
	; AVX1-NEXT: vpxor %xmm5, %xmm2, %xmm7			; AVX1-NEXT: vblendvpd %xmm6, %xmm7, %xmm4, %xmm6
	; AVX1-NEXT: vpxor %xmm5, %xmm0, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm7, %xmm6, %xmm6
	; AVX1-NEXT: vinsertf128 $1, %xmm8, %ymm6, %ymm6
	; AVX1-NEXT: vblendvpd %ymm6, %ymm0, %ymm2, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
	; AVX1-NEXT: vpsubq %xmm4, %xmm6, %xmm4			; AVX1-NEXT: vpsubq %xmm4, %xmm6, %xmm4
				; AVX1-NEXT: vpxor %xmm5, %xmm2, %xmm6
				; AVX1-NEXT: vpxor %xmm5, %xmm0, %xmm7
				; AVX1-NEXT: vpcmpgtq %xmm6, %xmm7, %xmm6
				; AVX1-NEXT: vblendvpd %xmm6, %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vpsubq %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpsubq %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm2
	; AVX1-NEXT: vpxor %xmm5, %xmm2, %xmm4			; AVX1-NEXT: vpxor %xmm5, %xmm2, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm6			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm6
	; AVX1-NEXT: vpxor %xmm5, %xmm6, %xmm6			; AVX1-NEXT: vpxor %xmm5, %xmm6, %xmm7
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm7, %xmm4
	; AVX1-NEXT: vpxor %xmm5, %xmm3, %xmm6			; AVX1-NEXT: vblendvpd %xmm4, %xmm6, %xmm2, %xmm4
	; AVX1-NEXT: vpxor %xmm5, %xmm1, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm5
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4
	; AVX1-NEXT: vblendvpd %ymm4, %ymm1, %ymm3, %ymm1
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4
	; AVX1-NEXT: vpsubq %xmm2, %xmm4, %xmm2			; AVX1-NEXT: vpsubq %xmm2, %xmm4, %xmm2
				; AVX1-NEXT: vpxor %xmm5, %xmm3, %xmm4
				; AVX1-NEXT: vpxor %xmm5, %xmm1, %xmm5
				; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4
				; AVX1-NEXT: vblendvpd %xmm4, %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vpsubq %xmm3, %xmm1, %xmm1			; AVX1-NEXT: vpsubq %xmm3, %xmm1, %xmm1
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1			; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: v8i64:			; AVX2-LABEL: v8i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm4 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm4 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %ymm4, %ymm2, %ymm5			; AVX2-NEXT: vpxor %ymm4, %ymm2, %ymm5
	▲ Show 20 Lines • Show All 59 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-smax-widen.ll

	Show First 20 Lines • Show All 143 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v4i64:			; AVX1-LABEL: test_v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v4i64:			; AVX2-LABEL: test_v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2			; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2
	▲ Show 20 Lines • Show All 148 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pand %xmm4, %xmm0			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i64:			; AVX1-LABEL: test_v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm3
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm2, %ymm2			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm5
				; AVX1-NEXT: vblendvpd %xmm5, %xmm4, %xmm3, %xmm3
				; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX1-NEXT: vpcmpgtq %xmm3, %xmm0, %xmm1
				; AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v8i64:			; AVX2-LABEL: test_v8i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2			; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2
	; AVX2-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX2-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	▲ Show 20 Lines • Show All 261 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pand %xmm3, %xmm0			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i64:			; AVX1-LABEL: test_v16i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm11
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm11, %xmm5, %xmm8
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm0, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm7
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm6
	; AVX1-NEXT: vblendvpd %ymm4, %ymm0, %ymm2, %ymm0			; AVX1-NEXT: vpcmpgtq %xmm7, %xmm6, %xmm9
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm0, %xmm10
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm1, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm1, %xmm4
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm4, %ymm2			; AVX1-NEXT: vblendvpd %xmm4, %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vblendvpd %ymm2, %ymm1, %ymm3, %ymm1			; AVX1-NEXT: vblendvpd %xmm10, %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm3
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm3			; AVX1-NEXT: vblendvpd %xmm9, %xmm6, %xmm7, %xmm3
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm2, %ymm2			; AVX1-NEXT: vblendvpd %xmm8, %xmm5, %xmm11, %xmm4
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm5
				; AVX1-NEXT: vblendvpd %xmm5, %xmm4, %xmm3, %xmm3
				; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX1-NEXT: vpcmpgtq %xmm3, %xmm0, %xmm1
				; AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v16i64:			; AVX2-LABEL: test_v16i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtq %ymm3, %ymm1, %ymm4			; AVX2-NEXT: vpcmpgtq %ymm3, %ymm1, %ymm4
	; AVX2-NEXT: vblendvpd %ymm4, %ymm1, %ymm3, %ymm1			; AVX2-NEXT: vblendvpd %ymm4, %ymm1, %ymm3, %ymm1
	▲ Show 20 Lines • Show All 1,379 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-smax.ll

	Show First 20 Lines • Show All 143 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v4i64:			; AVX1-LABEL: test_v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v4i64:			; AVX2-LABEL: test_v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2			; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2
	▲ Show 20 Lines • Show All 148 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pand %xmm4, %xmm0			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i64:			; AVX1-LABEL: test_v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm3
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm2, %ymm2			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm5
				; AVX1-NEXT: vblendvpd %xmm5, %xmm4, %xmm3, %xmm3
				; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX1-NEXT: vpcmpgtq %xmm3, %xmm0, %xmm1
				; AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v8i64:			; AVX2-LABEL: test_v8i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2			; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2
	; AVX2-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX2-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	▲ Show 20 Lines • Show All 261 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pand %xmm3, %xmm0			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i64:			; AVX1-LABEL: test_v16i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm11
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm11, %xmm5, %xmm8
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm0, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm7
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm6
	; AVX1-NEXT: vblendvpd %ymm4, %ymm0, %ymm2, %ymm0			; AVX1-NEXT: vpcmpgtq %xmm7, %xmm6, %xmm9
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm0, %xmm10
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm1, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm1, %xmm4
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm4, %ymm2			; AVX1-NEXT: vblendvpd %xmm4, %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vblendvpd %ymm2, %ymm1, %ymm3, %ymm1			; AVX1-NEXT: vblendvpd %xmm10, %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm3
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm3			; AVX1-NEXT: vblendvpd %xmm9, %xmm6, %xmm7, %xmm3
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm2, %ymm2			; AVX1-NEXT: vblendvpd %xmm8, %xmm5, %xmm11, %xmm4
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm5
				; AVX1-NEXT: vblendvpd %xmm5, %xmm4, %xmm3, %xmm3
				; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX1-NEXT: vpcmpgtq %xmm3, %xmm0, %xmm1
				; AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v16i64:			; AVX2-LABEL: test_v16i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtq %ymm3, %ymm1, %ymm4			; AVX2-NEXT: vpcmpgtq %ymm3, %ymm1, %ymm4
	; AVX2-NEXT: vblendvpd %ymm4, %ymm1, %ymm3, %ymm1			; AVX2-NEXT: vblendvpd %ymm4, %ymm1, %ymm3, %ymm1
	▲ Show 20 Lines • Show All 1,729 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-smin-widen.ll

	Show First 20 Lines • Show All 142 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v4i64:			; AVX1-LABEL: test_v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm3			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v4i64:			; AVX2-LABEL: test_v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2			; AVX2-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2
	▲ Show 20 Lines • Show All 150 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i64:			; AVX1-LABEL: test_v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm5
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2			; AVX1-NEXT: vblendvpd %xmm5, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm4, %xmm2, %xmm3, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm2, %ymm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v8i64:			; AVX2-LABEL: test_v8i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2			; AVX2-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2
	; AVX2-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX2-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	▲ Show 20 Lines • Show All 261 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pand %xmm3, %xmm0			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i64:			; AVX1-LABEL: test_v16i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm8
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm2, %xmm9
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm11
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm7
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4			; AVX1-NEXT: vpcmpgtq %xmm11, %xmm7, %xmm10
	; AVX1-NEXT: vblendvpd %ymm4, %ymm1, %ymm3, %ymm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm4, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm2, %xmm4			; AVX1-NEXT: vblendvpd %xmm6, %xmm5, %xmm4, %xmm4
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3			; AVX1-NEXT: vblendvpd %xmm10, %xmm11, %xmm7, %xmm5
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm6
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vblendvpd %xmm9, %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vblendvpd %xmm8, %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm3			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2			; AVX1-NEXT: vblendvpd %xmm6, %xmm4, %xmm5, %xmm1
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm2, %ymm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v16i64:			; AVX2-LABEL: test_v16i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtq %ymm0, %ymm2, %ymm4			; AVX2-NEXT: vpcmpgtq %ymm0, %ymm2, %ymm4
	; AVX2-NEXT: vblendvpd %ymm4, %ymm0, %ymm2, %ymm0			; AVX2-NEXT: vblendvpd %ymm4, %ymm0, %ymm2, %ymm0
	▲ Show 20 Lines • Show All 1,379 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-smin.ll

	Show First 20 Lines • Show All 142 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v4i64:			; AVX1-LABEL: test_v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm3			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v4i64:			; AVX2-LABEL: test_v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2			; AVX2-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2
	▲ Show 20 Lines • Show All 150 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i64:			; AVX1-LABEL: test_v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm5
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2			; AVX1-NEXT: vblendvpd %xmm5, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm4, %xmm2, %xmm3, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm2, %ymm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v8i64:			; AVX2-LABEL: test_v8i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2			; AVX2-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2
	; AVX2-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX2-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	▲ Show 20 Lines • Show All 261 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pand %xmm3, %xmm0			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i64:			; AVX1-LABEL: test_v16i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm8
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm2, %xmm9
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm11
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm7
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4			; AVX1-NEXT: vpcmpgtq %xmm11, %xmm7, %xmm10
	; AVX1-NEXT: vblendvpd %ymm4, %ymm1, %ymm3, %ymm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm4, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm2, %xmm4			; AVX1-NEXT: vblendvpd %xmm6, %xmm5, %xmm4, %xmm4
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3			; AVX1-NEXT: vblendvpd %xmm10, %xmm11, %xmm7, %xmm5
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm6
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vblendvpd %xmm9, %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vblendvpd %xmm8, %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm3			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2			; AVX1-NEXT: vblendvpd %xmm6, %xmm4, %xmm5, %xmm1
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm2, %ymm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v16i64:			; AVX2-LABEL: test_v16i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtq %ymm0, %ymm2, %ymm4			; AVX2-NEXT: vpcmpgtq %ymm0, %ymm2, %ymm4
	; AVX2-NEXT: vblendvpd %ymm4, %ymm0, %ymm2, %ymm0			; AVX2-NEXT: vblendvpd %ymm4, %ymm0, %ymm2, %ymm0
	▲ Show 20 Lines • Show All 1,729 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-umax-widen.ll

	Show First 20 Lines • Show All 149 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v4i64:			; AVX1-LABEL: test_v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm4			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm3			; AVX1-NEXT: vblendvpd %xmm3, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vxorpd %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vxorpd %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vxorpd %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vxorpd %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v4i64:			; AVX2-LABEL: test_v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 153 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pand %xmm4, %xmm0			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i64:			; AVX1-LABEL: test_v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm4, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm4, %xmm5
	; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
	; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm5			; AVX1-NEXT: vpxor %xmm2, %xmm6, %xmm7
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm5
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm4, %ymm2			; AVX1-NEXT: vblendvpd %xmm5, %xmm6, %xmm4, %xmm4
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vxorpd %xmm2, %xmm4, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vblendvpd %xmm3, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm2			; AVX1-NEXT: vxorpd %xmm2, %xmm0, %xmm1
	; AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm4			; AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm4, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm2, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm4, %ymm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm2			; AVX1-NEXT: vxorpd %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vxorpd %xmm3, %xmm1, %xmm3			; AVX1-NEXT: vxorpd %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v8i64:			; AVX2-LABEL: test_v8i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %ymm2, %ymm1, %ymm3			; AVX2-NEXT: vpxor %ymm2, %ymm1, %ymm3
	▲ Show 20 Lines • Show All 268 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pand %xmm3, %xmm0			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i64:			; AVX1-LABEL: test_v16i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm8
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vpxor %xmm4, %xmm5, %xmm5			; AVX1-NEXT: vpxor %xmm4, %xmm8, %xmm6
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm10
	; AVX1-NEXT: vpxor %xmm4, %xmm6, %xmm6			; AVX1-NEXT: vpxor %xmm4, %xmm10, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm9
				; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm11
				; AVX1-NEXT: vpxor %xmm4, %xmm11, %xmm5
				; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm7
				; AVX1-NEXT: vpxor %xmm4, %xmm7, %xmm6
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm12
	; AVX1-NEXT: vpxor %xmm4, %xmm2, %xmm6			; AVX1-NEXT: vpxor %xmm4, %xmm2, %xmm6
	; AVX1-NEXT: vpxor %xmm4, %xmm0, %xmm7			; AVX1-NEXT: vpxor %xmm4, %xmm0, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm7, %xmm6			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm13
	; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm5			; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm6
	; AVX1-NEXT: vblendvpd %ymm5, %ymm0, %ymm2, %ymm0			; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm5
	; AVX1-NEXT: vpxor %xmm4, %xmm2, %xmm2			; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5
	; AVX1-NEXT: vpxor %xmm4, %xmm5, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm5, %xmm2
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm5
	; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm5, %ymm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm1, %ymm3, %ymm1
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vpxor %xmm4, %xmm2, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vxorpd %xmm4, %xmm1, %xmm3			; AVX1-NEXT: vxorpd %xmm4, %xmm1, %xmm3
	; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm5			; AVX1-NEXT: vblendvpd %xmm13, %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm12, %xmm7, %xmm11, %xmm3
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vxorpd %xmm4, %xmm3, %xmm5
	; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm2			; AVX1-NEXT: vblendvpd %xmm9, %xmm10, %xmm8, %xmm6
	; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm3			; AVX1-NEXT: vxorpd %xmm4, %xmm6, %xmm7
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm2, %xmm2			; AVX1-NEXT: vblendvpd %xmm5, %xmm6, %xmm3, %xmm3
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2			; AVX1-NEXT: vxorpd %xmm4, %xmm3, %xmm5
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm1
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm1, %xmm1
				; AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm2			; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm2
	; AVX1-NEXT: vxorpd %xmm4, %xmm1, %xmm3			; AVX1-NEXT: vxorpd %xmm4, %xmm1, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v16i64:			; AVX2-LABEL: test_v16i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm4 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm4 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %ymm4, %ymm2, %ymm5			; AVX2-NEXT: vpxor %ymm4, %ymm2, %ymm5
	▲ Show 20 Lines • Show All 1,535 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-umax.ll

	Show First 20 Lines • Show All 149 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v4i64:			; AVX1-LABEL: test_v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm4			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm3			; AVX1-NEXT: vblendvpd %xmm3, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vxorpd %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vxorpd %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vxorpd %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vxorpd %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v4i64:			; AVX2-LABEL: test_v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 153 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pand %xmm4, %xmm0			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i64:			; AVX1-LABEL: test_v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm4, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm4, %xmm5
	; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
	; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm5			; AVX1-NEXT: vpxor %xmm2, %xmm6, %xmm7
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm5
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm4, %ymm2			; AVX1-NEXT: vblendvpd %xmm5, %xmm6, %xmm4, %xmm4
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vxorpd %xmm2, %xmm4, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vblendvpd %xmm3, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm2			; AVX1-NEXT: vxorpd %xmm2, %xmm0, %xmm1
	; AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm4			; AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm4, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm2, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm4, %ymm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm2			; AVX1-NEXT: vxorpd %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vxorpd %xmm3, %xmm1, %xmm3			; AVX1-NEXT: vxorpd %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v8i64:			; AVX2-LABEL: test_v8i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %ymm2, %ymm1, %ymm3			; AVX2-NEXT: vpxor %ymm2, %ymm1, %ymm3
	▲ Show 20 Lines • Show All 268 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pand %xmm3, %xmm0			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i64:			; AVX1-LABEL: test_v16i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm8
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vpxor %xmm4, %xmm5, %xmm5			; AVX1-NEXT: vpxor %xmm4, %xmm8, %xmm6
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm10
	; AVX1-NEXT: vpxor %xmm4, %xmm6, %xmm6			; AVX1-NEXT: vpxor %xmm4, %xmm10, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm9
				; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm11
				; AVX1-NEXT: vpxor %xmm4, %xmm11, %xmm5
				; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm7
				; AVX1-NEXT: vpxor %xmm4, %xmm7, %xmm6
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm12
	; AVX1-NEXT: vpxor %xmm4, %xmm2, %xmm6			; AVX1-NEXT: vpxor %xmm4, %xmm2, %xmm6
	; AVX1-NEXT: vpxor %xmm4, %xmm0, %xmm7			; AVX1-NEXT: vpxor %xmm4, %xmm0, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm7, %xmm6			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm13
	; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm5			; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm6
	; AVX1-NEXT: vblendvpd %ymm5, %ymm0, %ymm2, %ymm0			; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm5
	; AVX1-NEXT: vpxor %xmm4, %xmm2, %xmm2			; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5
	; AVX1-NEXT: vpxor %xmm4, %xmm5, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm5, %xmm2
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm5
	; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm5, %ymm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm1, %ymm3, %ymm1
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vpxor %xmm4, %xmm2, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vxorpd %xmm4, %xmm1, %xmm3			; AVX1-NEXT: vxorpd %xmm4, %xmm1, %xmm3
	; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm5			; AVX1-NEXT: vblendvpd %xmm13, %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm12, %xmm7, %xmm11, %xmm3
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vxorpd %xmm4, %xmm3, %xmm5
	; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm2			; AVX1-NEXT: vblendvpd %xmm9, %xmm10, %xmm8, %xmm6
	; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm3			; AVX1-NEXT: vxorpd %xmm4, %xmm6, %xmm7
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm2, %xmm2			; AVX1-NEXT: vblendvpd %xmm5, %xmm6, %xmm3, %xmm3
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2			; AVX1-NEXT: vxorpd %xmm4, %xmm3, %xmm5
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm1
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm1, %xmm1
				; AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm2			; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm2
	; AVX1-NEXT: vxorpd %xmm4, %xmm1, %xmm3			; AVX1-NEXT: vxorpd %xmm4, %xmm1, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v16i64:			; AVX2-LABEL: test_v16i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm4 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm4 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %ymm4, %ymm2, %ymm5			; AVX2-NEXT: vpxor %ymm4, %ymm2, %ymm5
	▲ Show 20 Lines • Show All 1,775 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-umin-widen.ll

	Show First 20 Lines • Show All 144 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pand %xmm5, %xmm0			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v4i64:			; AVX1-LABEL: test_v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vpxor %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm4			; AVX1-NEXT: vpxor %xmm1, %xmm3, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm4			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm3, %ymm3			; AVX1-NEXT: vpermilps {{.*#+}} xmm2 = xmm0[2,3,0,1]
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vxorpd %xmm1, %xmm0, %xmm3
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vxorpd %xmm1, %xmm2, %xmm1
	; AVX1-NEXT: vxorpd %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm1, %xmm1
	; AVX1-NEXT: vxorpd %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v4i64:			; AVX2-LABEL: test_v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 155 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i64:			; AVX1-LABEL: test_v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5
	; AVX1-NEXT: vpxor %xmm3, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm3, %xmm5, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm4
	; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm4			; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm6
	; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm5			; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm7
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm7, %xmm6
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm4, %ymm2			; AVX1-NEXT: vblendvpd %xmm6, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vblendvpd %xmm4, %xmm2, %xmm5, %xmm2
	; AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm2			; AVX1-NEXT: vxorpd %xmm3, %xmm2, %xmm4
	; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2			; AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm4
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm2, %ymm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm2			; AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm2
	; AVX1-NEXT: vxorpd %xmm3, %xmm1, %xmm3			; AVX1-NEXT: vxorpd %xmm3, %xmm1, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v8i64:			; AVX2-LABEL: test_v8i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %ymm2, %ymm0, %ymm3			; AVX2-NEXT: vpxor %ymm2, %ymm0, %ymm3
	▲ Show 20 Lines • Show All 268 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pand %xmm3, %xmm0			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i64:			; AVX1-LABEL: test_v16i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vpxor %xmm4, %xmm5, %xmm5			; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm6			; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm6
	; AVX1-NEXT: vpxor %xmm4, %xmm6, %xmm6			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm8
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5			; AVX1-NEXT: vpxor %xmm4, %xmm0, %xmm6
	; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm6			; AVX1-NEXT: vpxor %xmm4, %xmm2, %xmm7
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm7			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm7, %xmm9
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm7, %xmm6			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm12
	; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm5			; AVX1-NEXT: vpxor %xmm4, %xmm12, %xmm10
	; AVX1-NEXT: vblendvpd %ymm5, %ymm1, %ymm3, %ymm1			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm13
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpxor %xmm4, %xmm13, %xmm5
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm10, %xmm5, %xmm10
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vpxor %xmm4, %xmm5, %xmm5			; AVX1-NEXT: vpxor %xmm4, %xmm5, %xmm11
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm7
	; AVX1-NEXT: vpxor %xmm4, %xmm0, %xmm5			; AVX1-NEXT: vpxor %xmm4, %xmm7, %xmm6
	; AVX1-NEXT: vpxor %xmm4, %xmm2, %xmm6			; AVX1-NEXT: vpcmpgtq %xmm11, %xmm6, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5			; AVX1-NEXT: vblendvpd %xmm6, %xmm5, %xmm7, %xmm5
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3			; AVX1-NEXT: vxorpd %xmm4, %xmm5, %xmm11
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0			; AVX1-NEXT: vblendvpd %xmm10, %xmm12, %xmm13, %xmm7
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vxorpd %xmm4, %xmm7, %xmm6
	; AVX1-NEXT: vpxor %xmm4, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm11, %xmm6, %xmm6
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vblendvpd %xmm9, %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm3
	; AVX1-NEXT: vxorpd %xmm4, %xmm1, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm2			; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm2
	; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm3			; AVX1-NEXT: vblendvpd %xmm8, %xmm1, %xmm3, %xmm1
				; AVX1-NEXT: vxorpd %xmm4, %xmm1, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm2, %ymm2			; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm1
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm6, %xmm5, %xmm7, %xmm2
				; AVX1-NEXT: vxorpd %xmm4, %xmm2, %xmm3
				; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm1
				; AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm2			; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm2
	; AVX1-NEXT: vxorpd %xmm4, %xmm1, %xmm3			; AVX1-NEXT: vxorpd %xmm4, %xmm1, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v16i64:			; AVX2-LABEL: test_v16i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm4 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm4 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %ymm4, %ymm1, %ymm5			; AVX2-NEXT: vpxor %ymm4, %ymm1, %ymm5
	▲ Show 20 Lines • Show All 1,341 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-umin.ll

	Show First 20 Lines • Show All 144 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pand %xmm5, %xmm0			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v4i64:			; AVX1-LABEL: test_v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vpxor %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm4			; AVX1-NEXT: vpxor %xmm1, %xmm3, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm4			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm3, %ymm3			; AVX1-NEXT: vpermilps {{.*#+}} xmm2 = xmm0[2,3,0,1]
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vxorpd %xmm1, %xmm0, %xmm3
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vxorpd %xmm1, %xmm2, %xmm1
	; AVX1-NEXT: vxorpd %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm1, %xmm1
	; AVX1-NEXT: vxorpd %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v4i64:			; AVX2-LABEL: test_v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 155 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i64:			; AVX1-LABEL: test_v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5
	; AVX1-NEXT: vpxor %xmm3, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm3, %xmm5, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm4
	; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm4			; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm6
	; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm5			; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm7
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm7, %xmm6
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm4, %ymm2			; AVX1-NEXT: vblendvpd %xmm6, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vblendvpd %xmm4, %xmm2, %xmm5, %xmm2
	; AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm2			; AVX1-NEXT: vxorpd %xmm3, %xmm2, %xmm4
	; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2			; AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm4
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm2, %ymm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm2			; AVX1-NEXT: vxorpd %xmm3, %xmm0, %xmm2
	; AVX1-NEXT: vxorpd %xmm3, %xmm1, %xmm3			; AVX1-NEXT: vxorpd %xmm3, %xmm1, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v8i64:			; AVX2-LABEL: test_v8i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %ymm2, %ymm0, %ymm3			; AVX2-NEXT: vpxor %ymm2, %ymm0, %ymm3
	▲ Show 20 Lines • Show All 268 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pand %xmm3, %xmm0			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i64:			; AVX1-LABEL: test_v16i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vpxor %xmm4, %xmm5, %xmm5			; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm6			; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm6
	; AVX1-NEXT: vpxor %xmm4, %xmm6, %xmm6			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm8
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5			; AVX1-NEXT: vpxor %xmm4, %xmm0, %xmm6
	; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm6			; AVX1-NEXT: vpxor %xmm4, %xmm2, %xmm7
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm7			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm7, %xmm9
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm7, %xmm6			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm12
	; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm5			; AVX1-NEXT: vpxor %xmm4, %xmm12, %xmm10
	; AVX1-NEXT: vblendvpd %ymm5, %ymm1, %ymm3, %ymm1			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm13
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpxor %xmm4, %xmm13, %xmm5
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm10, %xmm5, %xmm10
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vpxor %xmm4, %xmm5, %xmm5			; AVX1-NEXT: vpxor %xmm4, %xmm5, %xmm11
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm7
	; AVX1-NEXT: vpxor %xmm4, %xmm0, %xmm5			; AVX1-NEXT: vpxor %xmm4, %xmm7, %xmm6
	; AVX1-NEXT: vpxor %xmm4, %xmm2, %xmm6			; AVX1-NEXT: vpcmpgtq %xmm11, %xmm6, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5			; AVX1-NEXT: vblendvpd %xmm6, %xmm5, %xmm7, %xmm5
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3			; AVX1-NEXT: vxorpd %xmm4, %xmm5, %xmm11
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0			; AVX1-NEXT: vblendvpd %xmm10, %xmm12, %xmm13, %xmm7
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vxorpd %xmm4, %xmm7, %xmm6
	; AVX1-NEXT: vpxor %xmm4, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm11, %xmm6, %xmm6
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vblendvpd %xmm9, %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm3
	; AVX1-NEXT: vxorpd %xmm4, %xmm1, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm2			; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm2
	; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm3			; AVX1-NEXT: vblendvpd %xmm8, %xmm1, %xmm3, %xmm1
				; AVX1-NEXT: vxorpd %xmm4, %xmm1, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm2, %ymm2			; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm1
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm6, %xmm5, %xmm7, %xmm2
				; AVX1-NEXT: vxorpd %xmm4, %xmm2, %xmm3
				; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm1
				; AVX1-NEXT: vblendvpd %xmm1, %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm2			; AVX1-NEXT: vxorpd %xmm4, %xmm0, %xmm2
	; AVX1-NEXT: vxorpd %xmm4, %xmm1, %xmm3			; AVX1-NEXT: vxorpd %xmm4, %xmm1, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v16i64:			; AVX2-LABEL: test_v16i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm4 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm4 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %ymm4, %ymm1, %ymm5			; AVX2-NEXT: vpxor %ymm4, %ymm1, %ymm5
	▲ Show 20 Lines • Show All 1,581 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-trunc-packus-widen.ll

	Show First 20 Lines • Show All 175 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]
	; SSE41-NEXT: movaps %xmm1, %xmm0			; SSE41-NEXT: movaps %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v4i64_v4i32:			; AVX1-LABEL: trunc_packus_v4i64_v4i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm1 = [4294967295,4294967295,4294967295,4294967295]			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [4294967295,4294967295]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [4294967295,4294967295]			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm2, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm2, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm3			; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2			; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm5
	; AVX1-NEXT: vxorpd %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vblendvpd %xmm3, %xmm1, %xmm2, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpand %xmm1, %xmm2, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm1			; AVX1-NEXT: vpand %xmm0, %xmm5, %xmm0
	; AVX1-NEXT: vpand %xmm3, %xmm1, %xmm1
	; AVX1-NEXT: vpand %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[0,2]			; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[0,2]
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-SLOW-LABEL: trunc_packus_v4i64_v4i32:			; AVX2-SLOW-LABEL: trunc_packus_v4i64_v4i32:
	; AVX2-SLOW: # %bb.0:			; AVX2-SLOW: # %bb.0:
	; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm1 = [4294967295,4294967295,4294967295,4294967295]			; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm1 = [4294967295,4294967295,4294967295,4294967295]
	; AVX2-SLOW-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2			; AVX2-SLOW-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2
	▲ Show 20 Lines • Show All 373 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2
	; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm3[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm3[0,2]
	; SSE41-NEXT: movaps %xmm2, %xmm0			; SSE41-NEXT: movaps %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v8i64_v8i32:			; AVX1-LABEL: trunc_packus_v8i64_v8i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [4294967295,4294967295,4294967295,4294967295]			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [4294967295,4294967295]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [4294967295,4294967295]			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm8
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm3, %xmm7
	; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm9
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3			; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm3, %xmm6
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm7
	; AVX1-NEXT: vxorpd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vblendvpd %xmm8, %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm5			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm2, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm1, %xmm6			; AVX1-NEXT: vpand %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm7			; AVX1-NEXT: vpand %xmm1, %xmm5, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm7, %xmm2
	; AVX1-NEXT: vpand %xmm7, %xmm2, %xmm2
	; AVX1-NEXT: vpand %xmm1, %xmm6, %xmm1
	; AVX1-NEXT: vshufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]			; AVX1-NEXT: vshufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]
	; AVX1-NEXT: vpand %xmm4, %xmm5, %xmm2			; AVX1-NEXT: vpand %xmm6, %xmm7, %xmm2
	; AVX1-NEXT: vpand %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vpand %xmm0, %xmm9, %xmm0
	; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm2[0,2]			; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm2[0,2]
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-SLOW-LABEL: trunc_packus_v8i64_v8i32:			; AVX2-SLOW-LABEL: trunc_packus_v8i64_v8i32:
	; AVX2-SLOW: # %bb.0:			; AVX2-SLOW: # %bb.0:
	; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm2 = [4294967295,4294967295,4294967295,4294967295]			; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm2 = [4294967295,4294967295,4294967295,4294967295]
	; AVX2-SLOW-NEXT: vpcmpgtq %ymm1, %ymm2, %ymm3			; AVX2-SLOW-NEXT: vpcmpgtq %ymm1, %ymm2, %ymm3
	▲ Show 20 Lines • Show All 373 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3
	; SSE41-NEXT: packusdw %xmm4, %xmm3			; SSE41-NEXT: packusdw %xmm4, %xmm3
	; SSE41-NEXT: packusdw %xmm3, %xmm1			; SSE41-NEXT: packusdw %xmm3, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v8i64_v8i16:			; AVX1-LABEL: trunc_packus_v8i64_v8i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [65535,65535,65535,65535]			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [65535,65535]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [65535,65535]			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm8
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm3, %xmm7
	; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm9
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3			; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm3, %xmm6
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm7
	; AVX1-NEXT: vxorpd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vblendvpd %xmm8, %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm5			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm2, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm1, %xmm6			; AVX1-NEXT: vpand %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm7			; AVX1-NEXT: vpand %xmm1, %xmm5, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm7, %xmm2
	; AVX1-NEXT: vpand %xmm7, %xmm2, %xmm2
	; AVX1-NEXT: vpand %xmm1, %xmm6, %xmm1
	; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpand %xmm4, %xmm5, %xmm2			; AVX1-NEXT: vpand %xmm6, %xmm7, %xmm2
	; AVX1-NEXT: vpand %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vpand %xmm0, %xmm9, %xmm0
	; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: trunc_packus_v8i64_v8i16:			; AVX2-LABEL: trunc_packus_v8i64_v8i16:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [65535,65535,65535,65535]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [65535,65535,65535,65535]
	▲ Show 20 Lines • Show All 595 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: packusdw %xmm4, %xmm3			; SSE41-NEXT: packusdw %xmm4, %xmm3
	; SSE41-NEXT: packusdw %xmm3, %xmm1			; SSE41-NEXT: packusdw %xmm3, %xmm1
	; SSE41-NEXT: packuswb %xmm1, %xmm1			; SSE41-NEXT: packuswb %xmm1, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v8i64_v8i8:			; AVX1-LABEL: trunc_packus_v8i64_v8i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [255,255,255,255]			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [255,255]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [255,255]			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm8
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm3, %xmm7
	; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm9
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3			; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm3, %xmm6
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm7
	; AVX1-NEXT: vxorpd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vblendvpd %xmm8, %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm5			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm2, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm1, %xmm6			; AVX1-NEXT: vpand %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm7			; AVX1-NEXT: vpand %xmm1, %xmm5, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm7, %xmm2
	; AVX1-NEXT: vpand %xmm7, %xmm2, %xmm2
	; AVX1-NEXT: vpand %xmm1, %xmm6, %xmm1
	; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpand %xmm4, %xmm5, %xmm2			; AVX1-NEXT: vpand %xmm6, %xmm7, %xmm2
	; AVX1-NEXT: vpand %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vpand %xmm0, %xmm9, %xmm0
	; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpackuswb %xmm0, %xmm0, %xmm0			; AVX1-NEXT: vpackuswb %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: trunc_packus_v8i64_v8i8:			; AVX2-LABEL: trunc_packus_v8i64_v8i8:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	▲ Show 20 Lines • Show All 351 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: packusdw %xmm3, %xmm1			; SSE41-NEXT: packusdw %xmm3, %xmm1
	; SSE41-NEXT: packusdw %xmm1, %xmm4			; SSE41-NEXT: packusdw %xmm1, %xmm4
	; SSE41-NEXT: packuswb %xmm4, %xmm4			; SSE41-NEXT: packuswb %xmm4, %xmm4
	; SSE41-NEXT: movq %xmm4, (%rdi)			; SSE41-NEXT: movq %xmm4, (%rdi)
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v8i64_v8i8_store:			; AVX1-LABEL: trunc_packus_v8i64_v8i8_store:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [255,255,255,255]			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [255,255]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [255,255]			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm8
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm3, %xmm7
	; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm9
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3			; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm3, %xmm6
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm7
	; AVX1-NEXT: vxorpd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vblendvpd %xmm8, %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm5			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm2, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm1, %xmm6			; AVX1-NEXT: vpand %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm7			; AVX1-NEXT: vpand %xmm1, %xmm5, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm7, %xmm2
	; AVX1-NEXT: vpand %xmm7, %xmm2, %xmm2
	; AVX1-NEXT: vpand %xmm1, %xmm6, %xmm1
	; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpand %xmm4, %xmm5, %xmm2			; AVX1-NEXT: vpand %xmm6, %xmm7, %xmm2
	; AVX1-NEXT: vpand %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vpand %xmm0, %xmm9, %xmm0
	; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpackuswb %xmm0, %xmm0, %xmm0			; AVX1-NEXT: vpackuswb %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vmovq %xmm0, (%rdi)			; AVX1-NEXT: vmovq %xmm0, (%rdi)
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: trunc_packus_v8i64_v8i8_store:			; AVX2-LABEL: trunc_packus_v8i64_v8i8_store:
	▲ Show 20 Lines • Show All 640 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: packusdw %xmm4, %xmm2			; SSE41-NEXT: packusdw %xmm4, %xmm2
	; SSE41-NEXT: packusdw %xmm2, %xmm3			; SSE41-NEXT: packusdw %xmm2, %xmm3
	; SSE41-NEXT: packuswb %xmm3, %xmm1			; SSE41-NEXT: packuswb %xmm3, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v16i64_v16i8:			; AVX1-LABEL: trunc_packus_v16i64_v16i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm4 = [255,255,255,255]			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm8
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5			; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [255,255]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [255,255]			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm9
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm6, %xmm7
	; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm7, %ymm5
	; AVX1-NEXT: vblendvpd %ymm5, %ymm3, %ymm4, %ymm15
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm6, %xmm7
	; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm7, %ymm5
	; AVX1-NEXT: vblendvpd %ymm5, %ymm2, %ymm4, %ymm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm6, %xmm7
	; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm7, %ymm5
	; AVX1-NEXT: vblendvpd %ymm5, %ymm1, %ymm4, %ymm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm6, %xmm6
	; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm5
	; AVX1-NEXT: vblendvpd %ymm5, %ymm0, %ymm4, %ymm0
	; AVX1-NEXT: vxorpd %xmm4, %xmm4, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm8
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm14
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm14, %xmm9
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm10
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm7			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm7
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm7, %xmm11			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm2, %xmm12			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm5, %xmm6
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm5			; AVX1-NEXT: vblendvpd %xmm6, %xmm0, %xmm5, %xmm10
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm13			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm15, %xmm6			; AVX1-NEXT: vblendvpd %xmm6, %xmm4, %xmm5, %xmm11
	; AVX1-NEXT: vextractf128 $1, %ymm15, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm5, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm4			; AVX1-NEXT: vblendvpd %xmm6, %xmm1, %xmm5, %xmm1
				; AVX1-NEXT: vpcmpgtq %xmm7, %xmm5, %xmm6
				; AVX1-NEXT: vblendvpd %xmm6, %xmm7, %xmm5, %xmm6
				; AVX1-NEXT: vpcmpgtq %xmm2, %xmm5, %xmm7
				; AVX1-NEXT: vblendvpd %xmm7, %xmm2, %xmm5, %xmm2
				; AVX1-NEXT: vpcmpgtq %xmm9, %xmm5, %xmm7
				; AVX1-NEXT: vblendvpd %xmm7, %xmm9, %xmm5, %xmm7
				; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm0
				; AVX1-NEXT: vblendvpd %xmm0, %xmm3, %xmm5, %xmm0
				; AVX1-NEXT: vpcmpgtq %xmm8, %xmm5, %xmm3
				; AVX1-NEXT: vblendvpd %xmm3, %xmm8, %xmm5, %xmm3
				; AVX1-NEXT: vpxor %xmm5, %xmm5, %xmm5
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm3, %xmm4
	; AVX1-NEXT: vpand %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpand %xmm3, %xmm4, %xmm3
	; AVX1-NEXT: vpand %xmm15, %xmm6, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm0, %xmm4
	; AVX1-NEXT: vpackusdw %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpand %xmm0, %xmm4, %xmm0
	; AVX1-NEXT: vpand %xmm5, %xmm13, %xmm4
	; AVX1-NEXT: vpand %xmm2, %xmm12, %xmm2
	; AVX1-NEXT: vpackusdw %xmm4, %xmm2, %xmm2
	; AVX1-NEXT: vpackusdw %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpand %xmm7, %xmm11, %xmm3
	; AVX1-NEXT: vpand %xmm1, %xmm10, %xmm1
	; AVX1-NEXT: vpackusdw %xmm3, %xmm1, %xmm1
	; AVX1-NEXT: vpand %xmm14, %xmm9, %xmm3
	; AVX1-NEXT: vpand %xmm0, %xmm8, %xmm0
	; AVX1-NEXT: vpackusdw %xmm3, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm3, %xmm0, %xmm0
	; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm3
	; AVX1-NEXT: vpackuswb %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpand %xmm7, %xmm3, %xmm3
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm2, %xmm4
				; AVX1-NEXT: vpand %xmm2, %xmm4, %xmm2
				; AVX1-NEXT: vpackusdw %xmm3, %xmm2, %xmm2
				; AVX1-NEXT: vpackusdw %xmm0, %xmm2, %xmm0
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm2
				; AVX1-NEXT: vpand %xmm6, %xmm2, %xmm2
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm1, %xmm3
				; AVX1-NEXT: vpand %xmm1, %xmm3, %xmm1
				; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm11, %xmm2
				; AVX1-NEXT: vpand %xmm11, %xmm2, %xmm2
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm10, %xmm3
				; AVX1-NEXT: vpand %xmm10, %xmm3, %xmm3
				; AVX1-NEXT: vpackusdw %xmm2, %xmm3, %xmm2
				; AVX1-NEXT: vpackusdw %xmm1, %xmm2, %xmm1
				; AVX1-NEXT: vpackuswb %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: trunc_packus_v16i64_v16i8:			; AVX2-LABEL: trunc_packus_v16i64_v16i8:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm4 = [255,255,255,255]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm4 = [255,255,255,255]
	; AVX2-NEXT: vpcmpgtq %ymm2, %ymm4, %ymm5			; AVX2-NEXT: vpcmpgtq %ymm2, %ymm4, %ymm5
	; AVX2-NEXT: vblendvpd %ymm5, %ymm2, %ymm4, %ymm2			; AVX2-NEXT: vblendvpd %ymm5, %ymm2, %ymm4, %ymm2
	▲ Show 20 Lines • Show All 368 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-trunc-packus.ll

	Show First 20 Lines • Show All 175 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]
	; SSE41-NEXT: movaps %xmm1, %xmm0			; SSE41-NEXT: movaps %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v4i64_v4i32:			; AVX1-LABEL: trunc_packus_v4i64_v4i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm1 = [4294967295,4294967295,4294967295,4294967295]			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [4294967295,4294967295]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [4294967295,4294967295]			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm2, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm2, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm3			; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2			; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm5
	; AVX1-NEXT: vxorpd %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vblendvpd %xmm3, %xmm1, %xmm2, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpand %xmm1, %xmm2, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm1			; AVX1-NEXT: vpand %xmm0, %xmm5, %xmm0
	; AVX1-NEXT: vpand %xmm3, %xmm1, %xmm1
	; AVX1-NEXT: vpand %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[0,2]			; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[0,2]
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-SLOW-LABEL: trunc_packus_v4i64_v4i32:			; AVX2-SLOW-LABEL: trunc_packus_v4i64_v4i32:
	; AVX2-SLOW: # %bb.0:			; AVX2-SLOW: # %bb.0:
	; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm1 = [4294967295,4294967295,4294967295,4294967295]			; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm1 = [4294967295,4294967295,4294967295,4294967295]
	; AVX2-SLOW-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2			; AVX2-SLOW-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2
	▲ Show 20 Lines • Show All 373 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2
	; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm3[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm3[0,2]
	; SSE41-NEXT: movaps %xmm2, %xmm0			; SSE41-NEXT: movaps %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v8i64_v8i32:			; AVX1-LABEL: trunc_packus_v8i64_v8i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [4294967295,4294967295,4294967295,4294967295]			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [4294967295,4294967295]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [4294967295,4294967295]			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm8
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm3, %xmm7
	; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm9
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3			; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm3, %xmm6
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm7
	; AVX1-NEXT: vxorpd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vblendvpd %xmm8, %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm5			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm2, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm1, %xmm6			; AVX1-NEXT: vpand %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm7			; AVX1-NEXT: vpand %xmm1, %xmm5, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm7, %xmm2
	; AVX1-NEXT: vpand %xmm7, %xmm2, %xmm2
	; AVX1-NEXT: vpand %xmm1, %xmm6, %xmm1
	; AVX1-NEXT: vshufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]			; AVX1-NEXT: vshufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]
	; AVX1-NEXT: vpand %xmm4, %xmm5, %xmm2			; AVX1-NEXT: vpand %xmm6, %xmm7, %xmm2
	; AVX1-NEXT: vpand %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vpand %xmm0, %xmm9, %xmm0
	; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm2[0,2]			; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm2[0,2]
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-SLOW-LABEL: trunc_packus_v8i64_v8i32:			; AVX2-SLOW-LABEL: trunc_packus_v8i64_v8i32:
	; AVX2-SLOW: # %bb.0:			; AVX2-SLOW: # %bb.0:
	; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm2 = [4294967295,4294967295,4294967295,4294967295]			; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm2 = [4294967295,4294967295,4294967295,4294967295]
	; AVX2-SLOW-NEXT: vpcmpgtq %ymm1, %ymm2, %ymm3			; AVX2-SLOW-NEXT: vpcmpgtq %ymm1, %ymm2, %ymm3
	▲ Show 20 Lines • Show All 373 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3
	; SSE41-NEXT: packusdw %xmm4, %xmm3			; SSE41-NEXT: packusdw %xmm4, %xmm3
	; SSE41-NEXT: packusdw %xmm3, %xmm1			; SSE41-NEXT: packusdw %xmm3, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v8i64_v8i16:			; AVX1-LABEL: trunc_packus_v8i64_v8i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [65535,65535,65535,65535]			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [65535,65535]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [65535,65535]			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm8
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm3, %xmm7
	; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm9
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3			; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm3, %xmm6
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm7
	; AVX1-NEXT: vxorpd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vblendvpd %xmm8, %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm5			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm2, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm1, %xmm6			; AVX1-NEXT: vpand %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm7			; AVX1-NEXT: vpand %xmm1, %xmm5, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm7, %xmm2
	; AVX1-NEXT: vpand %xmm7, %xmm2, %xmm2
	; AVX1-NEXT: vpand %xmm1, %xmm6, %xmm1
	; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpand %xmm4, %xmm5, %xmm2			; AVX1-NEXT: vpand %xmm6, %xmm7, %xmm2
	; AVX1-NEXT: vpand %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vpand %xmm0, %xmm9, %xmm0
	; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: trunc_packus_v8i64_v8i16:			; AVX2-LABEL: trunc_packus_v8i64_v8i16:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [65535,65535,65535,65535]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [65535,65535,65535,65535]
	▲ Show 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3
	; SSE41-NEXT: packusdw %xmm4, %xmm3			; SSE41-NEXT: packusdw %xmm4, %xmm3
	; SSE41-NEXT: packusdw %xmm3, %xmm1			; SSE41-NEXT: packusdw %xmm3, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v8i64_v8i8:			; AVX1-LABEL: trunc_packus_v8i64_v8i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [255,255,255,255]			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [255,255]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [255,255]			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm8
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm3, %xmm7
	; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm9
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3			; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm3, %xmm6
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm7
	; AVX1-NEXT: vxorpd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vblendvpd %xmm8, %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm5			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm2, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm1, %xmm6			; AVX1-NEXT: vpand %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm7			; AVX1-NEXT: vpand %xmm1, %xmm5, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm7, %xmm2
	; AVX1-NEXT: vpand %xmm7, %xmm2, %xmm2
	; AVX1-NEXT: vpand %xmm1, %xmm6, %xmm1
	; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpand %xmm4, %xmm5, %xmm2			; AVX1-NEXT: vpand %xmm6, %xmm7, %xmm2
	; AVX1-NEXT: vpand %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vpand %xmm0, %xmm9, %xmm0
	; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: trunc_packus_v8i64_v8i8:			; AVX2-LABEL: trunc_packus_v8i64_v8i8:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [255,255,255,255]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [255,255,255,255]
	▲ Show 20 Lines • Show All 343 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: packusdw %xmm3, %xmm1			; SSE41-NEXT: packusdw %xmm3, %xmm1
	; SSE41-NEXT: packusdw %xmm1, %xmm4			; SSE41-NEXT: packusdw %xmm1, %xmm4
	; SSE41-NEXT: packuswb %xmm4, %xmm4			; SSE41-NEXT: packuswb %xmm4, %xmm4
	; SSE41-NEXT: movq %xmm4, (%rdi)			; SSE41-NEXT: movq %xmm4, (%rdi)
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v8i64_v8i8_store:			; AVX1-LABEL: trunc_packus_v8i64_v8i8_store:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [255,255,255,255]			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [255,255]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [255,255]			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm8
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm3, %xmm7
	; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm9
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3			; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm3, %xmm6
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm7
	; AVX1-NEXT: vxorpd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vblendvpd %xmm8, %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm5			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm2, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm1, %xmm6			; AVX1-NEXT: vpand %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm7			; AVX1-NEXT: vpand %xmm1, %xmm5, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm7, %xmm2
	; AVX1-NEXT: vpand %xmm7, %xmm2, %xmm2
	; AVX1-NEXT: vpand %xmm1, %xmm6, %xmm1
	; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpand %xmm4, %xmm5, %xmm2			; AVX1-NEXT: vpand %xmm6, %xmm7, %xmm2
	; AVX1-NEXT: vpand %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vpand %xmm0, %xmm9, %xmm0
	; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpackuswb %xmm0, %xmm0, %xmm0			; AVX1-NEXT: vpackuswb %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vmovq %xmm0, (%rdi)			; AVX1-NEXT: vmovq %xmm0, (%rdi)
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: trunc_packus_v8i64_v8i8_store:			; AVX2-LABEL: trunc_packus_v8i64_v8i8_store:
	▲ Show 20 Lines • Show All 638 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: packusdw %xmm4, %xmm2			; SSE41-NEXT: packusdw %xmm4, %xmm2
	; SSE41-NEXT: packusdw %xmm2, %xmm3			; SSE41-NEXT: packusdw %xmm2, %xmm3
	; SSE41-NEXT: packuswb %xmm3, %xmm1			; SSE41-NEXT: packuswb %xmm3, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v16i64_v16i8:			; AVX1-LABEL: trunc_packus_v16i64_v16i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm4 = [255,255,255,255]			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm8
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5			; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [255,255]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [255,255]			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm9
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm6, %xmm7
	; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm7, %ymm5
	; AVX1-NEXT: vblendvpd %ymm5, %ymm3, %ymm4, %ymm15
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm6, %xmm7
	; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm7, %ymm5
	; AVX1-NEXT: vblendvpd %ymm5, %ymm2, %ymm4, %ymm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm6, %xmm7
	; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm7, %ymm5
	; AVX1-NEXT: vblendvpd %ymm5, %ymm1, %ymm4, %ymm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm6, %xmm6
	; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm5
	; AVX1-NEXT: vblendvpd %ymm5, %ymm0, %ymm4, %ymm0
	; AVX1-NEXT: vxorpd %xmm4, %xmm4, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm8
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm14
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm14, %xmm9
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm10
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm7			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm7
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm7, %xmm11			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm2, %xmm12			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm5, %xmm6
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm5			; AVX1-NEXT: vblendvpd %xmm6, %xmm0, %xmm5, %xmm10
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm13			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm15, %xmm6			; AVX1-NEXT: vblendvpd %xmm6, %xmm4, %xmm5, %xmm11
	; AVX1-NEXT: vextractf128 $1, %ymm15, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm5, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm4			; AVX1-NEXT: vblendvpd %xmm6, %xmm1, %xmm5, %xmm1
				; AVX1-NEXT: vpcmpgtq %xmm7, %xmm5, %xmm6
				; AVX1-NEXT: vblendvpd %xmm6, %xmm7, %xmm5, %xmm6
				; AVX1-NEXT: vpcmpgtq %xmm2, %xmm5, %xmm7
				; AVX1-NEXT: vblendvpd %xmm7, %xmm2, %xmm5, %xmm2
				; AVX1-NEXT: vpcmpgtq %xmm9, %xmm5, %xmm7
				; AVX1-NEXT: vblendvpd %xmm7, %xmm9, %xmm5, %xmm7
				; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm0
				; AVX1-NEXT: vblendvpd %xmm0, %xmm3, %xmm5, %xmm0
				; AVX1-NEXT: vpcmpgtq %xmm8, %xmm5, %xmm3
				; AVX1-NEXT: vblendvpd %xmm3, %xmm8, %xmm5, %xmm3
				; AVX1-NEXT: vpxor %xmm5, %xmm5, %xmm5
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm3, %xmm4
	; AVX1-NEXT: vpand %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpand %xmm3, %xmm4, %xmm3
	; AVX1-NEXT: vpand %xmm15, %xmm6, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm0, %xmm4
	; AVX1-NEXT: vpackusdw %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vpand %xmm0, %xmm4, %xmm0
	; AVX1-NEXT: vpand %xmm5, %xmm13, %xmm4
	; AVX1-NEXT: vpand %xmm2, %xmm12, %xmm2
	; AVX1-NEXT: vpackusdw %xmm4, %xmm2, %xmm2
	; AVX1-NEXT: vpackusdw %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpand %xmm7, %xmm11, %xmm3
	; AVX1-NEXT: vpand %xmm1, %xmm10, %xmm1
	; AVX1-NEXT: vpackusdw %xmm3, %xmm1, %xmm1
	; AVX1-NEXT: vpand %xmm14, %xmm9, %xmm3
	; AVX1-NEXT: vpand %xmm0, %xmm8, %xmm0
	; AVX1-NEXT: vpackusdw %xmm3, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm3, %xmm0, %xmm0
	; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm3
	; AVX1-NEXT: vpackuswb %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpand %xmm7, %xmm3, %xmm3
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm2, %xmm4
				; AVX1-NEXT: vpand %xmm2, %xmm4, %xmm2
				; AVX1-NEXT: vpackusdw %xmm3, %xmm2, %xmm2
				; AVX1-NEXT: vpackusdw %xmm0, %xmm2, %xmm0
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm2
				; AVX1-NEXT: vpand %xmm6, %xmm2, %xmm2
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm1, %xmm3
				; AVX1-NEXT: vpand %xmm1, %xmm3, %xmm1
				; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm11, %xmm2
				; AVX1-NEXT: vpand %xmm11, %xmm2, %xmm2
				; AVX1-NEXT: vpcmpgtq %xmm5, %xmm10, %xmm3
				; AVX1-NEXT: vpand %xmm10, %xmm3, %xmm3
				; AVX1-NEXT: vpackusdw %xmm2, %xmm3, %xmm2
				; AVX1-NEXT: vpackusdw %xmm1, %xmm2, %xmm1
				; AVX1-NEXT: vpackuswb %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: trunc_packus_v16i64_v16i8:			; AVX2-LABEL: trunc_packus_v16i64_v16i8:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm4 = [255,255,255,255]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm4 = [255,255,255,255]
	; AVX2-NEXT: vpcmpgtq %ymm2, %ymm4, %ymm5			; AVX2-NEXT: vpcmpgtq %ymm2, %ymm4, %ymm5
	; AVX2-NEXT: vblendvpd %ymm5, %ymm2, %ymm4, %ymm2			; AVX2-NEXT: vblendvpd %ymm5, %ymm2, %ymm4, %ymm2
	▲ Show 20 Lines • Show All 431 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-trunc-ssat-widen.ll

Show First 20 Lines • Show All 185 Lines • ▼ Show 20 Lines
; SSE41-NEXT: por %xmm4, %xmm0		; SSE41-NEXT: por %xmm4, %xmm0
; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1		; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1
; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm6[0,2]		; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm6[0,2]
; SSE41-NEXT: movaps %xmm1, %xmm0		; SSE41-NEXT: movaps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX1-LABEL: trunc_ssat_v4i64_v4i32:		; AVX1-LABEL: trunc_ssat_v4i64_v4i32:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vmovapd {{.*#+}} ymm1 = [2147483647,2147483647,2147483647,2147483647]
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [2147483647,2147483647]
; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm3
; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
; AVX1-NEXT: vmovapd {{.*#+}} ymm1 = [18446744071562067968,18446744071562067968,18446744071562067968,18446744071562067968]
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [18446744071562067968,18446744071562067968]
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm0, %xmm3
; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
		; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [2147483647,2147483647]
		; AVX1-NEXT: vpcmpgtq %xmm1, %xmm2, %xmm3
		; AVX1-NEXT: vpcmpgtq %xmm0, %xmm2, %xmm4
		; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm2, %xmm0
		; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [18446744071562067968,18446744071562067968]
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm5
		; AVX1-NEXT: vblendvpd %xmm3, %xmm1, %xmm2, %xmm1
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm2
		; AVX1-NEXT: vblendvpd %xmm2, %xmm1, %xmm4, %xmm1
		; AVX1-NEXT: vblendvpd %xmm5, %xmm0, %xmm4, %xmm0
; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[0,2]		; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[0,2]
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-SLOW-LABEL: trunc_ssat_v4i64_v4i32:		; AVX2-SLOW-LABEL: trunc_ssat_v4i64_v4i32:
; AVX2-SLOW: # %bb.0:		; AVX2-SLOW: # %bb.0:
; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm1 = [2147483647,2147483647,2147483647,2147483647]		; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm1 = [2147483647,2147483647,2147483647,2147483647]
; AVX2-SLOW-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2		; AVX2-SLOW-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2
▲ Show 20 Lines • Show All 387 Lines • ▼ Show 20 Lines
; SSE41-NEXT: por %xmm6, %xmm0		; SSE41-NEXT: por %xmm6, %xmm0
; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2		; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2
; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm4[0,2]		; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm4[0,2]
; SSE41-NEXT: movaps %xmm2, %xmm0		; SSE41-NEXT: movaps %xmm2, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX1-LABEL: trunc_ssat_v8i64_v8i32:		; AVX1-LABEL: trunc_ssat_v8i64_v8i32:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [2147483647,2147483647,2147483647,2147483647]
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [2147483647,2147483647]
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm5
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3
; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm4
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3
; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0
; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [18446744071562067968,18446744071562067968,18446744071562067968,18446744071562067968]
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [18446744071562067968,18446744071562067968]
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm5
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3
; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm4
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3
; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
		; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [2147483647,2147483647]
		; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm8
		; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm5
		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
		; AVX1-NEXT: vpcmpgtq %xmm6, %xmm3, %xmm7
		; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm4
		; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
		; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [18446744071562067968,18446744071562067968]
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm9
		; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm3, %xmm6
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm7
		; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm3, %xmm1
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm5
		; AVX1-NEXT: vblendvpd %xmm8, %xmm2, %xmm3, %xmm2
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm2, %xmm3
		; AVX1-NEXT: vblendvpd %xmm3, %xmm2, %xmm4, %xmm2
		; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm4, %xmm1
; AVX1-NEXT: vshufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]		; AVX1-NEXT: vshufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm4, %xmm2
		; AVX1-NEXT: vblendvpd %xmm9, %xmm0, %xmm4, %xmm0
; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm2[0,2]		; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm2[0,2]
; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0		; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-SLOW-LABEL: trunc_ssat_v8i64_v8i32:		; AVX2-SLOW-LABEL: trunc_ssat_v8i64_v8i32:
; AVX2-SLOW: # %bb.0:		; AVX2-SLOW: # %bb.0:
; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm2 = [2147483647,2147483647,2147483647,2147483647]		; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm2 = [2147483647,2147483647,2147483647,2147483647]
; AVX2-SLOW-NEXT: vpcmpgtq %ymm1, %ymm2, %ymm3		; AVX2-SLOW-NEXT: vpcmpgtq %ymm1, %ymm2, %ymm3
▲ Show 20 Lines • Show All 373 Lines • ▼ Show 20 Lines
; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3		; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3
; SSE41-NEXT: packssdw %xmm2, %xmm3		; SSE41-NEXT: packssdw %xmm2, %xmm3
; SSE41-NEXT: packssdw %xmm3, %xmm1		; SSE41-NEXT: packssdw %xmm3, %xmm1
; SSE41-NEXT: movdqa %xmm1, %xmm0		; SSE41-NEXT: movdqa %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX1-LABEL: trunc_ssat_v8i64_v8i16:		; AVX1-LABEL: trunc_ssat_v8i64_v8i16:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [32767,32767,32767,32767]
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [32767,32767]
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm5
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3
; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm4
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3
; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0
; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [18446744073709518848,18446744073709518848,18446744073709518848,18446744073709518848]
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [18446744073709518848,18446744073709518848]
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm5
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3
; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm4
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3
; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
		; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [32767,32767]
		; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm8
		; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm5
		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
		; AVX1-NEXT: vpcmpgtq %xmm6, %xmm3, %xmm7
		; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm4
		; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
		; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [18446744073709518848,18446744073709518848]
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm9
		; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm3, %xmm6
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm7
		; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm3, %xmm1
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm5
		; AVX1-NEXT: vblendvpd %xmm8, %xmm2, %xmm3, %xmm2
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm2, %xmm3
		; AVX1-NEXT: vblendvpd %xmm3, %xmm2, %xmm4, %xmm2
		; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm4, %xmm1
; AVX1-NEXT: vpackssdw %xmm2, %xmm1, %xmm1		; AVX1-NEXT: vpackssdw %xmm2, %xmm1, %xmm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm4, %xmm2
		; AVX1-NEXT: vblendvpd %xmm9, %xmm0, %xmm4, %xmm0
; AVX1-NEXT: vpackssdw %xmm2, %xmm0, %xmm0		; AVX1-NEXT: vpackssdw %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm0		; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: trunc_ssat_v8i64_v8i16:		; AVX2-LABEL: trunc_ssat_v8i64_v8i16:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [32767,32767,32767,32767]		; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [32767,32767,32767,32767]
▲ Show 20 Lines • Show All 471 Lines • ▼ Show 20 Lines
; SSE41-NEXT: packusdw %xmm7, %xmm1		; SSE41-NEXT: packusdw %xmm7, %xmm1
; SSE41-NEXT: packusdw %xmm3, %xmm1		; SSE41-NEXT: packusdw %xmm3, %xmm1
; SSE41-NEXT: packuswb %xmm1, %xmm1		; SSE41-NEXT: packuswb %xmm1, %xmm1
; SSE41-NEXT: movdqa %xmm1, %xmm0		; SSE41-NEXT: movdqa %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX1-LABEL: trunc_ssat_v8i64_v8i8:		; AVX1-LABEL: trunc_ssat_v8i64_v8i8:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [127,127,127,127]		; AVX1-NEXT: vmovapd {{.*#+}} ymm8 = [127,127,127,127]
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [127,127]		; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [127,127]
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3		; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm5
; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm5		; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm6
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3		; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm7
; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1		; AVX1-NEXT: vblendvpd %ymm7, %ymm1, %ymm8, %ymm9
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3		; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm7
; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm4		; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm10
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3		; AVX1-NEXT: vinsertf128 $1, %xmm7, %ymm10, %ymm11
; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0		; AVX1-NEXT: vblendvpd %ymm11, %ymm0, %ymm8, %ymm8
; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [18446744073709551488,18446744073709551488,18446744073709551488,18446744073709551488]		; AVX1-NEXT: vmovapd {{.*#+}} ymm11 = [18446744073709551488,18446744073709551488,18446744073709551488,18446744073709551488]
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3		; AVX1-NEXT: vblendvpd %xmm7, %xmm2, %xmm4, %xmm2
; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [18446744073709551488,18446744073709551488]		; AVX1-NEXT: vmovdqa {{.*#+}} xmm7 = [18446744073709551488,18446744073709551488]
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3		; AVX1-NEXT: vpcmpgtq %xmm7, %xmm2, %xmm2
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm5		; AVX1-NEXT: vblendvpd %xmm10, %xmm0, %xmm4, %xmm0
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3		; AVX1-NEXT: vpcmpgtq %xmm7, %xmm0, %xmm0
; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0		; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vblendvpd %ymm0, %ymm8, %ymm11, %ymm0
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3		; AVX1-NEXT: vblendvpd %xmm5, %xmm3, %xmm4, %xmm2
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm4		; AVX1-NEXT: vpcmpgtq %xmm7, %xmm2, %xmm2
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3		; AVX1-NEXT: vblendvpd %xmm6, %xmm1, %xmm4, %xmm1
; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1		; AVX1-NEXT: vpcmpgtq %xmm7, %xmm1, %xmm1
		; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
		; AVX1-NEXT: vblendvpd %ymm1, %ymm9, %ymm11, %ymm1
; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [255,255,255,255]		; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [255,255,255,255]
; AVX1-NEXT: vandpd %ymm2, %ymm1, %ymm1		; AVX1-NEXT: vandpd %ymm2, %ymm1, %ymm1
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
; AVX1-NEXT: vpackusdw %xmm3, %xmm1, %xmm1		; AVX1-NEXT: vpackusdw %xmm3, %xmm1, %xmm1
; AVX1-NEXT: vandpd %ymm2, %ymm0, %ymm0		; AVX1-NEXT: vandpd %ymm2, %ymm0, %ymm0
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0		; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0		; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0
Show All 37 Lines	; AVX512-NEXT: retq
%1 = icmp slt <8 x i64> %a0, <i64 127, i64 127, i64 127, i64 127, i64 127, i64 127, i64 127, i64 127>		%1 = icmp slt <8 x i64> %a0, <i64 127, i64 127, i64 127, i64 127, i64 127, i64 127, i64 127, i64 127>
%2 = select <8 x i1> %1, <8 x i64> %a0, <8 x i64> <i64 127, i64 127, i64 127, i64 127, i64 127, i64 127, i64 127, i64 127>		%2 = select <8 x i1> %1, <8 x i64> %a0, <8 x i64> <i64 127, i64 127, i64 127, i64 127, i64 127, i64 127, i64 127, i64 127>
%3 = icmp sgt <8 x i64> %2, <i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128>		%3 = icmp sgt <8 x i64> %2, <i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128>
%4 = select <8 x i1> %3, <8 x i64> %2, <8 x i64> <i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128>		%4 = select <8 x i1> %3, <8 x i64> %2, <8 x i64> <i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128>
%5 = trunc <8 x i64> %4 to <8 x i8>		%5 = trunc <8 x i64> %4 to <8 x i8>
ret <8 x i8> %5		ret <8 x i8> %5
}		}

		; TODO: The AVX1 codegen shows a missed opportunity to narrow blendv+logic to 128-bit.

define void @trunc_ssat_v8i64_v8i8_store(<8 x i64> %a0, <8 x i8> *%p1) {		define void @trunc_ssat_v8i64_v8i8_store(<8 x i64> %a0, <8 x i8> *%p1) {
; SSE2-LABEL: trunc_ssat_v8i64_v8i8_store:		; SSE2-LABEL: trunc_ssat_v8i64_v8i8_store:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [127,127]		; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [127,127]
; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648]		; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648]
; SSE2-NEXT: movdqa %xmm3, %xmm5		; SSE2-NEXT: movdqa %xmm3, %xmm5
; SSE2-NEXT: pxor %xmm4, %xmm5		; SSE2-NEXT: pxor %xmm4, %xmm5
; SSE2-NEXT: movdqa {{.*#+}} xmm9 = [2147483775,2147483775]		; SSE2-NEXT: movdqa {{.*#+}} xmm9 = [2147483775,2147483775]
▲ Show 20 Lines • Show All 336 Lines • ▼ Show 20 Lines
; SSE41-NEXT: packusdw %xmm7, %xmm2		; SSE41-NEXT: packusdw %xmm7, %xmm2
; SSE41-NEXT: packusdw %xmm3, %xmm2		; SSE41-NEXT: packusdw %xmm3, %xmm2
; SSE41-NEXT: packuswb %xmm2, %xmm2		; SSE41-NEXT: packuswb %xmm2, %xmm2
; SSE41-NEXT: movq %xmm2, (%rdi)		; SSE41-NEXT: movq %xmm2, (%rdi)
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX1-LABEL: trunc_ssat_v8i64_v8i8_store:		; AVX1-LABEL: trunc_ssat_v8i64_v8i8_store:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [127,127,127,127]		; AVX1-NEXT: vmovapd {{.*#+}} ymm8 = [127,127,127,127]
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [127,127]		; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [127,127]
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3		; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm5
; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm5		; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm6
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3		; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm7
; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1		; AVX1-NEXT: vblendvpd %ymm7, %ymm1, %ymm8, %ymm9
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3		; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm7
; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm4		; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm10
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3		; AVX1-NEXT: vinsertf128 $1, %xmm7, %ymm10, %ymm11
; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0		; AVX1-NEXT: vblendvpd %ymm11, %ymm0, %ymm8, %ymm8
; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [18446744073709551488,18446744073709551488,18446744073709551488,18446744073709551488]		; AVX1-NEXT: vmovapd {{.*#+}} ymm11 = [18446744073709551488,18446744073709551488,18446744073709551488,18446744073709551488]
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3		; AVX1-NEXT: vblendvpd %xmm7, %xmm2, %xmm4, %xmm2
; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [18446744073709551488,18446744073709551488]		; AVX1-NEXT: vmovdqa {{.*#+}} xmm7 = [18446744073709551488,18446744073709551488]
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3		; AVX1-NEXT: vpcmpgtq %xmm7, %xmm2, %xmm2
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm5		; AVX1-NEXT: vblendvpd %xmm10, %xmm0, %xmm4, %xmm0
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3		; AVX1-NEXT: vpcmpgtq %xmm7, %xmm0, %xmm0
; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0		; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vblendvpd %ymm0, %ymm8, %ymm11, %ymm0
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3		; AVX1-NEXT: vblendvpd %xmm5, %xmm3, %xmm4, %xmm2
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm4		; AVX1-NEXT: vpcmpgtq %xmm7, %xmm2, %xmm2
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3		; AVX1-NEXT: vblendvpd %xmm6, %xmm1, %xmm4, %xmm1
; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1		; AVX1-NEXT: vpcmpgtq %xmm7, %xmm1, %xmm1
		; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
		; AVX1-NEXT: vblendvpd %ymm1, %ymm9, %ymm11, %ymm1
; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [255,255,255,255]		; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [255,255,255,255]
; AVX1-NEXT: vandpd %ymm2, %ymm1, %ymm1		; AVX1-NEXT: vandpd %ymm2, %ymm1, %ymm1
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
; AVX1-NEXT: vpackusdw %xmm3, %xmm1, %xmm1		; AVX1-NEXT: vpackusdw %xmm3, %xmm1, %xmm1
; AVX1-NEXT: vandpd %ymm2, %ymm0, %ymm0		; AVX1-NEXT: vandpd %ymm2, %ymm0, %ymm0
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0		; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0		; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0
▲ Show 20 Lines • Show All 678 Lines • ▼ Show 20 Lines
; SSE41-NEXT: packssdw %xmm3, %xmm2		; SSE41-NEXT: packssdw %xmm3, %xmm2
; SSE41-NEXT: packssdw %xmm2, %xmm4		; SSE41-NEXT: packssdw %xmm2, %xmm4
; SSE41-NEXT: packsswb %xmm4, %xmm1		; SSE41-NEXT: packsswb %xmm4, %xmm1
; SSE41-NEXT: movdqa %xmm1, %xmm0		; SSE41-NEXT: movdqa %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX1-LABEL: trunc_ssat_v16i64_v16i8:		; AVX1-LABEL: trunc_ssat_v16i64_v16i8:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vmovapd {{.*#+}} ymm4 = [127,127,127,127]		; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm8
; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5		; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [127,127]
; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [127,127]		; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm9
; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm7
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm6, %xmm7		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm7, %ymm5		; AVX1-NEXT: vpcmpgtq %xmm0, %xmm5, %xmm6
; AVX1-NEXT: vblendvpd %ymm5, %ymm3, %ymm4, %ymm3		; AVX1-NEXT: vblendvpd %xmm6, %xmm0, %xmm5, %xmm10
; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm5		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm6
; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5		; AVX1-NEXT: vblendvpd %xmm6, %xmm4, %xmm5, %xmm11
; AVX1-NEXT: vpcmpgtq %xmm2, %xmm6, %xmm7		; AVX1-NEXT: vpcmpgtq %xmm1, %xmm5, %xmm6
; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm7, %ymm5		; AVX1-NEXT: vblendvpd %xmm6, %xmm1, %xmm5, %xmm1
; AVX1-NEXT: vblendvpd %ymm5, %ymm2, %ymm4, %ymm2		; AVX1-NEXT: vpcmpgtq %xmm7, %xmm5, %xmm6
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5		; AVX1-NEXT: vblendvpd %xmm6, %xmm7, %xmm5, %xmm6
; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5		; AVX1-NEXT: vpcmpgtq %xmm2, %xmm5, %xmm7
; AVX1-NEXT: vpcmpgtq %xmm1, %xmm6, %xmm7		; AVX1-NEXT: vblendvpd %xmm7, %xmm2, %xmm5, %xmm2
; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm7, %ymm5		; AVX1-NEXT: vpcmpgtq %xmm9, %xmm5, %xmm7
; AVX1-NEXT: vblendvpd %ymm5, %ymm1, %ymm4, %ymm1		; AVX1-NEXT: vblendvpd %xmm7, %xmm9, %xmm5, %xmm7
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5		; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm0
; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5		; AVX1-NEXT: vblendvpd %xmm0, %xmm3, %xmm5, %xmm0
; AVX1-NEXT: vpcmpgtq %xmm0, %xmm6, %xmm6		; AVX1-NEXT: vpcmpgtq %xmm8, %xmm5, %xmm3
; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm5		; AVX1-NEXT: vblendvpd %xmm3, %xmm8, %xmm5, %xmm3
; AVX1-NEXT: vblendvpd %ymm5, %ymm0, %ymm4, %ymm0		; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [18446744073709551488,18446744073709551488]
; AVX1-NEXT: vmovapd {{.*#+}} ymm4 = [18446744073709551488,18446744073709551488,18446744073709551488,18446744073709551488]		; AVX1-NEXT: vpcmpgtq %xmm5, %xmm3, %xmm4
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5		; AVX1-NEXT: vblendvpd %xmm4, %xmm3, %xmm5, %xmm8
; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [18446744073709551488,18446744073709551488]		; AVX1-NEXT: vpcmpgtq %xmm5, %xmm0, %xmm4
; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm5		; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm5, %xmm0
; AVX1-NEXT: vpcmpgtq %xmm6, %xmm0, %xmm7		; AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm4
; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm7, %ymm5		; AVX1-NEXT: vblendvpd %xmm4, %xmm7, %xmm5, %xmm4
; AVX1-NEXT: vblendvpd %ymm5, %ymm0, %ymm4, %ymm0		; AVX1-NEXT: vpcmpgtq %xmm5, %xmm2, %xmm7
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5		; AVX1-NEXT: vblendvpd %xmm7, %xmm2, %xmm5, %xmm2
; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm5		; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm7
; AVX1-NEXT: vpcmpgtq %xmm6, %xmm1, %xmm7		; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm5, %xmm6
; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm7, %ymm5		; AVX1-NEXT: vpcmpgtq %xmm5, %xmm1, %xmm7
; AVX1-NEXT: vblendvpd %ymm5, %ymm1, %ymm4, %ymm1		; AVX1-NEXT: vblendvpd %xmm7, %xmm1, %xmm5, %xmm1
; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm5		; AVX1-NEXT: vpcmpgtq %xmm5, %xmm11, %xmm7
; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm5		; AVX1-NEXT: vblendvpd %xmm7, %xmm11, %xmm5, %xmm7
; AVX1-NEXT: vpcmpgtq %xmm6, %xmm2, %xmm7		; AVX1-NEXT: vpcmpgtq %xmm5, %xmm10, %xmm3
; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm7, %ymm5		; AVX1-NEXT: vblendvpd %xmm3, %xmm10, %xmm5, %xmm3
; AVX1-NEXT: vblendvpd %ymm5, %ymm2, %ymm4, %ymm2		; AVX1-NEXT: vpackssdw %xmm8, %xmm0, %xmm0
; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5
; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm5
; AVX1-NEXT: vpcmpgtq %xmm6, %xmm3, %xmm6
; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm5
; AVX1-NEXT: vblendvpd %ymm5, %ymm3, %ymm4, %ymm3
; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm4
; AVX1-NEXT: vpackssdw %xmm4, %xmm3, %xmm3
; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4
; AVX1-NEXT: vpackssdw %xmm4, %xmm2, %xmm2		; AVX1-NEXT: vpackssdw %xmm4, %xmm2, %xmm2
; AVX1-NEXT: vpackssdw %xmm3, %xmm2, %xmm2		; AVX1-NEXT: vpackssdw %xmm0, %xmm2, %xmm0
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vpackssdw %xmm6, %xmm1, %xmm1
; AVX1-NEXT: vpackssdw %xmm3, %xmm1, %xmm1		; AVX1-NEXT: vpackssdw %xmm7, %xmm3, %xmm2
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3		; AVX1-NEXT: vpackssdw %xmm1, %xmm2, %xmm1
; AVX1-NEXT: vpackssdw %xmm3, %xmm0, %xmm0		; AVX1-NEXT: vpacksswb %xmm0, %xmm1, %xmm0
; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: trunc_ssat_v16i64_v16i8:		; AVX2-LABEL: trunc_ssat_v16i64_v16i8:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm4 = [127,127,127,127]		; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm4 = [127,127,127,127]
; AVX2-NEXT: vpcmpgtq %ymm2, %ymm4, %ymm5		; AVX2-NEXT: vpcmpgtq %ymm2, %ymm4, %ymm5
; AVX2-NEXT: vblendvpd %ymm5, %ymm2, %ymm4, %ymm2		; AVX2-NEXT: vblendvpd %ymm5, %ymm2, %ymm4, %ymm2
▲ Show 20 Lines • Show All 351 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-trunc-ssat.ll

Show First 20 Lines • Show All 185 Lines • ▼ Show 20 Lines
; SSE41-NEXT: por %xmm4, %xmm0		; SSE41-NEXT: por %xmm4, %xmm0
; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1		; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1
; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm6[0,2]		; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm6[0,2]
; SSE41-NEXT: movaps %xmm1, %xmm0		; SSE41-NEXT: movaps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX1-LABEL: trunc_ssat_v4i64_v4i32:		; AVX1-LABEL: trunc_ssat_v4i64_v4i32:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vmovapd {{.*#+}} ymm1 = [2147483647,2147483647,2147483647,2147483647]
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [2147483647,2147483647]
; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm3
; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
; AVX1-NEXT: vmovapd {{.*#+}} ymm1 = [18446744071562067968,18446744071562067968,18446744071562067968,18446744071562067968]
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [18446744071562067968,18446744071562067968]
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm0, %xmm3
; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
		; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [2147483647,2147483647]
		; AVX1-NEXT: vpcmpgtq %xmm1, %xmm2, %xmm3
		; AVX1-NEXT: vpcmpgtq %xmm0, %xmm2, %xmm4
		; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm2, %xmm0
		; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [18446744071562067968,18446744071562067968]
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm5
		; AVX1-NEXT: vblendvpd %xmm3, %xmm1, %xmm2, %xmm1
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm2
		; AVX1-NEXT: vblendvpd %xmm2, %xmm1, %xmm4, %xmm1
		; AVX1-NEXT: vblendvpd %xmm5, %xmm0, %xmm4, %xmm0
; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[0,2]		; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[0,2]
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-SLOW-LABEL: trunc_ssat_v4i64_v4i32:		; AVX2-SLOW-LABEL: trunc_ssat_v4i64_v4i32:
; AVX2-SLOW: # %bb.0:		; AVX2-SLOW: # %bb.0:
; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm1 = [2147483647,2147483647,2147483647,2147483647]		; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm1 = [2147483647,2147483647,2147483647,2147483647]
; AVX2-SLOW-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2		; AVX2-SLOW-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2
▲ Show 20 Lines • Show All 387 Lines • ▼ Show 20 Lines
; SSE41-NEXT: por %xmm6, %xmm0		; SSE41-NEXT: por %xmm6, %xmm0
; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2		; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2
; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm4[0,2]		; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm4[0,2]
; SSE41-NEXT: movaps %xmm2, %xmm0		; SSE41-NEXT: movaps %xmm2, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX1-LABEL: trunc_ssat_v8i64_v8i32:		; AVX1-LABEL: trunc_ssat_v8i64_v8i32:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [2147483647,2147483647,2147483647,2147483647]
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [2147483647,2147483647]
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm5
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3
; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm4
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3
; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0
; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [18446744071562067968,18446744071562067968,18446744071562067968,18446744071562067968]
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [18446744071562067968,18446744071562067968]
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm5
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3
; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm4
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3
; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
		; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [2147483647,2147483647]
		; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm8
		; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm5
		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
		; AVX1-NEXT: vpcmpgtq %xmm6, %xmm3, %xmm7
		; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm4
		; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
		; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [18446744071562067968,18446744071562067968]
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm9
		; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm3, %xmm6
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm7
		; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm3, %xmm1
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm5
		; AVX1-NEXT: vblendvpd %xmm8, %xmm2, %xmm3, %xmm2
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm2, %xmm3
		; AVX1-NEXT: vblendvpd %xmm3, %xmm2, %xmm4, %xmm2
		; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm4, %xmm1
; AVX1-NEXT: vshufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]		; AVX1-NEXT: vshufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm4, %xmm2
		; AVX1-NEXT: vblendvpd %xmm9, %xmm0, %xmm4, %xmm0
; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm2[0,2]		; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm2[0,2]
; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0		; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-SLOW-LABEL: trunc_ssat_v8i64_v8i32:		; AVX2-SLOW-LABEL: trunc_ssat_v8i64_v8i32:
; AVX2-SLOW: # %bb.0:		; AVX2-SLOW: # %bb.0:
; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm2 = [2147483647,2147483647,2147483647,2147483647]		; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm2 = [2147483647,2147483647,2147483647,2147483647]
; AVX2-SLOW-NEXT: vpcmpgtq %ymm1, %ymm2, %ymm3		; AVX2-SLOW-NEXT: vpcmpgtq %ymm1, %ymm2, %ymm3
▲ Show 20 Lines • Show All 373 Lines • ▼ Show 20 Lines
; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3		; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3
; SSE41-NEXT: packssdw %xmm2, %xmm3		; SSE41-NEXT: packssdw %xmm2, %xmm3
; SSE41-NEXT: packssdw %xmm3, %xmm1		; SSE41-NEXT: packssdw %xmm3, %xmm1
; SSE41-NEXT: movdqa %xmm1, %xmm0		; SSE41-NEXT: movdqa %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX1-LABEL: trunc_ssat_v8i64_v8i16:		; AVX1-LABEL: trunc_ssat_v8i64_v8i16:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [32767,32767,32767,32767]
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [32767,32767]
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm5
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3
; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm4
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3
; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0
; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [18446744073709518848,18446744073709518848,18446744073709518848,18446744073709518848]
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [18446744073709518848,18446744073709518848]
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm5
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3
; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm4
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3
; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
		; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [32767,32767]
		; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm8
		; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm5
		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
		; AVX1-NEXT: vpcmpgtq %xmm6, %xmm3, %xmm7
		; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm4
		; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
		; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [18446744073709518848,18446744073709518848]
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm9
		; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm3, %xmm6
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm7
		; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm3, %xmm1
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm5
		; AVX1-NEXT: vblendvpd %xmm8, %xmm2, %xmm3, %xmm2
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm2, %xmm3
		; AVX1-NEXT: vblendvpd %xmm3, %xmm2, %xmm4, %xmm2
		; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm4, %xmm1
; AVX1-NEXT: vpackssdw %xmm2, %xmm1, %xmm1		; AVX1-NEXT: vpackssdw %xmm2, %xmm1, %xmm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm4, %xmm2
		; AVX1-NEXT: vblendvpd %xmm9, %xmm0, %xmm4, %xmm0
; AVX1-NEXT: vpackssdw %xmm2, %xmm0, %xmm0		; AVX1-NEXT: vpackssdw %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm0		; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: trunc_ssat_v8i64_v8i16:		; AVX2-LABEL: trunc_ssat_v8i64_v8i16:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [32767,32767,32767,32767]		; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [32767,32767,32767,32767]
▲ Show 20 Lines • Show All 453 Lines • ▼ Show 20 Lines
; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3		; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3
; SSE41-NEXT: packssdw %xmm2, %xmm3		; SSE41-NEXT: packssdw %xmm2, %xmm3
; SSE41-NEXT: packssdw %xmm3, %xmm1		; SSE41-NEXT: packssdw %xmm3, %xmm1
; SSE41-NEXT: movdqa %xmm1, %xmm0		; SSE41-NEXT: movdqa %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX1-LABEL: trunc_ssat_v8i64_v8i8:		; AVX1-LABEL: trunc_ssat_v8i64_v8i8:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [127,127,127,127]
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [127,127]
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm5
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3
; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm4
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3
; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0
; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [18446744073709551488,18446744073709551488,18446744073709551488,18446744073709551488]
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [18446744073709551488,18446744073709551488]
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm5
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3
; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm4
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3
; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
		; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [127,127]
		; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm8
		; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm5
		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm6
		; AVX1-NEXT: vpcmpgtq %xmm6, %xmm3, %xmm7
		; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm4
		; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
		; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [18446744073709551488,18446744073709551488]
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm9
		; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm3, %xmm6
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm7
		; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm3, %xmm1
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm5
		; AVX1-NEXT: vblendvpd %xmm8, %xmm2, %xmm3, %xmm2
		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm2, %xmm3
		; AVX1-NEXT: vblendvpd %xmm3, %xmm2, %xmm4, %xmm2
		; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm4, %xmm1
; AVX1-NEXT: vpackssdw %xmm2, %xmm1, %xmm1		; AVX1-NEXT: vpackssdw %xmm2, %xmm1, %xmm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm4, %xmm2
		; AVX1-NEXT: vblendvpd %xmm9, %xmm0, %xmm4, %xmm0
; AVX1-NEXT: vpackssdw %xmm2, %xmm0, %xmm0		; AVX1-NEXT: vpackssdw %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm0		; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: trunc_ssat_v8i64_v8i8:		; AVX2-LABEL: trunc_ssat_v8i64_v8i8:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [127,127,127,127]		; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [127,127,127,127]
Show All 23 Lines	; AVX512-NEXT: retq
%1 = icmp slt <8 x i64> %a0, <i64 127, i64 127, i64 127, i64 127, i64 127, i64 127, i64 127, i64 127>		%1 = icmp slt <8 x i64> %a0, <i64 127, i64 127, i64 127, i64 127, i64 127, i64 127, i64 127, i64 127>
%2 = select <8 x i1> %1, <8 x i64> %a0, <8 x i64> <i64 127, i64 127, i64 127, i64 127, i64 127, i64 127, i64 127, i64 127>		%2 = select <8 x i1> %1, <8 x i64> %a0, <8 x i64> <i64 127, i64 127, i64 127, i64 127, i64 127, i64 127, i64 127, i64 127>
%3 = icmp sgt <8 x i64> %2, <i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128>		%3 = icmp sgt <8 x i64> %2, <i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128>
%4 = select <8 x i1> %3, <8 x i64> %2, <8 x i64> <i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128>		%4 = select <8 x i1> %3, <8 x i64> %2, <8 x i64> <i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128, i64 -128>
%5 = trunc <8 x i64> %4 to <8 x i8>		%5 = trunc <8 x i64> %4 to <8 x i8>
ret <8 x i8> %5		ret <8 x i8> %5
}		}

		; TODO: The AVX1 codegen shows a missed opportunity to narrow blendv+logic to 128-bit.

define void @trunc_ssat_v8i64_v8i8_store(<8 x i64> %a0, <8 x i8> *%p1) {		define void @trunc_ssat_v8i64_v8i8_store(<8 x i64> %a0, <8 x i8> *%p1) {
; SSE2-LABEL: trunc_ssat_v8i64_v8i8_store:		; SSE2-LABEL: trunc_ssat_v8i64_v8i8_store:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [127,127]		; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [127,127]
; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648]		; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648]
; SSE2-NEXT: movdqa %xmm3, %xmm5		; SSE2-NEXT: movdqa %xmm3, %xmm5
; SSE2-NEXT: pxor %xmm4, %xmm5		; SSE2-NEXT: pxor %xmm4, %xmm5
; SSE2-NEXT: movdqa {{.*#+}} xmm9 = [2147483775,2147483775]		; SSE2-NEXT: movdqa {{.*#+}} xmm9 = [2147483775,2147483775]
▲ Show 20 Lines • Show All 336 Lines • ▼ Show 20 Lines
; SSE41-NEXT: packusdw %xmm7, %xmm2		; SSE41-NEXT: packusdw %xmm7, %xmm2
; SSE41-NEXT: packusdw %xmm3, %xmm2		; SSE41-NEXT: packusdw %xmm3, %xmm2
; SSE41-NEXT: packuswb %xmm2, %xmm2		; SSE41-NEXT: packuswb %xmm2, %xmm2
; SSE41-NEXT: movq %xmm2, (%rdi)		; SSE41-NEXT: movq %xmm2, (%rdi)
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX1-LABEL: trunc_ssat_v8i64_v8i8_store:		; AVX1-LABEL: trunc_ssat_v8i64_v8i8_store:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [127,127,127,127]		; AVX1-NEXT: vmovapd {{.*#+}} ymm8 = [127,127,127,127]
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [127,127]		; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [127,127]
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3		; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm5
; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm5		; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm6
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3		; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm7
; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1		; AVX1-NEXT: vblendvpd %ymm7, %ymm1, %ymm8, %ymm9
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3		; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm7
; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm4		; AVX1-NEXT: vpcmpgtq %xmm0, %xmm4, %xmm10
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3		; AVX1-NEXT: vinsertf128 $1, %xmm7, %ymm10, %ymm11
; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0		; AVX1-NEXT: vblendvpd %ymm11, %ymm0, %ymm8, %ymm8
; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [18446744073709551488,18446744073709551488,18446744073709551488,18446744073709551488]		; AVX1-NEXT: vmovapd {{.*#+}} ymm11 = [18446744073709551488,18446744073709551488,18446744073709551488,18446744073709551488]
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3		; AVX1-NEXT: vblendvpd %xmm7, %xmm2, %xmm4, %xmm2
; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [18446744073709551488,18446744073709551488]		; AVX1-NEXT: vmovdqa {{.*#+}} xmm7 = [18446744073709551488,18446744073709551488]
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3		; AVX1-NEXT: vpcmpgtq %xmm7, %xmm2, %xmm2
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm0, %xmm5		; AVX1-NEXT: vblendvpd %xmm10, %xmm0, %xmm4, %xmm0
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3		; AVX1-NEXT: vpcmpgtq %xmm7, %xmm0, %xmm0
; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0		; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vblendvpd %ymm0, %ymm8, %ymm11, %ymm0
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3		; AVX1-NEXT: vblendvpd %xmm5, %xmm3, %xmm4, %xmm2
; AVX1-NEXT: vpcmpgtq %xmm4, %xmm1, %xmm4		; AVX1-NEXT: vpcmpgtq %xmm7, %xmm2, %xmm2
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3		; AVX1-NEXT: vblendvpd %xmm6, %xmm1, %xmm4, %xmm1
; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1		; AVX1-NEXT: vpcmpgtq %xmm7, %xmm1, %xmm1
		; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
		; AVX1-NEXT: vblendvpd %ymm1, %ymm9, %ymm11, %ymm1
; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [255,255,255,255]		; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [255,255,255,255]
; AVX1-NEXT: vandpd %ymm2, %ymm1, %ymm1		; AVX1-NEXT: vandpd %ymm2, %ymm1, %ymm1
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
; AVX1-NEXT: vpackusdw %xmm3, %xmm1, %xmm1		; AVX1-NEXT: vpackusdw %xmm3, %xmm1, %xmm1
; AVX1-NEXT: vandpd %ymm2, %ymm0, %ymm0		; AVX1-NEXT: vandpd %ymm2, %ymm0, %ymm0
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0		; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0		; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0
▲ Show 20 Lines • Show All 676 Lines • ▼ Show 20 Lines
; SSE41-NEXT: packssdw %xmm3, %xmm2		; SSE41-NEXT: packssdw %xmm3, %xmm2
; SSE41-NEXT: packssdw %xmm2, %xmm4		; SSE41-NEXT: packssdw %xmm2, %xmm4
; SSE41-NEXT: packsswb %xmm4, %xmm1		; SSE41-NEXT: packsswb %xmm4, %xmm1
; SSE41-NEXT: movdqa %xmm1, %xmm0		; SSE41-NEXT: movdqa %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX1-LABEL: trunc_ssat_v16i64_v16i8:		; AVX1-LABEL: trunc_ssat_v16i64_v16i8:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vmovapd {{.*#+}} ymm4 = [127,127,127,127]		; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm8
; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5		; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [127,127]
; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [127,127]		; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm9
; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm7
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm6, %xmm7		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm7, %ymm5		; AVX1-NEXT: vpcmpgtq %xmm0, %xmm5, %xmm6
; AVX1-NEXT: vblendvpd %ymm5, %ymm3, %ymm4, %ymm3		; AVX1-NEXT: vblendvpd %xmm6, %xmm0, %xmm5, %xmm10
; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm5		; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm6
; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5		; AVX1-NEXT: vblendvpd %xmm6, %xmm4, %xmm5, %xmm11
; AVX1-NEXT: vpcmpgtq %xmm2, %xmm6, %xmm7		; AVX1-NEXT: vpcmpgtq %xmm1, %xmm5, %xmm6
; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm7, %ymm5		; AVX1-NEXT: vblendvpd %xmm6, %xmm1, %xmm5, %xmm1
; AVX1-NEXT: vblendvpd %ymm5, %ymm2, %ymm4, %ymm2		; AVX1-NEXT: vpcmpgtq %xmm7, %xmm5, %xmm6
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5		; AVX1-NEXT: vblendvpd %xmm6, %xmm7, %xmm5, %xmm6
; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5		; AVX1-NEXT: vpcmpgtq %xmm2, %xmm5, %xmm7
; AVX1-NEXT: vpcmpgtq %xmm1, %xmm6, %xmm7		; AVX1-NEXT: vblendvpd %xmm7, %xmm2, %xmm5, %xmm2
; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm7, %ymm5		; AVX1-NEXT: vpcmpgtq %xmm9, %xmm5, %xmm7
; AVX1-NEXT: vblendvpd %ymm5, %ymm1, %ymm4, %ymm1		; AVX1-NEXT: vblendvpd %xmm7, %xmm9, %xmm5, %xmm7
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5		; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm0
; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5		; AVX1-NEXT: vblendvpd %xmm0, %xmm3, %xmm5, %xmm0
; AVX1-NEXT: vpcmpgtq %xmm0, %xmm6, %xmm6		; AVX1-NEXT: vpcmpgtq %xmm8, %xmm5, %xmm3
; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm5		; AVX1-NEXT: vblendvpd %xmm3, %xmm8, %xmm5, %xmm3
; AVX1-NEXT: vblendvpd %ymm5, %ymm0, %ymm4, %ymm0		; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [18446744073709551488,18446744073709551488]
; AVX1-NEXT: vmovapd {{.*#+}} ymm4 = [18446744073709551488,18446744073709551488,18446744073709551488,18446744073709551488]		; AVX1-NEXT: vpcmpgtq %xmm5, %xmm3, %xmm4
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5		; AVX1-NEXT: vblendvpd %xmm4, %xmm3, %xmm5, %xmm8
; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [18446744073709551488,18446744073709551488]		; AVX1-NEXT: vpcmpgtq %xmm5, %xmm0, %xmm4
; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm5		; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm5, %xmm0
; AVX1-NEXT: vpcmpgtq %xmm6, %xmm0, %xmm7		; AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm4
; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm7, %ymm5		; AVX1-NEXT: vblendvpd %xmm4, %xmm7, %xmm5, %xmm4
; AVX1-NEXT: vblendvpd %ymm5, %ymm0, %ymm4, %ymm0		; AVX1-NEXT: vpcmpgtq %xmm5, %xmm2, %xmm7
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5		; AVX1-NEXT: vblendvpd %xmm7, %xmm2, %xmm5, %xmm2
; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm5		; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm7
; AVX1-NEXT: vpcmpgtq %xmm6, %xmm1, %xmm7		; AVX1-NEXT: vblendvpd %xmm7, %xmm6, %xmm5, %xmm6
; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm7, %ymm5		; AVX1-NEXT: vpcmpgtq %xmm5, %xmm1, %xmm7
; AVX1-NEXT: vblendvpd %ymm5, %ymm1, %ymm4, %ymm1		; AVX1-NEXT: vblendvpd %xmm7, %xmm1, %xmm5, %xmm1
; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm5		; AVX1-NEXT: vpcmpgtq %xmm5, %xmm11, %xmm7
; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm5		; AVX1-NEXT: vblendvpd %xmm7, %xmm11, %xmm5, %xmm7
; AVX1-NEXT: vpcmpgtq %xmm6, %xmm2, %xmm7		; AVX1-NEXT: vpcmpgtq %xmm5, %xmm10, %xmm3
; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm7, %ymm5		; AVX1-NEXT: vblendvpd %xmm3, %xmm10, %xmm5, %xmm3
; AVX1-NEXT: vblendvpd %ymm5, %ymm2, %ymm4, %ymm2		; AVX1-NEXT: vpackssdw %xmm8, %xmm0, %xmm0
; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5
; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm5
; AVX1-NEXT: vpcmpgtq %xmm6, %xmm3, %xmm6
; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm5
; AVX1-NEXT: vblendvpd %ymm5, %ymm3, %ymm4, %ymm3
; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm4
; AVX1-NEXT: vpackssdw %xmm4, %xmm3, %xmm3
; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4
; AVX1-NEXT: vpackssdw %xmm4, %xmm2, %xmm2		; AVX1-NEXT: vpackssdw %xmm4, %xmm2, %xmm2
; AVX1-NEXT: vpackssdw %xmm3, %xmm2, %xmm2		; AVX1-NEXT: vpackssdw %xmm0, %xmm2, %xmm0
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vpackssdw %xmm6, %xmm1, %xmm1
; AVX1-NEXT: vpackssdw %xmm3, %xmm1, %xmm1		; AVX1-NEXT: vpackssdw %xmm7, %xmm3, %xmm2
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3		; AVX1-NEXT: vpackssdw %xmm1, %xmm2, %xmm1
; AVX1-NEXT: vpackssdw %xmm3, %xmm0, %xmm0		; AVX1-NEXT: vpacksswb %xmm0, %xmm1, %xmm0
; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: trunc_ssat_v16i64_v16i8:		; AVX2-LABEL: trunc_ssat_v16i64_v16i8:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm4 = [127,127,127,127]		; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm4 = [127,127,127,127]
; AVX2-NEXT: vpcmpgtq %ymm2, %ymm4, %ymm5		; AVX2-NEXT: vpcmpgtq %ymm2, %ymm4, %ymm5
; AVX2-NEXT: vblendvpd %ymm5, %ymm2, %ymm4, %ymm2		; AVX2-NEXT: vblendvpd %ymm5, %ymm2, %ymm4, %ymm2
▲ Show 20 Lines • Show All 422 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-trunc-usat-widen.ll

	Show First 20 Lines • Show All 106 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4
	; SSE41-NEXT: shufps {{.*#+}} xmm4 = xmm4[0,2],xmm5[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm4 = xmm4[0,2],xmm5[0,2]
	; SSE41-NEXT: movaps %xmm4, %xmm0			; SSE41-NEXT: movaps %xmm4, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_usat_v4i64_v4i32:			; AVX1-LABEL: trunc_usat_v4i64_v4i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vpxor %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372041149743103,9223372041149743103]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372041149743103,9223372041149743103]
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm2, %ymm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [4294967295,4294967295,4294967295,429496729]			; AVX1-NEXT: vpxor %xmm1, %xmm4, %xmm1
	; AVX1-NEXT: vblendvpd %ymm1, %ymm0, %ymm2, %ymm0			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vmovapd {{.*#+}} xmm3 = [4294967295,429496729]
				; AVX1-NEXT: vblendvpd %xmm1, %xmm4, %xmm3, %xmm1
				; AVX1-NEXT: vmovapd {{.*#+}} xmm3 = [4294967295,4294967295]
				; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[0,2]			; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[0,2]
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-SLOW-LABEL: trunc_usat_v4i64_v4i32:			; AVX2-SLOW-LABEL: trunc_usat_v4i64_v4i32:
	; AVX2-SLOW: # %bb.0:			; AVX2-SLOW: # %bb.0:
	; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm1 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm1 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; AVX2-SLOW-NEXT: vpxor %ymm1, %ymm0, %ymm1			; AVX2-SLOW-NEXT: vpxor %ymm1, %ymm0, %ymm1
	▲ Show 20 Lines • Show All 241 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm6
	; SSE41-NEXT: shufps {{.*#+}} xmm6 = xmm6[0,2],xmm2[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm6 = xmm6[0,2],xmm2[0,2]
	; SSE41-NEXT: movaps %xmm6, %xmm0			; SSE41-NEXT: movaps %xmm6, %xmm0
	; SSE41-NEXT: movaps %xmm4, %xmm1			; SSE41-NEXT: movaps %xmm4, %xmm1
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_usat_v8i64_v8i32:			; AVX1-LABEL: trunc_usat_v8i64_v8i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [4294967295,4294967295,4294967295,4294967295]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372041149743103,9223372041149743103]
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm8
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372041149743103,9223372041149743103]			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm5, %xmm6
	; AVX1-NEXT: vpxor %xmm4, %xmm0, %xmm6			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm4, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm6			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm7
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm6, %ymm3			; AVX1-NEXT: vpcmpgtq %xmm7, %xmm4, %xmm7
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2
	; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm4			; AVX1-NEXT: vmovapd {{.*#+}} xmm4 = [4294967295,4294967295]
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vblendvpd %xmm2, %xmm3, %xmm4, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3			; AVX1-NEXT: vblendvpd %xmm7, %xmm1, %xmm4, %xmm1
	; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vshufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]			; AVX1-NEXT: vshufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vblendvpd %xmm6, %xmm5, %xmm4, %xmm2
				; AVX1-NEXT: vblendvpd %xmm8, %xmm0, %xmm4, %xmm0
	; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm2[0,2]			; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm2[0,2]
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-SLOW-LABEL: trunc_usat_v8i64_v8i32:			; AVX2-SLOW-LABEL: trunc_usat_v8i64_v8i32:
	; AVX2-SLOW: # %bb.0:			; AVX2-SLOW: # %bb.0:
	; AVX2-SLOW-NEXT: vbroadcastsd {{.*#+}} ymm2 = [4294967295,4294967295,4294967295,4294967295]			; AVX2-SLOW-NEXT: vbroadcastsd {{.*#+}} ymm2 = [4294967295,4294967295,4294967295,4294967295]
	; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm3 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm3 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 232 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5
	; SSE41-NEXT: packusdw %xmm4, %xmm5			; SSE41-NEXT: packusdw %xmm4, %xmm5
	; SSE41-NEXT: packusdw %xmm5, %xmm1			; SSE41-NEXT: packusdw %xmm5, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_usat_v8i64_v8i16:			; AVX1-LABEL: trunc_usat_v8i64_v8i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [65535,65535,65535,65535]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854841343,9223372036854841343]
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm8
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854841343,9223372036854841343]			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm5, %xmm6
	; AVX1-NEXT: vpxor %xmm4, %xmm0, %xmm6			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm4, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm6			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm7
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm6, %ymm3			; AVX1-NEXT: vpcmpgtq %xmm7, %xmm4, %xmm7
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2
	; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm4			; AVX1-NEXT: vmovapd {{.*#+}} xmm4 = [65535,65535]
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vblendvpd %xmm2, %xmm3, %xmm4, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3			; AVX1-NEXT: vblendvpd %xmm7, %xmm1, %xmm4, %xmm1
	; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vblendvpd %xmm6, %xmm5, %xmm4, %xmm2
				; AVX1-NEXT: vblendvpd %xmm8, %xmm0, %xmm4, %xmm0
	; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: trunc_usat_v8i64_v8i16:			; AVX2-LABEL: trunc_usat_v8i64_v8i16:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vbroadcastsd {{.*#+}} ymm2 = [65535,65535,65535,65535]			; AVX2-NEXT: vbroadcastsd {{.*#+}} ymm2 = [65535,65535,65535,65535]
	▲ Show 20 Lines • Show All 450 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: packusdw %xmm4, %xmm5			; SSE41-NEXT: packusdw %xmm4, %xmm5
	; SSE41-NEXT: packusdw %xmm5, %xmm1			; SSE41-NEXT: packusdw %xmm5, %xmm1
	; SSE41-NEXT: packuswb %xmm1, %xmm1			; SSE41-NEXT: packuswb %xmm1, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_usat_v8i64_v8i8:			; AVX1-LABEL: trunc_usat_v8i64_v8i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [255,255,255,255]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854776063,9223372036854776063]
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm8
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854776063,9223372036854776063]			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm5, %xmm6
	; AVX1-NEXT: vpxor %xmm4, %xmm0, %xmm6			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm4, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm6			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm7
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm6, %ymm3			; AVX1-NEXT: vpcmpgtq %xmm7, %xmm4, %xmm7
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2
	; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm4			; AVX1-NEXT: vmovapd {{.*#+}} xmm4 = [255,255]
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vblendvpd %xmm2, %xmm3, %xmm4, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3			; AVX1-NEXT: vblendvpd %xmm7, %xmm1, %xmm4, %xmm1
	; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vblendvpd %xmm6, %xmm5, %xmm4, %xmm2
				; AVX1-NEXT: vblendvpd %xmm8, %xmm0, %xmm4, %xmm0
	; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpackuswb %xmm0, %xmm0, %xmm0			; AVX1-NEXT: vpackuswb %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: trunc_usat_v8i64_v8i8:			; AVX2-LABEL: trunc_usat_v8i64_v8i8:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	▲ Show 20 Lines • Show All 211 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: packusdw %xmm4, %xmm5			; SSE41-NEXT: packusdw %xmm4, %xmm5
	; SSE41-NEXT: packusdw %xmm5, %xmm1			; SSE41-NEXT: packusdw %xmm5, %xmm1
	; SSE41-NEXT: packuswb %xmm1, %xmm1			; SSE41-NEXT: packuswb %xmm1, %xmm1
	; SSE41-NEXT: movq %xmm1, (%rdi)			; SSE41-NEXT: movq %xmm1, (%rdi)
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_usat_v8i64_v8i8_store:			; AVX1-LABEL: trunc_usat_v8i64_v8i8_store:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [255,255,255,255]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854776063,9223372036854776063]
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm8
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854776063,9223372036854776063]			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm5, %xmm6
	; AVX1-NEXT: vpxor %xmm4, %xmm0, %xmm6			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm4, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm6			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm7
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm6, %ymm3			; AVX1-NEXT: vpcmpgtq %xmm7, %xmm4, %xmm7
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2
	; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm4			; AVX1-NEXT: vmovapd {{.*#+}} xmm4 = [255,255]
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vblendvpd %xmm2, %xmm3, %xmm4, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3			; AVX1-NEXT: vblendvpd %xmm7, %xmm1, %xmm4, %xmm1
	; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vblendvpd %xmm6, %xmm5, %xmm4, %xmm2
				; AVX1-NEXT: vblendvpd %xmm8, %xmm0, %xmm4, %xmm0
	; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpackuswb %xmm0, %xmm0, %xmm0			; AVX1-NEXT: vpackuswb %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vmovq %xmm0, (%rdi)			; AVX1-NEXT: vmovq %xmm0, (%rdi)
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: trunc_usat_v8i64_v8i8_store:			; AVX2-LABEL: trunc_usat_v8i64_v8i8_store:
	▲ Show 20 Lines • Show All 368 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: packusdw %xmm1, %xmm9			; SSE41-NEXT: packusdw %xmm1, %xmm9
	; SSE41-NEXT: packusdw %xmm9, %xmm2			; SSE41-NEXT: packusdw %xmm9, %xmm2
	; SSE41-NEXT: packuswb %xmm2, %xmm13			; SSE41-NEXT: packuswb %xmm2, %xmm13
	; SSE41-NEXT: movdqa %xmm13, %xmm0			; SSE41-NEXT: movdqa %xmm13, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_usat_v16i64_v16i8:			; AVX1-LABEL: trunc_usat_v16i64_v16i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm8 = [255,255,255,255]			; AVX1-NEXT: vmovdqa %ymm0, %ymm8
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5			; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vpxor %xmm5, %xmm8, %xmm4
	; AVX1-NEXT: vpxor %xmm6, %xmm5, %xmm5			; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [9223372036854776063,9223372036854776063]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm7 = [9223372036854776063,9223372036854776063]			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm5			; AVX1-NEXT: vmovdqa %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; AVX1-NEXT: vpxor %xmm6, %xmm0, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm8, %xmm11
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm7, %xmm4			; AVX1-NEXT: vpxor %xmm5, %xmm11, %xmm4
	; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm4, %ymm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm0
	; AVX1-NEXT: vblendvpd %ymm4, %ymm0, %ymm8, %ymm0			; AVX1-NEXT: vmovdqa %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4			; AVX1-NEXT: vpxor %xmm5, %xmm1, %xmm4
	; AVX1-NEXT: vpxor %xmm6, %xmm4, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm10
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm7, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm14
	; AVX1-NEXT: vpxor %xmm6, %xmm1, %xmm5			; AVX1-NEXT: vpxor %xmm5, %xmm14, %xmm7
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm5			; AVX1-NEXT: vpcmpgtq %xmm7, %xmm6, %xmm12
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4			; AVX1-NEXT: vpxor %xmm5, %xmm2, %xmm7
	; AVX1-NEXT: vblendvpd %ymm4, %ymm1, %ymm8, %ymm1			; AVX1-NEXT: vpcmpgtq %xmm7, %xmm6, %xmm13
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm7
	; AVX1-NEXT: vpxor %xmm6, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm5, %xmm7, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm7, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm15
	; AVX1-NEXT: vpxor %xmm6, %xmm2, %xmm5			; AVX1-NEXT: vpxor %xmm5, %xmm3, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm5			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm4
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm0
	; AVX1-NEXT: vblendvpd %ymm4, %ymm2, %ymm8, %ymm2			; AVX1-NEXT: vpxor %xmm5, %xmm0, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5
	; AVX1-NEXT: vpxor %xmm6, %xmm4, %xmm4			; AVX1-NEXT: vmovapd {{.*#+}} xmm6 = [255,255]
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm7, %xmm4			; AVX1-NEXT: vblendvpd %xmm5, %xmm0, %xmm6, %xmm9
	; AVX1-NEXT: vpxor %xmm6, %xmm3, %xmm5			; AVX1-NEXT: vblendvpd %xmm4, %xmm3, %xmm6, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm5			; AVX1-NEXT: vblendvpd %xmm15, %xmm7, %xmm6, %xmm4
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4			; AVX1-NEXT: vblendvpd %xmm13, %xmm2, %xmm6, %xmm2
	; AVX1-NEXT: vblendvpd %ymm4, %ymm3, %ymm8, %ymm3			; AVX1-NEXT: vblendvpd %xmm12, %xmm14, %xmm6, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm4			; AVX1-NEXT: vblendvpd %xmm10, %xmm1, %xmm6, %xmm1
	; AVX1-NEXT: vpackusdw %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vmovapd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 16-byte Reload
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4			; AVX1-NEXT: vblendvpd %xmm0, %xmm11, %xmm6, %xmm7
				; AVX1-NEXT: vmovapd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 16-byte Reload
				; AVX1-NEXT: vblendvpd %xmm0, %xmm8, %xmm6, %xmm6
				; AVX1-NEXT: vpackusdw %xmm9, %xmm3, %xmm0
	; AVX1-NEXT: vpackusdw %xmm4, %xmm2, %xmm2			; AVX1-NEXT: vpackusdw %xmm4, %xmm2, %xmm2
	; AVX1-NEXT: vpackusdw %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpackusdw %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vpackusdw %xmm5, %xmm1, %xmm1
	; AVX1-NEXT: vpackusdw %xmm3, %xmm1, %xmm1			; AVX1-NEXT: vpackusdw %xmm7, %xmm6, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpackusdw %xmm1, %xmm2, %xmm1
	; AVX1-NEXT: vpackusdw %xmm3, %xmm0, %xmm0			; AVX1-NEXT: vpackuswb %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpackuswb %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: trunc_usat_v16i64_v16i8:			; AVX2-LABEL: trunc_usat_v16i64_v16i8:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vbroadcastsd {{.*#+}} ymm4 = [255,255,255,255]			; AVX2-NEXT: vbroadcastsd {{.*#+}} ymm4 = [255,255,255,255]
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm5 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm5 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %ymm5, %ymm1, %ymm6			; AVX2-NEXT: vpxor %ymm5, %ymm1, %ymm6
	▲ Show 20 Lines • Show All 606 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-trunc-usat.ll

	Show First 20 Lines • Show All 106 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4
	; SSE41-NEXT: shufps {{.*#+}} xmm4 = xmm4[0,2],xmm5[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm4 = xmm4[0,2],xmm5[0,2]
	; SSE41-NEXT: movaps %xmm4, %xmm0			; SSE41-NEXT: movaps %xmm4, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_usat_v4i64_v4i32:			; AVX1-LABEL: trunc_usat_v4i64_v4i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vpxor %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372041149743103,9223372041149743103]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372041149743103,9223372041149743103]
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm2, %ymm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [4294967295,4294967295,4294967295,429496729]			; AVX1-NEXT: vpxor %xmm1, %xmm4, %xmm1
	; AVX1-NEXT: vblendvpd %ymm1, %ymm0, %ymm2, %ymm0			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vmovapd {{.*#+}} xmm3 = [4294967295,429496729]
				; AVX1-NEXT: vblendvpd %xmm1, %xmm4, %xmm3, %xmm1
				; AVX1-NEXT: vmovapd {{.*#+}} xmm3 = [4294967295,4294967295]
				; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[0,2]			; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[0,2]
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-SLOW-LABEL: trunc_usat_v4i64_v4i32:			; AVX2-SLOW-LABEL: trunc_usat_v4i64_v4i32:
	; AVX2-SLOW: # %bb.0:			; AVX2-SLOW: # %bb.0:
	; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm1 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm1 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; AVX2-SLOW-NEXT: vpxor %ymm1, %ymm0, %ymm1			; AVX2-SLOW-NEXT: vpxor %ymm1, %ymm0, %ymm1
	▲ Show 20 Lines • Show All 241 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm6
	; SSE41-NEXT: shufps {{.*#+}} xmm6 = xmm6[0,2],xmm2[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm6 = xmm6[0,2],xmm2[0,2]
	; SSE41-NEXT: movaps %xmm6, %xmm0			; SSE41-NEXT: movaps %xmm6, %xmm0
	; SSE41-NEXT: movaps %xmm4, %xmm1			; SSE41-NEXT: movaps %xmm4, %xmm1
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_usat_v8i64_v8i32:			; AVX1-LABEL: trunc_usat_v8i64_v8i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [4294967295,4294967295,4294967295,4294967295]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372041149743103,9223372041149743103]
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm8
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372041149743103,9223372041149743103]			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm5, %xmm6
	; AVX1-NEXT: vpxor %xmm4, %xmm0, %xmm6			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm4, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm6			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm7
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm6, %ymm3			; AVX1-NEXT: vpcmpgtq %xmm7, %xmm4, %xmm7
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2
	; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm4			; AVX1-NEXT: vmovapd {{.*#+}} xmm4 = [4294967295,4294967295]
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vblendvpd %xmm2, %xmm3, %xmm4, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3			; AVX1-NEXT: vblendvpd %xmm7, %xmm1, %xmm4, %xmm1
	; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vshufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]			; AVX1-NEXT: vshufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vblendvpd %xmm6, %xmm5, %xmm4, %xmm2
				; AVX1-NEXT: vblendvpd %xmm8, %xmm0, %xmm4, %xmm0
	; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm2[0,2]			; AVX1-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm2[0,2]
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-SLOW-LABEL: trunc_usat_v8i64_v8i32:			; AVX2-SLOW-LABEL: trunc_usat_v8i64_v8i32:
	; AVX2-SLOW: # %bb.0:			; AVX2-SLOW: # %bb.0:
	; AVX2-SLOW-NEXT: vbroadcastsd {{.*#+}} ymm2 = [4294967295,4294967295,4294967295,4294967295]			; AVX2-SLOW-NEXT: vbroadcastsd {{.*#+}} ymm2 = [4294967295,4294967295,4294967295,4294967295]
	; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm3 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} ymm3 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 232 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5
	; SSE41-NEXT: packusdw %xmm4, %xmm5			; SSE41-NEXT: packusdw %xmm4, %xmm5
	; SSE41-NEXT: packusdw %xmm5, %xmm1			; SSE41-NEXT: packusdw %xmm5, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_usat_v8i64_v8i16:			; AVX1-LABEL: trunc_usat_v8i64_v8i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [65535,65535,65535,65535]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854841343,9223372036854841343]
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm8
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854841343,9223372036854841343]			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm5, %xmm6
	; AVX1-NEXT: vpxor %xmm4, %xmm0, %xmm6			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm4, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm6			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm7
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm6, %ymm3			; AVX1-NEXT: vpcmpgtq %xmm7, %xmm4, %xmm7
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2
	; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm4			; AVX1-NEXT: vmovapd {{.*#+}} xmm4 = [65535,65535]
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vblendvpd %xmm2, %xmm3, %xmm4, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3			; AVX1-NEXT: vblendvpd %xmm7, %xmm1, %xmm4, %xmm1
	; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vblendvpd %xmm6, %xmm5, %xmm4, %xmm2
				; AVX1-NEXT: vblendvpd %xmm8, %xmm0, %xmm4, %xmm0
	; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: trunc_usat_v8i64_v8i16:			; AVX2-LABEL: trunc_usat_v8i64_v8i16:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vbroadcastsd {{.*#+}} ymm2 = [65535,65535,65535,65535]			; AVX2-NEXT: vbroadcastsd {{.*#+}} ymm2 = [65535,65535,65535,65535]
	▲ Show 20 Lines • Show All 445 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5
	; SSE41-NEXT: packusdw %xmm4, %xmm5			; SSE41-NEXT: packusdw %xmm4, %xmm5
	; SSE41-NEXT: packusdw %xmm5, %xmm1			; SSE41-NEXT: packusdw %xmm5, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_usat_v8i64_v8i8:			; AVX1-LABEL: trunc_usat_v8i64_v8i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [255,255,255,255]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854776063,9223372036854776063]
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm8
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854776063,9223372036854776063]			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm5, %xmm6
	; AVX1-NEXT: vpxor %xmm4, %xmm0, %xmm6			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm4, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm6			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm7
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm6, %ymm3			; AVX1-NEXT: vpcmpgtq %xmm7, %xmm4, %xmm7
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2
	; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm4			; AVX1-NEXT: vmovapd {{.*#+}} xmm4 = [255,255]
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vblendvpd %xmm2, %xmm3, %xmm4, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3			; AVX1-NEXT: vblendvpd %xmm7, %xmm1, %xmm4, %xmm1
	; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vblendvpd %xmm6, %xmm5, %xmm4, %xmm2
				; AVX1-NEXT: vblendvpd %xmm8, %xmm0, %xmm4, %xmm0
	; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: trunc_usat_v8i64_v8i8:			; AVX2-LABEL: trunc_usat_v8i64_v8i8:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vbroadcastsd {{.*#+}} ymm2 = [255,255,255,255]			; AVX2-NEXT: vbroadcastsd {{.*#+}} ymm2 = [255,255,255,255]
	▲ Show 20 Lines • Show All 203 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: packusdw %xmm4, %xmm5			; SSE41-NEXT: packusdw %xmm4, %xmm5
	; SSE41-NEXT: packusdw %xmm5, %xmm1			; SSE41-NEXT: packusdw %xmm5, %xmm1
	; SSE41-NEXT: packuswb %xmm1, %xmm1			; SSE41-NEXT: packuswb %xmm1, %xmm1
	; SSE41-NEXT: movq %xmm1, (%rdi)			; SSE41-NEXT: movq %xmm1, (%rdi)
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_usat_v8i64_v8i8_store:			; AVX1-LABEL: trunc_usat_v8i64_v8i8_store:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [255,255,255,255]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854776063,9223372036854776063]
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm8
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854776063,9223372036854776063]			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm5, %xmm6
	; AVX1-NEXT: vpxor %xmm4, %xmm0, %xmm6			; AVX1-NEXT: vpcmpgtq %xmm6, %xmm4, %xmm6
	; AVX1-NEXT: vpcmpgtq %xmm6, %xmm5, %xmm6			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm7
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm6, %ymm3			; AVX1-NEXT: vpcmpgtq %xmm7, %xmm4, %xmm7
	; AVX1-NEXT: vblendvpd %ymm3, %ymm0, %ymm2, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm5, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm4, %xmm2
	; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm4			; AVX1-NEXT: vmovapd {{.*#+}} xmm4 = [255,255]
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vblendvpd %xmm2, %xmm3, %xmm4, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3			; AVX1-NEXT: vblendvpd %xmm7, %xmm1, %xmm4, %xmm1
	; AVX1-NEXT: vblendvpd %ymm3, %ymm1, %ymm2, %ymm1
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpackusdw %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vblendvpd %xmm6, %xmm5, %xmm4, %xmm2
				; AVX1-NEXT: vblendvpd %xmm8, %xmm0, %xmm4, %xmm0
	; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpackuswb %xmm0, %xmm0, %xmm0			; AVX1-NEXT: vpackuswb %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vmovq %xmm0, (%rdi)			; AVX1-NEXT: vmovq %xmm0, (%rdi)
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: trunc_usat_v8i64_v8i8_store:			; AVX2-LABEL: trunc_usat_v8i64_v8i8_store:
	▲ Show 20 Lines • Show All 366 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: packusdw %xmm1, %xmm9			; SSE41-NEXT: packusdw %xmm1, %xmm9
	; SSE41-NEXT: packusdw %xmm9, %xmm2			; SSE41-NEXT: packusdw %xmm9, %xmm2
	; SSE41-NEXT: packuswb %xmm2, %xmm13			; SSE41-NEXT: packuswb %xmm2, %xmm13
	; SSE41-NEXT: movdqa %xmm13, %xmm0			; SSE41-NEXT: movdqa %xmm13, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_usat_v16i64_v16i8:			; AVX1-LABEL: trunc_usat_v16i64_v16i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm8 = [255,255,255,255]			; AVX1-NEXT: vmovdqa %ymm0, %ymm8
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5			; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vpxor %xmm5, %xmm8, %xmm4
	; AVX1-NEXT: vpxor %xmm6, %xmm5, %xmm5			; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [9223372036854776063,9223372036854776063]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm7 = [9223372036854776063,9223372036854776063]			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm5			; AVX1-NEXT: vmovdqa %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; AVX1-NEXT: vpxor %xmm6, %xmm0, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm8, %xmm11
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm7, %xmm4			; AVX1-NEXT: vpxor %xmm5, %xmm11, %xmm4
	; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm4, %ymm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm0
	; AVX1-NEXT: vblendvpd %ymm4, %ymm0, %ymm8, %ymm0			; AVX1-NEXT: vmovdqa %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4			; AVX1-NEXT: vpxor %xmm5, %xmm1, %xmm4
	; AVX1-NEXT: vpxor %xmm6, %xmm4, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm10
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm7, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm14
	; AVX1-NEXT: vpxor %xmm6, %xmm1, %xmm5			; AVX1-NEXT: vpxor %xmm5, %xmm14, %xmm7
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm5			; AVX1-NEXT: vpcmpgtq %xmm7, %xmm6, %xmm12
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4			; AVX1-NEXT: vpxor %xmm5, %xmm2, %xmm7
	; AVX1-NEXT: vblendvpd %ymm4, %ymm1, %ymm8, %ymm1			; AVX1-NEXT: vpcmpgtq %xmm7, %xmm6, %xmm13
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm7
	; AVX1-NEXT: vpxor %xmm6, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm5, %xmm7, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm7, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm15
	; AVX1-NEXT: vpxor %xmm6, %xmm2, %xmm5			; AVX1-NEXT: vpxor %xmm5, %xmm3, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm5			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm4
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm0
	; AVX1-NEXT: vblendvpd %ymm4, %ymm2, %ymm8, %ymm2			; AVX1-NEXT: vpxor %xmm5, %xmm0, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5
	; AVX1-NEXT: vpxor %xmm6, %xmm4, %xmm4			; AVX1-NEXT: vmovapd {{.*#+}} xmm6 = [255,255]
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm7, %xmm4			; AVX1-NEXT: vblendvpd %xmm5, %xmm0, %xmm6, %xmm9
	; AVX1-NEXT: vpxor %xmm6, %xmm3, %xmm5			; AVX1-NEXT: vblendvpd %xmm4, %xmm3, %xmm6, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm7, %xmm5			; AVX1-NEXT: vblendvpd %xmm15, %xmm7, %xmm6, %xmm4
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4			; AVX1-NEXT: vblendvpd %xmm13, %xmm2, %xmm6, %xmm2
	; AVX1-NEXT: vblendvpd %ymm4, %ymm3, %ymm8, %ymm3			; AVX1-NEXT: vblendvpd %xmm12, %xmm14, %xmm6, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm4			; AVX1-NEXT: vblendvpd %xmm10, %xmm1, %xmm6, %xmm1
	; AVX1-NEXT: vpackusdw %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vmovapd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 16-byte Reload
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4			; AVX1-NEXT: vblendvpd %xmm0, %xmm11, %xmm6, %xmm7
				; AVX1-NEXT: vmovapd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 16-byte Reload
				; AVX1-NEXT: vblendvpd %xmm0, %xmm8, %xmm6, %xmm6
				; AVX1-NEXT: vpackusdw %xmm9, %xmm3, %xmm0
	; AVX1-NEXT: vpackusdw %xmm4, %xmm2, %xmm2			; AVX1-NEXT: vpackusdw %xmm4, %xmm2, %xmm2
	; AVX1-NEXT: vpackusdw %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpackusdw %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vpackusdw %xmm5, %xmm1, %xmm1
	; AVX1-NEXT: vpackusdw %xmm3, %xmm1, %xmm1			; AVX1-NEXT: vpackusdw %xmm7, %xmm6, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpackusdw %xmm1, %xmm2, %xmm1
	; AVX1-NEXT: vpackusdw %xmm3, %xmm0, %xmm0			; AVX1-NEXT: vpackuswb %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vpackusdw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpackuswb %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: trunc_usat_v16i64_v16i8:			; AVX2-LABEL: trunc_usat_v16i64_v16i8:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vbroadcastsd {{.*#+}} ymm4 = [255,255,255,255]			; AVX2-NEXT: vbroadcastsd {{.*#+}} ymm4 = [255,255,255,255]
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm5 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm5 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %ymm5, %ymm1, %ymm6			; AVX2-NEXT: vpxor %ymm5, %ymm1, %ymm6
	▲ Show 20 Lines • Show All 591 Lines • Show Last 20 Lines