This is an archive of the discontinued LLVM Phabricator instance.

[x86] flatten packss+movmsk into 256-bit movmsk
AbandonedPublic

Authored by RKSimon on Mar 27 2019, 5:04 PM.

Download Raw Diff

Details

Reviewers

craig.topper
spatel

Summary

I think we can end up with packss+movmsk sequences either because the code was written that way with intrinsics or because we have a likely over-enthusiastic DAG transform that is seeking to prevent something like this with AVX1:

@@ -377,8 +386,8 @@ define i64 @test_v4i64_legal_sext(<4 x i64> %a0, <4 x i64> %a1) {
 ; AVX1-NEXT:    vextractf128 $1, %ymm0, %xmm3
 ; AVX1-NEXT:    vpcmpgtq %xmm2, %xmm3, %xmm2
 ; AVX1-NEXT:    vpcmpgtq %xmm1, %xmm0, %xmm0
-; AVX1-NEXT:    vpackssdw %xmm2, %xmm0, %xmm0
-; AVX1-NEXT:    vmovmskps %xmm0, %eax
+; AVX1-NEXT:    vinsertf128 $1, %xmm2, %ymm0, %ymm0
+; AVX1-NEXT:    vmovmskps %ymm0, %eax

That's also why *this* patch is limited for AVX1. I'm not sure yet what it would take to get that right in all cases.

There's potentially a better way to solve more of these patterns generally: always sink extends after shuffles, so we're shuffling bool vectors early in SDAG. That's almost certainly needed in IR to unlock some missed vector optimization, and we could repeat it here in the DAG (possibly with a hook), but I don't think it obviates the need for this patch.

Diff Detail

Event Timeline

spatel created this revision.Mar 27 2019, 5:04 PM

Herald added a project: Restricted Project. · View Herald TranscriptMar 27 2019, 5:04 PM

Herald added subscribers: hiraditya, mcrosier. · View Herald Transcript

The movmsk being used on vXi16 is worrying me

llvm/test/CodeGen/X86/bitcast-and-setcc-256.ll
139	Haven't check it thoroughly - but how come this isn't vmovmskpd ymm0? For both AVX1 and AVX2.
205	I don't think this is going to work - we end up with a movmsk of a 32i8 (i32 instead of a i16 zext).

spatel planned changes to this revision.Mar 28 2019, 6:01 AM

spatel marked an inline comment as done.

spatel added inline comments.

llvm/test/CodeGen/X86/bitcast-and-setcc-256.ll
205	Argh...yes, this is wrong. I need to rethink this patch.

spatel mentioned this in D60610: [X86][SSE] Recognise vXi1 boolean anyof/allof reduction patterns.Apr 12 2019, 6:44 AM

After chatting with @spatel I'm going to deal with this as a followup to D60610

Abandoning - we've now covered this with a mixture of combineSetCCMOVMSK and PromoteMaskArithmetic

Revision Contents

Path

Size

llvm/

lib/

Target/

X86/

X86ISelLowering.cpp

50 lines

test/

CodeGen/

X86/

bitcast-and-setcc-256.ll

40 lines

bitcast-setcc-256.ll

8 lines

bitcast-setcc-512.ll

31 lines

movmsk-cmp.ll

114 lines

vector-compare-all_of.ll

86 lines

vector-compare-any_of.ll

83 lines

Diff 192544

llvm/lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 40,906 Lines • ▼ Show 20 Lines	static SDValue combineSetCC(SDNode *N, SelectionDAG &DAG,
// to avoid scalarization via legalization because v4i32 is not a legal type.		// to avoid scalarization via legalization because v4i32 is not a legal type.
if (Subtarget.hasSSE1() && !Subtarget.hasSSE2() && VT == MVT::v4i32 &&		if (Subtarget.hasSSE1() && !Subtarget.hasSSE2() && VT == MVT::v4i32 &&
LHS.getValueType() == MVT::v4f32)		LHS.getValueType() == MVT::v4f32)
return LowerVSETCC(SDValue(N, 0), Subtarget, DAG);		return LowerVSETCC(SDValue(N, 0), Subtarget, DAG);

return SDValue();		return SDValue();
}		}

		static SDValue combineMovmskPackss(SDNode *Movmsk, SelectionDAG &DAG,
		const X86Subtarget &Subtarget) {
		// Make sure we can replace a 128-bit MOVMSK with a 256-bit MOVMSK.
		// TODO: It may be possible to ease the i32/i64 constraint to allow more
		// optimization with AVX1.
		MVT MovmskVecVT = Movmsk->getOperand(0).getSimpleValueType();
		if (!MovmskVecVT.is128BitVector())
		return SDValue();
		MVT EltVT = MovmskVecVT.getVectorElementType();
		bool CanMovmsk256FP =
		((EltVT == MVT::f32 \|\| EltVT == MVT::f64) && Subtarget.hasAVX()) \|\|
		((EltVT == MVT::i32 \|\| EltVT == MVT::i64) && Subtarget.hasAVX2());
		bool CanMovmsk_v32i8 = EltVT == MVT::i8 && Subtarget.hasAVX2();
		if (!CanMovmsk256FP && !CanMovmsk_v32i8)
		return SDValue();

		// There has to be a PACKSS operand to this MOVMSK.
		SDValue Packss = peekThroughBitcasts(Movmsk->getOperand(0));
		if (Packss.getOpcode() != X86ISD::PACKSS)
		return SDValue();

		// The PACKSS must use 2 extracted halves of a common source vector.
		SDValue Extract0 = peekThroughBitcasts(Packss.getOperand(0));
		SDValue Extract1 = peekThroughBitcasts(Packss.getOperand(1));
		if (Extract0.getOpcode() != ISD::EXTRACT_SUBVECTOR \|\|
		Extract1.getOpcode() != ISD::EXTRACT_SUBVECTOR)
		return SDValue();
		SDValue X = Extract0.getOperand(0);
		MVT XVT = X.getSimpleValueType();
		if (X != Extract1.getOperand(0) \|\| !XVT.is256BitVector())
		return SDValue();
		if (!isNullConstant(Extract0.getOperand(1)))
		return SDValue();
		auto *Index1C = dyn_cast<ConstantSDNode>(Extract1.getOperand(1));
		if (!Index1C \|\| Index1C->getZExtValue() != XVT.getVectorNumElements() / 2)
		return SDValue();

		// movmsk (packss (extract X, 0), (extract X, 2)) --> movmsk (bitcast X)
		MVT VT256 = MVT::getVectorVT(EltVT, MovmskVecVT.getVectorNumElements() * 2);
		SDValue CastX = DAG.getBitcast(VT256, X);
		MVT VT = Movmsk->getSimpleValueType(0);
		return DAG.getNode(X86ISD::MOVMSK, SDLoc(Movmsk), VT, CastX);
		}

static SDValue combineMOVMSK(SDNode *N, SelectionDAG &DAG,		static SDValue combineMOVMSK(SDNode *N, SelectionDAG &DAG,
		const X86Subtarget &Subtarget,
TargetLowering::DAGCombinerInfo &DCI) {		TargetLowering::DAGCombinerInfo &DCI) {
SDValue Src = N->getOperand(0);		SDValue Src = N->getOperand(0);
MVT SrcVT = Src.getSimpleValueType();		MVT SrcVT = Src.getSimpleValueType();
MVT VT = N->getSimpleValueType(0);		MVT VT = N->getSimpleValueType(0);

// Perform constant folding.		// Perform constant folding.
if (ISD::isBuildVectorOfConstantSDNodes(Src.getNode())) {		if (ISD::isBuildVectorOfConstantSDNodes(Src.getNode())) {
assert(VT == MVT::i32 && "Unexpected result type");		assert(VT == MVT::i32 && "Unexpected result type");
▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines	if (And.hasOneUse() &&
}		}
SDValue Shl = DAG.getNode(ISD::SHL, DL, VT, X,		SDValue Shl = DAG.getNode(ISD::SHL, DL, VT, X,
DAG.getConstant(ShAmt, DL, VT));		DAG.getConstant(ShAmt, DL, VT));
SDValue Cast = DAG.getBitcast(SrcVT, Shl);		SDValue Cast = DAG.getBitcast(SrcVT, Shl);
return DAG.getNode(X86ISD::MOVMSK, SDLoc(N), N->getValueType(0), Cast);		return DAG.getNode(X86ISD::MOVMSK, SDLoc(N), N->getValueType(0), Cast);
}		}
}		}

		if (SDValue V = combineMovmskPackss(N, DAG, Subtarget))
		return V;

return SDValue();		return SDValue();
}		}

static SDValue combineGatherScatter(SDNode *N, SelectionDAG &DAG,		static SDValue combineGatherScatter(SDNode *N, SelectionDAG &DAG,
TargetLowering::DAGCombinerInfo &DCI,		TargetLowering::DAGCombinerInfo &DCI,
const X86Subtarget &Subtarget) {		const X86Subtarget &Subtarget) {
SDLoc DL(N);		SDLoc DL(N);

▲ Show 20 Lines • Show All 1,780 Lines • ▼ Show 20 Lines	SDValue X86TargetLowering::PerformDAGCombine(SDNode *N,
case X86ISD::FNMADD_RND:		case X86ISD::FNMADD_RND:
case X86ISD::FNMSUB:		case X86ISD::FNMSUB:
case X86ISD::FNMSUB_RND:		case X86ISD::FNMSUB_RND:
case ISD::FMA: return combineFMA(N, DAG, Subtarget);		case ISD::FMA: return combineFMA(N, DAG, Subtarget);
case X86ISD::FMADDSUB_RND:		case X86ISD::FMADDSUB_RND:
case X86ISD::FMSUBADD_RND:		case X86ISD::FMSUBADD_RND:
case X86ISD::FMADDSUB:		case X86ISD::FMADDSUB:
case X86ISD::FMSUBADD: return combineFMADDSUB(N, DAG, Subtarget);		case X86ISD::FMSUBADD: return combineFMADDSUB(N, DAG, Subtarget);
case X86ISD::MOVMSK: return combineMOVMSK(N, DAG, DCI);		case X86ISD::MOVMSK: return combineMOVMSK(N, DAG, Subtarget, DCI);
case X86ISD::MGATHER:		case X86ISD::MGATHER:
case X86ISD::MSCATTER:		case X86ISD::MSCATTER:
case ISD::MGATHER:		case ISD::MGATHER:
case ISD::MSCATTER: return combineGatherScatter(N, DAG, DCI, Subtarget);		case ISD::MSCATTER: return combineGatherScatter(N, DAG, DCI, Subtarget);
case X86ISD::PCMPEQ:		case X86ISD::PCMPEQ:
case X86ISD::PCMPGT: return combineVectorCompare(N, DAG, Subtarget);		case X86ISD::PCMPGT: return combineVectorCompare(N, DAG, Subtarget);
case X86ISD::PMULDQ:		case X86ISD::PMULDQ:
case X86ISD::PMULUDQ: return combinePMULDQ(N, DAG, DCI);		case X86ISD::PMULUDQ: return combinePMULDQ(N, DAG, DCI);
▲ Show 20 Lines • Show All 1,187 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/bitcast-and-setcc-256.ll

	Show First 20 Lines • Show All 70 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: v4i64:			; AVX2-LABEL: v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpcmpgtq %ymm3, %ymm2, %ymm1			; AVX2-NEXT: vpcmpgtq %ymm3, %ymm2, %ymm1
	; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vmovmskps %ymm0, %eax
	; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovmskps %xmm0, %eax
	; AVX2-NEXT: # kill: def $al killed $al killed $eax			; AVX2-NEXT: # kill: def $al killed $al killed $eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: v4i64:			; AVX512F-LABEL: v4i64:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpcmpgtq %ymm1, %ymm0, %k1			; AVX512F-NEXT: vpcmpgtq %ymm1, %ymm0, %k1
	; AVX512F-NEXT: vpcmpgtq %ymm3, %ymm2, %k0 {%k1}			; AVX512F-NEXT: vpcmpgtq %ymm3, %ymm2, %k0 {%k1}
	Show All 26 Lines
	; SSE2-SSSE3-NEXT: cmpltpd %xmm5, %xmm7			; SSE2-SSSE3-NEXT: cmpltpd %xmm5, %xmm7
	; SSE2-SSSE3-NEXT: cmpltpd %xmm4, %xmm6			; SSE2-SSSE3-NEXT: cmpltpd %xmm4, %xmm6
	; SSE2-SSSE3-NEXT: shufps {{.*#+}} xmm6 = xmm6[0,2],xmm7[0,2]			; SSE2-SSSE3-NEXT: shufps {{.*#+}} xmm6 = xmm6[0,2],xmm7[0,2]
	; SSE2-SSSE3-NEXT: andps %xmm2, %xmm6			; SSE2-SSSE3-NEXT: andps %xmm2, %xmm6
	; SSE2-SSSE3-NEXT: movmskps %xmm6, %eax			; SSE2-SSSE3-NEXT: movmskps %xmm6, %eax
	; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax			; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax
	; SSE2-SSSE3-NEXT: retq			; SSE2-SSSE3-NEXT: retq
	;			;
	; AVX12-LABEL: v4f64:			; AVX1-LABEL: v4f64:
	; AVX12: # %bb.0:			; AVX1: # %bb.0:
	; AVX12-NEXT: vcmpltpd %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vcmpltpd %ymm0, %ymm1, %ymm0
	; AVX12-NEXT: vcmpltpd %ymm2, %ymm3, %ymm1			; AVX1-NEXT: vcmpltpd %ymm2, %ymm3, %ymm1
	; AVX12-NEXT: vandpd %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vandpd %ymm1, %ymm0, %ymm0
	; AVX12-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX12-NEXT: vpackssdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
	; AVX12-NEXT: vmovmskps %xmm0, %eax			; AVX1-NEXT: vmovmskps %xmm0, %eax
	; AVX12-NEXT: # kill: def $al killed $al killed $eax			; AVX1-NEXT: # kill: def $al killed $al killed $eax
	; AVX12-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX12-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: v4f64:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vcmpltpd %ymm0, %ymm1, %ymm0
				; AVX2-NEXT: vcmpltpd %ymm2, %ymm3, %ymm1
				; AVX2-NEXT: vandpd %ymm1, %ymm0, %ymm0
				; AVX2-NEXT: vmovmskps %ymm0, %eax
				RKSimonAuthorUnsubmitted Not Done Reply Inline Actions Haven't check it thoroughly - but how come this isn't vmovmskpd ymm0? For both AVX1 and AVX2. RKSimon: Haven't check it thoroughly - but how come this isn't vmovmskpd ymm0? For both AVX1 and AVX2.
				; AVX2-NEXT: # kill: def $al killed $al killed $eax
				; AVX2-NEXT: vzeroupper
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: v4f64:			; AVX512F-LABEL: v4f64:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vcmpltpd %ymm0, %ymm1, %k1			; AVX512F-NEXT: vcmpltpd %ymm0, %ymm1, %k1
	; AVX512F-NEXT: vcmpltpd %ymm2, %ymm3, %k0 {%k1}			; AVX512F-NEXT: vcmpltpd %ymm2, %ymm3, %k0 {%k1}
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: # kill: def $al killed $al killed $eax			; AVX512F-NEXT: # kill: def $al killed $al killed $eax
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: v16i16:			; AVX2-LABEL: v16i16:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpcmpgtw %ymm3, %ymm2, %ymm1			; AVX2-NEXT: vpcmpgtw %ymm3, %ymm2, %ymm1
	; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpmovmskb %ymm0, %eax
				RKSimonAuthorUnsubmitted Not Done Reply Inline Actions I don't think this is going to work - we end up with a movmsk of a 32i8 (i32 instead of a i16 zext). RKSimon: I don't think this is going to work - we end up with a movmsk of a 32i8 (i32 instead of a i16…
				spatelUnsubmitted Done Reply Inline Actions Argh...yes, this is wrong. I need to rethink this patch. spatel: Argh...yes, this is wrong. I need to rethink this patch.
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: # kill: def $ax killed $ax killed $eax			; AVX2-NEXT: # kill: def $ax killed $ax killed $eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: v16i16:			; AVX512F-LABEL: v16i16:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0			; AVX512F-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0
	; AVX512F-NEXT: vpcmpgtw %ymm3, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpgtw %ymm3, %ymm2, %ymm1
	▲ Show 20 Lines • Show All 513 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/bitcast-setcc-256.ll

	Show All 25 Lines
	; AVX1-NEXT: vpmovmskb %xmm0, %eax			; AVX1-NEXT: vpmovmskb %xmm0, %eax
	; AVX1-NEXT: # kill: def $ax killed $ax killed $eax			; AVX1-NEXT: # kill: def $ax killed $ax killed $eax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: v16i16:			; AVX2-LABEL: v16i16:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: # kill: def $ax killed $ax killed $eax			; AVX2-NEXT: # kill: def $ax killed $ax killed $eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: v16i16:			; AVX512F-LABEL: v16i16:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0			; AVX512F-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0
	; AVX512F-NEXT: vpmovsxwd %ymm0, %zmm0			; AVX512F-NEXT: vpmovsxwd %ymm0, %zmm0
	▲ Show 20 Lines • Show All 334 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: movw %ax, (%rdi)			; AVX1-NEXT: movw %ax, (%rdi)
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: bitcast_16i16_store:			; AVX2-LABEL: bitcast_16i16_store:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; AVX2-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: movw %ax, (%rdi)			; AVX2-NEXT: movw %ax, (%rdi)
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: bitcast_16i16_store:			; AVX512F-LABEL: bitcast_16i16_store:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; AVX512F-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	▲ Show 20 Lines • Show All 114 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/bitcast-setcc-512.ll

	Show First 20 Lines • Show All 103 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpmovmskb %xmm0, %eax			; AVX1-NEXT: vpmovmskb %xmm0, %eax
	; AVX1-NEXT: # kill: def $ax killed $ax killed $eax			; AVX1-NEXT: # kill: def $ax killed $ax killed $eax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: v16i32:			; AVX2-LABEL: v16i32:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtd %ymm3, %ymm1, %ymm1
	; AVX2-NEXT: vpcmpgtd %ymm2, %ymm0, %ymm0			; AVX2-NEXT: vpcmpgtd %ymm2, %ymm0, %ymm0
	; AVX2-NEXT: vpackssdw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpackssdw %ymm0, %ymm0, %ymm0
	; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]			; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: # kill: def $ax killed $ax killed $eax			; AVX2-NEXT: # kill: def $ax killed $ax killed $eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: v16i32:			; AVX512F-LABEL: v16i32:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpcmpgtd %zmm1, %zmm0, %k0			; AVX512F-NEXT: vpcmpgtd %zmm1, %zmm0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	Show All 38 Lines
	; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpmovmskb %xmm0, %eax			; AVX1-NEXT: vpmovmskb %xmm0, %eax
	; AVX1-NEXT: # kill: def $ax killed $ax killed $eax			; AVX1-NEXT: # kill: def $ax killed $ax killed $eax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: v16f32:			; AVX2-LABEL: v16f32:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vcmpltps %ymm1, %ymm3, %ymm1
	; AVX2-NEXT: vcmpltps %ymm0, %ymm2, %ymm0			; AVX2-NEXT: vcmpltps %ymm0, %ymm2, %ymm0
	; AVX2-NEXT: vpackssdw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpackssdw %ymm0, %ymm0, %ymm0
	; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]			; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: # kill: def $ax killed $ax killed $eax			; AVX2-NEXT: # kill: def $ax killed $ax killed $eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: v16f32:			; AVX512F-LABEL: v16f32:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vcmpltps %zmm0, %zmm1, %k0			; AVX512F-NEXT: vcmpltps %zmm0, %zmm1, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	▲ Show 20 Lines • Show All 399 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpmovmskb %xmm0, %eax			; AVX1-NEXT: vpmovmskb %xmm0, %eax
	; AVX1-NEXT: movw %ax, (%rdi)			; AVX1-NEXT: movw %ax, (%rdi)
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: bitcast_16i32_store:			; AVX2-LABEL: bitcast_16i32_store:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpgtd %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpgtd %ymm0, %ymm1, %ymm0
	; AVX2-NEXT: vpcmpgtd %ymm0, %ymm2, %ymm0			; AVX2-NEXT: vpackssdw %ymm0, %ymm0, %ymm0
	; AVX2-NEXT: vpackssdw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]
	; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: movw %ax, (%rdi)			; AVX2-NEXT: movw %ax, (%rdi)
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: bitcast_16i32_store:			; AVX512-LABEL: bitcast_16i32_store:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512-NEXT: vpcmpgtd %zmm0, %zmm1, %k0			; AVX512-NEXT: vpcmpgtd %zmm0, %zmm1, %k0
	▲ Show 20 Lines • Show All 79 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/movmsk-cmp.ll

	Show First 20 Lines • Show All 427 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: sete %al			; AVX1-NEXT: sete %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: allones_v16i16_sign:			; AVX2-LABEL: allones_v16i16_sign:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; AVX2-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: cmpw $-1, %ax			; AVX2-NEXT: cmpw $-1, %ax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; KNL-LABEL: allones_v16i16_sign:			; KNL-LABEL: allones_v16i16_sign:
	; KNL: # %bb.0:			; KNL: # %bb.0:
	; KNL-NEXT: vpxor %xmm1, %xmm1, %xmm1			; KNL-NEXT: vpxor %xmm1, %xmm1, %xmm1
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: sete %al			; AVX1-NEXT: sete %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: allzeros_v16i16_sign:			; AVX2-LABEL: allzeros_v16i16_sign:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; AVX2-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: testw %ax, %ax			; AVX2-NEXT: testw %ax, %ax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; KNL-LABEL: allzeros_v16i16_sign:			; KNL-LABEL: allzeros_v16i16_sign:
	; KNL: # %bb.0:			; KNL: # %bb.0:
	; KNL-NEXT: vpxor %xmm1, %xmm1, %xmm1			; KNL-NEXT: vpxor %xmm1, %xmm1, %xmm1
	▲ Show 20 Lines • Show All 391 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpmovmskb %xmm0, %eax			; AVX1-NEXT: vpmovmskb %xmm0, %eax
	; AVX1-NEXT: cmpw $-1, %ax			; AVX1-NEXT: cmpw $-1, %ax
	; AVX1-NEXT: sete %al			; AVX1-NEXT: sete %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: allones_v16i32_sign:			; AVX2-LABEL: allones_v16i32_sign:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpgtd %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpgtd %ymm0, %ymm1, %ymm0
	; AVX2-NEXT: vpcmpgtd %ymm0, %ymm2, %ymm0			; AVX2-NEXT: vpackssdw %ymm0, %ymm0, %ymm0
	; AVX2-NEXT: vpackssdw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]
	; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: cmpw $-1, %ax			; AVX2-NEXT: cmpw $-1, %ax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; KNL-LABEL: allones_v16i32_sign:			; KNL-LABEL: allones_v16i32_sign:
	; KNL: # %bb.0:			; KNL: # %bb.0:
	; KNL-NEXT: vpxor %xmm1, %xmm1, %xmm1			; KNL-NEXT: vpxor %xmm1, %xmm1, %xmm1
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpmovmskb %xmm0, %eax			; AVX1-NEXT: vpmovmskb %xmm0, %eax
	; AVX1-NEXT: testw %ax, %ax			; AVX1-NEXT: testw %ax, %ax
	; AVX1-NEXT: sete %al			; AVX1-NEXT: sete %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: allzeros_v16i32_sign:			; AVX2-LABEL: allzeros_v16i32_sign:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpgtd %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpgtd %ymm0, %ymm1, %ymm0
	; AVX2-NEXT: vpcmpgtd %ymm0, %ymm2, %ymm0			; AVX2-NEXT: vpackssdw %ymm0, %ymm0, %ymm0
	; AVX2-NEXT: vpackssdw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]
	; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: testw %ax, %ax			; AVX2-NEXT: testw %ax, %ax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; KNL-LABEL: allzeros_v16i32_sign:			; KNL-LABEL: allzeros_v16i32_sign:
	; KNL: # %bb.0:			; KNL: # %bb.0:
	; KNL-NEXT: vpxor %xmm1, %xmm1, %xmm1			; KNL-NEXT: vpxor %xmm1, %xmm1, %xmm1
	▲ Show 20 Lines • Show All 853 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: allones_v16i16_and1:			; AVX2-LABEL: allones_v16i16_and1:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} ymm1 = [1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]			; AVX2-NEXT: vmovdqa {{.*#+}} ymm1 = [1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]
	; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: cmpw $-1, %ax			; AVX2-NEXT: cmpw $-1, %ax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; KNL-LABEL: allones_v16i16_and1:			; KNL-LABEL: allones_v16i16_and1:
	; KNL: # %bb.0:			; KNL: # %bb.0:
	; KNL-NEXT: vmovdqa {{.*#+}} ymm1 = [1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]			; KNL-NEXT: vmovdqa {{.*#+}} ymm1 = [1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]
	▲ Show 20 Lines • Show All 246 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: allzeros_v16i16_and1:			; AVX2-LABEL: allzeros_v16i16_and1:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} ymm1 = [1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]			; AVX2-NEXT: vmovdqa {{.*#+}} ymm1 = [1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]
	; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: testw %ax, %ax			; AVX2-NEXT: testw %ax, %ax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; KNL-LABEL: allzeros_v16i16_and1:			; KNL-LABEL: allzeros_v16i16_and1:
	; KNL: # %bb.0:			; KNL: # %bb.0:
	; KNL-NEXT: vmovdqa {{.*#+}} ymm1 = [1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]			; KNL-NEXT: vmovdqa {{.*#+}} ymm1 = [1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]
	▲ Show 20 Lines • Show All 271 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpmovmskb %xmm0, %eax			; AVX1-NEXT: vpmovmskb %xmm0, %eax
	; AVX1-NEXT: cmpw $-1, %ax			; AVX1-NEXT: cmpw $-1, %ax
	; AVX1-NEXT: sete %al			; AVX1-NEXT: sete %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: allones_v16i32_and1:			; AVX2-LABEL: allones_v16i32_and1:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastd {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1]			; AVX2-NEXT: vpbroadcastd {{.*#+}} ymm1 = [1,1,1,1,1,1,1,1]
	; AVX2-NEXT: vpand %ymm2, %ymm0, %ymm0			; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpand %ymm2, %ymm1, %ymm1			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpcmpeqd %ymm2, %ymm1, %ymm1			; AVX2-NEXT: vpackssdw %ymm0, %ymm0, %ymm0
	; AVX2-NEXT: vpcmpeqd %ymm2, %ymm0, %ymm0			; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]
	; AVX2-NEXT: vpackssdw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: cmpw $-1, %ax			; AVX2-NEXT: cmpw $-1, %ax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; KNL-LABEL: allones_v16i32_and1:			; KNL-LABEL: allones_v16i32_and1:
	; KNL: # %bb.0:			; KNL: # %bb.0:
	; KNL-NEXT: vptestmd {{.*}}(%rip){1to16}, %zmm0, %k0			; KNL-NEXT: vptestmd {{.*}}(%rip){1to16}, %zmm0, %k0
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpmovmskb %xmm0, %eax			; AVX1-NEXT: vpmovmskb %xmm0, %eax
	; AVX1-NEXT: testw %ax, %ax			; AVX1-NEXT: testw %ax, %ax
	; AVX1-NEXT: sete %al			; AVX1-NEXT: sete %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: allzeros_v16i32_and1:			; AVX2-LABEL: allzeros_v16i32_and1:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastd {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1]			; AVX2-NEXT: vpbroadcastd {{.*#+}} ymm1 = [1,1,1,1,1,1,1,1]
	; AVX2-NEXT: vpand %ymm2, %ymm0, %ymm0			; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpand %ymm2, %ymm1, %ymm1			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpcmpeqd %ymm2, %ymm1, %ymm1			; AVX2-NEXT: vpackssdw %ymm0, %ymm0, %ymm0
	; AVX2-NEXT: vpcmpeqd %ymm2, %ymm0, %ymm0			; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]
	; AVX2-NEXT: vpackssdw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: testw %ax, %ax			; AVX2-NEXT: testw %ax, %ax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; KNL-LABEL: allzeros_v16i32_and1:			; KNL-LABEL: allzeros_v16i32_and1:
	; KNL: # %bb.0:			; KNL: # %bb.0:
	; KNL-NEXT: vptestmd {{.*}}(%rip){1to16}, %zmm0, %k0			; KNL-NEXT: vptestmd {{.*}}(%rip){1to16}, %zmm0, %k0
	▲ Show 20 Lines • Show All 933 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: allones_v16i16_and4:			; AVX2-LABEL: allones_v16i16_and4:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} ymm1 = [4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4]			; AVX2-NEXT: vmovdqa {{.*#+}} ymm1 = [4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4]
	; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: cmpw $-1, %ax			; AVX2-NEXT: cmpw $-1, %ax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; KNL-LABEL: allones_v16i16_and4:			; KNL-LABEL: allones_v16i16_and4:
	; KNL: # %bb.0:			; KNL: # %bb.0:
	; KNL-NEXT: vmovdqa {{.*#+}} ymm1 = [4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4]			; KNL-NEXT: vmovdqa {{.*#+}} ymm1 = [4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4]
	▲ Show 20 Lines • Show All 246 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: allzeros_v16i16_and4:			; AVX2-LABEL: allzeros_v16i16_and4:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} ymm1 = [4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4]			; AVX2-NEXT: vmovdqa {{.*#+}} ymm1 = [4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4]
	; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: testw %ax, %ax			; AVX2-NEXT: testw %ax, %ax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; KNL-LABEL: allzeros_v16i16_and4:			; KNL-LABEL: allzeros_v16i16_and4:
	; KNL: # %bb.0:			; KNL: # %bb.0:
	; KNL-NEXT: vmovdqa {{.*#+}} ymm1 = [4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4]			; KNL-NEXT: vmovdqa {{.*#+}} ymm1 = [4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4]
	▲ Show 20 Lines • Show All 271 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpmovmskb %xmm0, %eax			; AVX1-NEXT: vpmovmskb %xmm0, %eax
	; AVX1-NEXT: cmpw $-1, %ax			; AVX1-NEXT: cmpw $-1, %ax
	; AVX1-NEXT: sete %al			; AVX1-NEXT: sete %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: allones_v16i32_and4:			; AVX2-LABEL: allones_v16i32_and4:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastd {{.*#+}} ymm2 = [4,4,4,4,4,4,4,4]			; AVX2-NEXT: vpbroadcastd {{.*#+}} ymm1 = [4,4,4,4,4,4,4,4]
	; AVX2-NEXT: vpand %ymm2, %ymm0, %ymm0			; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpand %ymm2, %ymm1, %ymm1			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpcmpeqd %ymm2, %ymm1, %ymm1			; AVX2-NEXT: vpackssdw %ymm0, %ymm0, %ymm0
	; AVX2-NEXT: vpcmpeqd %ymm2, %ymm0, %ymm0			; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]
	; AVX2-NEXT: vpackssdw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: cmpw $-1, %ax			; AVX2-NEXT: cmpw $-1, %ax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; KNL-LABEL: allones_v16i32_and4:			; KNL-LABEL: allones_v16i32_and4:
	; KNL: # %bb.0:			; KNL: # %bb.0:
	; KNL-NEXT: vptestmd {{.*}}(%rip){1to16}, %zmm0, %k0			; KNL-NEXT: vptestmd {{.*}}(%rip){1to16}, %zmm0, %k0
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpmovmskb %xmm0, %eax			; AVX1-NEXT: vpmovmskb %xmm0, %eax
	; AVX1-NEXT: testw %ax, %ax			; AVX1-NEXT: testw %ax, %ax
	; AVX1-NEXT: sete %al			; AVX1-NEXT: sete %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: allzeros_v16i32_and4:			; AVX2-LABEL: allzeros_v16i32_and4:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastd {{.*#+}} ymm2 = [4,4,4,4,4,4,4,4]			; AVX2-NEXT: vpbroadcastd {{.*#+}} ymm1 = [4,4,4,4,4,4,4,4]
	; AVX2-NEXT: vpand %ymm2, %ymm0, %ymm0			; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpand %ymm2, %ymm1, %ymm1			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpcmpeqd %ymm2, %ymm1, %ymm1			; AVX2-NEXT: vpackssdw %ymm0, %ymm0, %ymm0
	; AVX2-NEXT: vpcmpeqd %ymm2, %ymm0, %ymm0			; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]
	; AVX2-NEXT: vpackssdw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: testw %ax, %ax			; AVX2-NEXT: testw %ax, %ax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; KNL-LABEL: allzeros_v16i32_and4:			; KNL-LABEL: allzeros_v16i32_and4:
	; KNL: # %bb.0:			; KNL: # %bb.0:
	; KNL-NEXT: vptestmd {{.*}}(%rip){1to16}, %zmm0, %k0			; KNL-NEXT: vptestmd {{.*}}(%rip){1to16}, %zmm0, %k0
	▲ Show 20 Lines • Show All 1,078 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-compare-all_of.ll

	Show First 20 Lines • Show All 85 Lines • ▼ Show 20 Lines
	; SSE-NEXT: packssdw %xmm3, %xmm2			; SSE-NEXT: packssdw %xmm3, %xmm2
	; SSE-NEXT: movmskps %xmm2, %eax			; SSE-NEXT: movmskps %xmm2, %eax
	; SSE-NEXT: xorl %ecx, %ecx			; SSE-NEXT: xorl %ecx, %ecx
	; SSE-NEXT: cmpl $15, %eax			; SSE-NEXT: cmpl $15, %eax
	; SSE-NEXT: movq $-1, %rax			; SSE-NEXT: movq $-1, %rax
	; SSE-NEXT: cmovneq %rcx, %rax			; SSE-NEXT: cmovneq %rcx, %rax
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v4f64_legal_sext:			; AVX1-LABEL: test_v4f64_legal_sext:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vcmpltpd %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vcmpltpd %ymm0, %ymm1, %ymm0
	; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX-NEXT: vpackssdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovmskps %xmm0, %eax			; AVX1-NEXT: vmovmskps %xmm0, %eax
	; AVX-NEXT: xorl %ecx, %ecx			; AVX1-NEXT: xorl %ecx, %ecx
	; AVX-NEXT: cmpl $15, %eax			; AVX1-NEXT: cmpl $15, %eax
	; AVX-NEXT: movq $-1, %rax			; AVX1-NEXT: movq $-1, %rax
	; AVX-NEXT: cmovneq %rcx, %rax			; AVX1-NEXT: cmovneq %rcx, %rax
	; AVX-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: test_v4f64_legal_sext:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vcmpltpd %ymm0, %ymm1, %ymm0
				; AVX2-NEXT: vmovmskps %ymm0, %eax
				; AVX2-NEXT: xorl %ecx, %ecx
				; AVX2-NEXT: cmpl $15, %eax
				; AVX2-NEXT: movq $-1, %rax
				; AVX2-NEXT: cmovneq %rcx, %rax
				; AVX2-NEXT: vzeroupper
				; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v4f64_legal_sext:			; AVX512-LABEL: test_v4f64_legal_sext:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vcmpltpd %ymm0, %ymm1, %k1			; AVX512-NEXT: vcmpltpd %ymm0, %ymm1, %k1
	; AVX512-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; AVX512-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0
	; AVX512-NEXT: vmovdqa32 %xmm0, %xmm0 {%k1} {z}			; AVX512-NEXT: vmovdqa32 %xmm0, %xmm0 {%k1} {z}
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX512-NEXT: vpand %xmm1, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 110 Lines • ▼ Show 20 Lines
	; SSE-NEXT: packssdw %xmm3, %xmm2			; SSE-NEXT: packssdw %xmm3, %xmm2
	; SSE-NEXT: pmovmskb %xmm2, %eax			; SSE-NEXT: pmovmskb %xmm2, %eax
	; SSE-NEXT: xorl %ecx, %ecx			; SSE-NEXT: xorl %ecx, %ecx
	; SSE-NEXT: cmpl $65535, %eax # imm = 0xFFFF			; SSE-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movl $-1, %eax			; SSE-NEXT: movl $-1, %eax
	; SSE-NEXT: cmovnel %ecx, %eax			; SSE-NEXT: cmovnel %ecx, %eax
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v8f32_legal_sext:			; AVX1-LABEL: test_v8f32_legal_sext:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vcmpltps %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vcmpltps %ymm0, %ymm1, %ymm0
	; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX-NEXT: vpackssdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpmovmskb %xmm0, %eax			; AVX1-NEXT: vpmovmskb %xmm0, %eax
	; AVX-NEXT: xorl %ecx, %ecx			; AVX1-NEXT: xorl %ecx, %ecx
	; AVX-NEXT: cmpl $65535, %eax # imm = 0xFFFF			; AVX1-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; AVX-NEXT: movl $-1, %eax			; AVX1-NEXT: movl $-1, %eax
	; AVX-NEXT: cmovnel %ecx, %eax			; AVX1-NEXT: cmovnel %ecx, %eax
	; AVX-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: test_v8f32_legal_sext:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vcmpltps %ymm0, %ymm1, %ymm0
				; AVX2-NEXT: vpmovmskb %ymm0, %eax
				; AVX2-NEXT: xorl %ecx, %ecx
				; AVX2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
				; AVX2-NEXT: movl $-1, %eax
				; AVX2-NEXT: cmovnel %ecx, %eax
				; AVX2-NEXT: vzeroupper
				; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v8f32_legal_sext:			; AVX512-LABEL: test_v8f32_legal_sext:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vcmpltps %ymm0, %ymm1, %k0			; AVX512-NEXT: vcmpltps %ymm0, %ymm1, %k0
	; AVX512-NEXT: vpmovm2w %k0, %xmm0			; AVX512-NEXT: vpmovm2w %k0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX512-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	▲ Show 20 Lines • Show All 132 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: movq $-1, %rax			; AVX1-NEXT: movq $-1, %rax
	; AVX1-NEXT: cmovneq %rcx, %rax			; AVX1-NEXT: cmovneq %rcx, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v4i64_legal_sext:			; AVX2-LABEL: test_v4i64_legal_sext:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vmovmskps %ymm0, %eax
	; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovmskps %xmm0, %eax
	; AVX2-NEXT: xorl %ecx, %ecx			; AVX2-NEXT: xorl %ecx, %ecx
	; AVX2-NEXT: cmpl $15, %eax			; AVX2-NEXT: cmpl $15, %eax
	; AVX2-NEXT: movq $-1, %rax			; AVX2-NEXT: movq $-1, %rax
	; AVX2-NEXT: cmovneq %rcx, %rax			; AVX2-NEXT: cmovneq %rcx, %rax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v4i64_legal_sext:			; AVX512-LABEL: test_v4i64_legal_sext:
	▲ Show 20 Lines • Show All 149 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: movl $-1, %eax			; AVX1-NEXT: movl $-1, %eax
	; AVX1-NEXT: cmovnel %ecx, %eax			; AVX1-NEXT: cmovnel %ecx, %eax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v8i32_legal_sext:			; AVX2-LABEL: test_v8i32_legal_sext:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtd %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpgtd %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: xorl %ecx, %ecx			; AVX2-NEXT: xorl %ecx, %ecx
	; AVX2-NEXT: cmpl $65535, %eax # imm = 0xFFFF			; AVX2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; AVX2-NEXT: movl $-1, %eax			; AVX2-NEXT: movl $-1, %eax
	; AVX2-NEXT: cmovnel %ecx, %eax			; AVX2-NEXT: cmovnel %ecx, %eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v8i32_legal_sext:			; AVX512-LABEL: test_v8i32_legal_sext:
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: cmovnel %ecx, %eax			; AVX1-NEXT: cmovnel %ecx, %eax
	; AVX1-NEXT: # kill: def $ax killed $ax killed $eax			; AVX1-NEXT: # kill: def $ax killed $ax killed $eax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v16i16_legal_sext:			; AVX2-LABEL: test_v16i16_legal_sext:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: xorl %ecx, %ecx			; AVX2-NEXT: xorl %ecx, %ecx
	; AVX2-NEXT: cmpl $65535, %eax # imm = 0xFFFF			; AVX2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; AVX2-NEXT: movl $-1, %eax			; AVX2-NEXT: movl $-1, %eax
	; AVX2-NEXT: cmovnel %ecx, %eax			; AVX2-NEXT: cmovnel %ecx, %eax
	; AVX2-NEXT: # kill: def $ax killed $ax killed $eax			; AVX2-NEXT: # kill: def $ax killed $ax killed $eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 741 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: cmovnel %ecx, %eax			; AVX1-NEXT: cmovnel %ecx, %eax
	; AVX1-NEXT: # kill: def $al killed $al killed $eax			; AVX1-NEXT: # kill: def $al killed $al killed $eax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: bool_reduction_v16i16:			; AVX2-LABEL: bool_reduction_v16i16:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: xorl %ecx, %ecx			; AVX2-NEXT: xorl %ecx, %ecx
	; AVX2-NEXT: cmpl $65535, %eax # imm = 0xFFFF			; AVX2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; AVX2-NEXT: movl $-1, %eax			; AVX2-NEXT: movl $-1, %eax
	; AVX2-NEXT: cmovnel %ecx, %eax			; AVX2-NEXT: cmovnel %ecx, %eax
	; AVX2-NEXT: # kill: def $al killed $al killed $eax			; AVX2-NEXT: # kill: def $al killed $al killed $eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 104 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-compare-any_of.ll

	Show First 20 Lines • Show All 84 Lines • ▼ Show 20 Lines
	; SSE-NEXT: packssdw %xmm3, %xmm2			; SSE-NEXT: packssdw %xmm3, %xmm2
	; SSE-NEXT: movmskps %xmm2, %eax			; SSE-NEXT: movmskps %xmm2, %eax
	; SSE-NEXT: xorl %ecx, %ecx			; SSE-NEXT: xorl %ecx, %ecx
	; SSE-NEXT: cmpl %eax, %ecx			; SSE-NEXT: cmpl %eax, %ecx
	; SSE-NEXT: sbbl %ecx, %ecx			; SSE-NEXT: sbbl %ecx, %ecx
	; SSE-NEXT: movslq %ecx, %rax			; SSE-NEXT: movslq %ecx, %rax
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v4f64_legal_sext:			; AVX1-LABEL: test_v4f64_legal_sext:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vcmpltpd %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vcmpltpd %ymm0, %ymm1, %ymm0
	; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX-NEXT: vpackssdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovmskps %xmm0, %eax			; AVX1-NEXT: vmovmskps %xmm0, %eax
	; AVX-NEXT: xorl %ecx, %ecx			; AVX1-NEXT: xorl %ecx, %ecx
	; AVX-NEXT: cmpl %eax, %ecx			; AVX1-NEXT: cmpl %eax, %ecx
	; AVX-NEXT: sbbl %ecx, %ecx			; AVX1-NEXT: sbbl %ecx, %ecx
	; AVX-NEXT: movslq %ecx, %rax			; AVX1-NEXT: movslq %ecx, %rax
	; AVX-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: test_v4f64_legal_sext:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vcmpltpd %ymm0, %ymm1, %ymm0
				; AVX2-NEXT: vmovmskps %ymm0, %eax
				; AVX2-NEXT: xorl %ecx, %ecx
				; AVX2-NEXT: cmpl %eax, %ecx
				; AVX2-NEXT: sbbl %ecx, %ecx
				; AVX2-NEXT: movslq %ecx, %rax
				; AVX2-NEXT: vzeroupper
				; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v4f64_legal_sext:			; AVX512-LABEL: test_v4f64_legal_sext:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vcmpltpd %ymm0, %ymm1, %k1			; AVX512-NEXT: vcmpltpd %ymm0, %ymm1, %k1
	; AVX512-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; AVX512-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0
	; AVX512-NEXT: vmovdqa32 %xmm0, %xmm0 {%k1} {z}			; AVX512-NEXT: vmovdqa32 %xmm0, %xmm0 {%k1} {z}
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 105 Lines • ▼ Show 20 Lines
	; SSE-NEXT: cmpltps %xmm0, %xmm2			; SSE-NEXT: cmpltps %xmm0, %xmm2
	; SSE-NEXT: packssdw %xmm3, %xmm2			; SSE-NEXT: packssdw %xmm3, %xmm2
	; SSE-NEXT: pmovmskb %xmm2, %ecx			; SSE-NEXT: pmovmskb %xmm2, %ecx
	; SSE-NEXT: xorl %eax, %eax			; SSE-NEXT: xorl %eax, %eax
	; SSE-NEXT: cmpl %ecx, %eax			; SSE-NEXT: cmpl %ecx, %eax
	; SSE-NEXT: sbbl %eax, %eax			; SSE-NEXT: sbbl %eax, %eax
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v8f32_legal_sext:			; AVX1-LABEL: test_v8f32_legal_sext:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vcmpltps %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vcmpltps %ymm0, %ymm1, %ymm0
	; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX-NEXT: vpackssdw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpmovmskb %xmm0, %ecx			; AVX1-NEXT: vpmovmskb %xmm0, %ecx
	; AVX-NEXT: xorl %eax, %eax			; AVX1-NEXT: xorl %eax, %eax
	; AVX-NEXT: cmpl %ecx, %eax			; AVX1-NEXT: cmpl %ecx, %eax
	; AVX-NEXT: sbbl %eax, %eax			; AVX1-NEXT: sbbl %eax, %eax
	; AVX-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: test_v8f32_legal_sext:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vcmpltps %ymm0, %ymm1, %ymm0
				; AVX2-NEXT: vpmovmskb %ymm0, %ecx
				; AVX2-NEXT: xorl %eax, %eax
				; AVX2-NEXT: cmpl %ecx, %eax
				; AVX2-NEXT: sbbl %eax, %eax
				; AVX2-NEXT: vzeroupper
				; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v8f32_legal_sext:			; AVX512-LABEL: test_v8f32_legal_sext:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vcmpltps %ymm0, %ymm1, %k0			; AVX512-NEXT: vcmpltps %ymm0, %ymm1, %k0
	; AVX512-NEXT: vpmovm2w %k0, %xmm0			; AVX512-NEXT: vpmovm2w %k0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	▲ Show 20 Lines • Show All 130 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: sbbl %ecx, %ecx			; AVX1-NEXT: sbbl %ecx, %ecx
	; AVX1-NEXT: movslq %ecx, %rax			; AVX1-NEXT: movslq %ecx, %rax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v4i64_legal_sext:			; AVX2-LABEL: test_v4i64_legal_sext:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vmovmskps %ymm0, %eax
	; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovmskps %xmm0, %eax
	; AVX2-NEXT: xorl %ecx, %ecx			; AVX2-NEXT: xorl %ecx, %ecx
	; AVX2-NEXT: cmpl %eax, %ecx			; AVX2-NEXT: cmpl %eax, %ecx
	; AVX2-NEXT: sbbl %ecx, %ecx			; AVX2-NEXT: sbbl %ecx, %ecx
	; AVX2-NEXT: movslq %ecx, %rax			; AVX2-NEXT: movslq %ecx, %rax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v4i64_legal_sext:			; AVX512-LABEL: test_v4i64_legal_sext:
	▲ Show 20 Lines • Show All 142 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: cmpl %ecx, %eax			; AVX1-NEXT: cmpl %ecx, %eax
	; AVX1-NEXT: sbbl %eax, %eax			; AVX1-NEXT: sbbl %eax, %eax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v8i32_legal_sext:			; AVX2-LABEL: test_v8i32_legal_sext:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtd %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpgtd %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpmovmskb %ymm0, %ecx
	; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %ecx
	; AVX2-NEXT: xorl %eax, %eax			; AVX2-NEXT: xorl %eax, %eax
	; AVX2-NEXT: cmpl %ecx, %eax			; AVX2-NEXT: cmpl %ecx, %eax
	; AVX2-NEXT: sbbl %eax, %eax			; AVX2-NEXT: sbbl %eax, %eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v8i32_legal_sext:			; AVX512-LABEL: test_v8i32_legal_sext:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	▲ Show 20 Lines • Show All 164 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: sbbl %eax, %eax			; AVX1-NEXT: sbbl %eax, %eax
	; AVX1-NEXT: # kill: def $ax killed $ax killed $eax			; AVX1-NEXT: # kill: def $ax killed $ax killed $eax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v16i16_legal_sext:			; AVX2-LABEL: test_v16i16_legal_sext:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpmovmskb %ymm0, %ecx
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %ecx
	; AVX2-NEXT: xorl %eax, %eax			; AVX2-NEXT: xorl %eax, %eax
	; AVX2-NEXT: cmpl %ecx, %eax			; AVX2-NEXT: cmpl %ecx, %eax
	; AVX2-NEXT: sbbl %eax, %eax			; AVX2-NEXT: sbbl %eax, %eax
	; AVX2-NEXT: # kill: def $ax killed $ax killed $eax			; AVX2-NEXT: # kill: def $ax killed $ax killed $eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v16i16_legal_sext:			; AVX512-LABEL: test_v16i16_legal_sext:
	▲ Show 20 Lines • Show All 751 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: sbbl %eax, %eax			; AVX1-NEXT: sbbl %eax, %eax
	; AVX1-NEXT: # kill: def $al killed $al killed $eax			; AVX1-NEXT: # kill: def $al killed $al killed $eax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: bool_reduction_v16i16:			; AVX2-LABEL: bool_reduction_v16i16:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpmovmskb %ymm0, %ecx
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %ecx
	; AVX2-NEXT: xorl %eax, %eax			; AVX2-NEXT: xorl %eax, %eax
	; AVX2-NEXT: cmpl %ecx, %eax			; AVX2-NEXT: cmpl %ecx, %eax
	; AVX2-NEXT: sbbl %eax, %eax			; AVX2-NEXT: sbbl %eax, %eax
	; AVX2-NEXT: # kill: def $al killed $al killed $eax			; AVX2-NEXT: # kill: def $al killed $al killed $eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: bool_reduction_v16i16:			; AVX512-LABEL: bool_reduction_v16i16:
	▲ Show 20 Lines • Show All 102 Lines • Show Last 20 Lines