Diff 165644

llvm/trunk/lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 38,806 Lines • ▼ Show 20 Lines	static SDValue combineMOVMSK(SDNode *N, SelectionDAG &DAG,
// MOVMSK only uses the MSB from each vector element.		// MOVMSK only uses the MSB from each vector element.
KnownBits Known;		KnownBits Known;
APInt DemandedMask(APInt::getSignMask(SrcVT.getScalarSizeInBits()));		APInt DemandedMask(APInt::getSignMask(SrcVT.getScalarSizeInBits()));
if (TLI.SimplifyDemandedBits(Src, DemandedMask, Known, TLO)) {		if (TLI.SimplifyDemandedBits(Src, DemandedMask, Known, TLO)) {
DCI.CommitTargetLoweringOpt(TLO);		DCI.CommitTargetLoweringOpt(TLO);
return SDValue(N, 0);		return SDValue(N, 0);
}		}

		// Combine (movmsk (setne (and X, (1 << C)), 0)) -> (movmsk (X << C)).
		// Only do this when the setcc input and output types are the same and the
		// setcc and the 'and' node have a single use.
		// FIXME: Support i8 shifts. The lowering produces an extra and.
		// FIXME: Support 256-bits with AVX1. The movmsk is split, but the and isn't.
		APInt SplatVal;
		if (Src.getOpcode() == ISD::SETCC && Src.hasOneUse() &&
		Src.getOperand(0).getValueType() == Src.getValueType() &&
		Src.getValueType().getScalarSizeInBits() >= 32 &&
		cast<CondCodeSDNode>(Src.getOperand(2))->get() == ISD::SETNE &&
		ISD::isBuildVectorAllZeros(Src.getOperand(1).getNode())) {
		SDValue In = Src.getOperand(0);
		if (In.getOpcode() == ISD::AND && In.hasOneUse() &&
		ISD::isConstantSplatVector(In.getOperand(1).getNode(), SplatVal) &&
		SplatVal.isPowerOf2()) {
		MVT VT = Src.getSimpleValueType();
		unsigned BitWidth = VT.getScalarSizeInBits();
		unsigned ShAmt = BitWidth - SplatVal.logBase2() - 1;
		SDLoc DL(Src.getOperand(0));
		SDValue Shl = DAG.getNode(ISD::SHL, DL, VT, In.getOperand(0),
		DAG.getConstant(ShAmt, DL, VT));
		SDValue Cast = DAG.getBitcast(SrcVT, Shl);
		return DAG.getNode(X86ISD::MOVMSK, SDLoc(N), N->getValueType(0), Cast);
		}
		}

return SDValue();		return SDValue();
}		}

static SDValue combineGatherScatter(SDNode *N, SelectionDAG &DAG,		static SDValue combineGatherScatter(SDNode *N, SelectionDAG &DAG,
TargetLowering::DAGCombinerInfo &DCI,		TargetLowering::DAGCombinerInfo &DCI,
const X86Subtarget &Subtarget) {		const X86Subtarget &Subtarget) {
SDLoc DL(N);		SDLoc DL(N);

▲ Show 20 Lines • Show All 2,639 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/movmsk-cmp.ll

Show First 20 Lines • Show All 1,821 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq
%tmp2 = bitcast <16 x i1> %tmp1 to i16		%tmp2 = bitcast <16 x i1> %tmp1 to i16
%tmp3 = icmp eq i16 %tmp2, 0		%tmp3 = icmp eq i16 %tmp2, 0
ret i1 %tmp3		ret i1 %tmp3
}		}

define i1 @allones_v4i32_and1(<4 x i32> %arg) {		define i1 @allones_v4i32_and1(<4 x i32> %arg) {
; SSE2-LABEL: allones_v4i32_and1:		; SSE2-LABEL: allones_v4i32_and1:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [1,1,1,1]		; SSE2-NEXT: pslld $31, %xmm0
; SSE2-NEXT: pand %xmm1, %xmm0
; SSE2-NEXT: pcmpeqd %xmm1, %xmm0
; SSE2-NEXT: movmskps %xmm0, %eax		; SSE2-NEXT: movmskps %xmm0, %eax
; SSE2-NEXT: cmpb $15, %al		; SSE2-NEXT: cmpb $15, %al
; SSE2-NEXT: sete %al		; SSE2-NEXT: sete %al
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX1-LABEL: allones_v4i32_and1:		; AVX-LABEL: allones_v4i32_and1:
; AVX1: # %bb.0:		; AVX: # %bb.0:
; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [1,1,1,1]		; AVX-NEXT: vpslld $31, %xmm0, %xmm0
; AVX1-NEXT: vpand %xmm1, %xmm0, %xmm0		; AVX-NEXT: vmovmskps %xmm0, %eax
; AVX1-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0		; AVX-NEXT: cmpb $15, %al
; AVX1-NEXT: vmovmskps %xmm0, %eax		; AVX-NEXT: sete %al
; AVX1-NEXT: cmpb $15, %al		; AVX-NEXT: retq
; AVX1-NEXT: sete %al
; AVX1-NEXT: retq
;
; AVX2-LABEL: allones_v4i32_and1:
; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastd {{.*#+}} xmm1 = [1,1,1,1]
; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
; AVX2-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
; AVX2-NEXT: vmovmskps %xmm0, %eax
; AVX2-NEXT: cmpb $15, %al
; AVX2-NEXT: sete %al
; AVX2-NEXT: retq
;		;
; SKX-LABEL: allones_v4i32_and1:		; SKX-LABEL: allones_v4i32_and1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [1,1,1,1]		; SKX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [1,1,1,1]
; SKX-NEXT: vptestmd %xmm1, %xmm0, %k0		; SKX-NEXT: vptestmd %xmm1, %xmm0, %k0
; SKX-NEXT: kmovd %k0, %eax		; SKX-NEXT: kmovd %k0, %eax
; SKX-NEXT: andb $15, %al		; SKX-NEXT: andb $15, %al
; SKX-NEXT: cmpb $15, %al		; SKX-NEXT: cmpb $15, %al
; SKX-NEXT: sete %al		; SKX-NEXT: sete %al
; SKX-NEXT: retq		; SKX-NEXT: retq
%tmp = and <4 x i32> %arg, <i32 1, i32 1, i32 1, i32 1>		%tmp = and <4 x i32> %arg, <i32 1, i32 1, i32 1, i32 1>
%tmp1 = icmp ne <4 x i32> %tmp, zeroinitializer		%tmp1 = icmp ne <4 x i32> %tmp, zeroinitializer
%tmp2 = bitcast <4 x i1> %tmp1 to i4		%tmp2 = bitcast <4 x i1> %tmp1 to i4
%tmp3 = icmp eq i4 %tmp2, -1		%tmp3 = icmp eq i4 %tmp2, -1
ret i1 %tmp3		ret i1 %tmp3
}		}

define i1 @allzeros_v4i32_and1(<4 x i32> %arg) {		define i1 @allzeros_v4i32_and1(<4 x i32> %arg) {
; SSE2-LABEL: allzeros_v4i32_and1:		; SSE2-LABEL: allzeros_v4i32_and1:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [1,1,1,1]		; SSE2-NEXT: pslld $31, %xmm0
; SSE2-NEXT: pand %xmm1, %xmm0
; SSE2-NEXT: pcmpeqd %xmm1, %xmm0
; SSE2-NEXT: movmskps %xmm0, %eax		; SSE2-NEXT: movmskps %xmm0, %eax
; SSE2-NEXT: testb %al, %al		; SSE2-NEXT: testb %al, %al
; SSE2-NEXT: sete %al		; SSE2-NEXT: sete %al
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX1-LABEL: allzeros_v4i32_and1:		; AVX-LABEL: allzeros_v4i32_and1:
; AVX1: # %bb.0:		; AVX: # %bb.0:
; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [1,1,1,1]		; AVX-NEXT: vpslld $31, %xmm0, %xmm0
; AVX1-NEXT: vpand %xmm1, %xmm0, %xmm0		; AVX-NEXT: vmovmskps %xmm0, %eax
; AVX1-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0		; AVX-NEXT: testb %al, %al
; AVX1-NEXT: vmovmskps %xmm0, %eax		; AVX-NEXT: sete %al
; AVX1-NEXT: testb %al, %al		; AVX-NEXT: retq
; AVX1-NEXT: sete %al
; AVX1-NEXT: retq
;
; AVX2-LABEL: allzeros_v4i32_and1:
; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastd {{.*#+}} xmm1 = [1,1,1,1]
; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
; AVX2-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
; AVX2-NEXT: vmovmskps %xmm0, %eax
; AVX2-NEXT: testb %al, %al
; AVX2-NEXT: sete %al
; AVX2-NEXT: retq
;		;
; SKX-LABEL: allzeros_v4i32_and1:		; SKX-LABEL: allzeros_v4i32_and1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [1,1,1,1]		; SKX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [1,1,1,1]
; SKX-NEXT: vptestmd %xmm1, %xmm0, %k0		; SKX-NEXT: vptestmd %xmm1, %xmm0, %k0
; SKX-NEXT: kmovd %k0, %eax		; SKX-NEXT: kmovd %k0, %eax
; SKX-NEXT: testb $15, %al		; SKX-NEXT: testb $15, %al
; SKX-NEXT: sete %al		; SKX-NEXT: sete %al
Show All 17 Lines
; SSE2-NEXT: packsswb %xmm0, %xmm0		; SSE2-NEXT: packsswb %xmm0, %xmm0
; SSE2-NEXT: pmovmskb %xmm0, %eax		; SSE2-NEXT: pmovmskb %xmm0, %eax
; SSE2-NEXT: cmpb $-1, %al		; SSE2-NEXT: cmpb $-1, %al
; SSE2-NEXT: sete %al		; SSE2-NEXT: sete %al
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX1-LABEL: allones_v8i32_and1:		; AVX1-LABEL: allones_v8i32_and1:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vandps {{.*}}(%rip), %ymm0, %ymm0		; AVX1-NEXT: vpslld $31, %xmm0, %xmm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpslld $31, %xmm0, %xmm0
; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm1		; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqd %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm0
; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
; AVX1-NEXT: vmovmskps %ymm0, %eax		; AVX1-NEXT: vmovmskps %ymm0, %eax
; AVX1-NEXT: cmpb $-1, %al		; AVX1-NEXT: cmpb $-1, %al
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allones_v8i32_and1:		; AVX2-LABEL: allones_v8i32_and1:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastd {{.*#+}} ymm1 = [1,1,1,1,1,1,1,1]		; AVX2-NEXT: vpslld $31, %ymm0, %ymm0
; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vpcmpeqd %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vmovmskps %ymm0, %eax		; AVX2-NEXT: vmovmskps %ymm0, %eax
; AVX2-NEXT: cmpb $-1, %al		; AVX2-NEXT: cmpb $-1, %al
; AVX2-NEXT: sete %al		; AVX2-NEXT: sete %al
; AVX2-NEXT: vzeroupper		; AVX2-NEXT: vzeroupper
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; SKX-LABEL: allones_v8i32_and1:		; SKX-LABEL: allones_v8i32_and1:
; SKX: # %bb.0:		; SKX: # %bb.0:
Show All 22 Lines
; SSE2-NEXT: packsswb %xmm0, %xmm0		; SSE2-NEXT: packsswb %xmm0, %xmm0
; SSE2-NEXT: pmovmskb %xmm0, %eax		; SSE2-NEXT: pmovmskb %xmm0, %eax
; SSE2-NEXT: testb %al, %al		; SSE2-NEXT: testb %al, %al
; SSE2-NEXT: sete %al		; SSE2-NEXT: sete %al
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX1-LABEL: allzeros_v8i32_and1:		; AVX1-LABEL: allzeros_v8i32_and1:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vandps {{.*}}(%rip), %ymm0, %ymm0		; AVX1-NEXT: vpslld $31, %xmm0, %xmm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpslld $31, %xmm0, %xmm0
; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm1		; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqd %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm0
; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
; AVX1-NEXT: vmovmskps %ymm0, %eax		; AVX1-NEXT: vmovmskps %ymm0, %eax
; AVX1-NEXT: testb %al, %al		; AVX1-NEXT: testb %al, %al
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allzeros_v8i32_and1:		; AVX2-LABEL: allzeros_v8i32_and1:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastd {{.*#+}} ymm1 = [1,1,1,1,1,1,1,1]		; AVX2-NEXT: vpslld $31, %ymm0, %ymm0
; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vpcmpeqd %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vmovmskps %ymm0, %eax		; AVX2-NEXT: vmovmskps %ymm0, %eax
; AVX2-NEXT: testb %al, %al		; AVX2-NEXT: testb %al, %al
; AVX2-NEXT: sete %al		; AVX2-NEXT: sete %al
; AVX2-NEXT: vzeroupper		; AVX2-NEXT: vzeroupper
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; SKX-LABEL: allzeros_v8i32_and1:		; SKX-LABEL: allzeros_v8i32_and1:
; SKX: # %bb.0:		; SKX: # %bb.0:
▲ Show 20 Lines • Show All 164 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq
%tmp2 = bitcast <16 x i1> %tmp1 to i16		%tmp2 = bitcast <16 x i1> %tmp1 to i16
%tmp3 = icmp eq i16 %tmp2, 0		%tmp3 = icmp eq i16 %tmp2, 0
ret i1 %tmp3		ret i1 %tmp3
}		}

define i1 @allones_v2i64_and1(<2 x i64> %arg) {		define i1 @allones_v2i64_and1(<2 x i64> %arg) {
; SSE2-LABEL: allones_v2i64_and1:		; SSE2-LABEL: allones_v2i64_and1:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [1,1]		; SSE2-NEXT: psllq $63, %xmm0
; SSE2-NEXT: pand %xmm1, %xmm0		; SSE2-NEXT: movmskpd %xmm0, %eax
; SSE2-NEXT: pcmpeqd %xmm1, %xmm0
; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,0,3,2]
; SSE2-NEXT: pand %xmm0, %xmm1
; SSE2-NEXT: movmskpd %xmm1, %eax
; SSE2-NEXT: cmpb $3, %al		; SSE2-NEXT: cmpb $3, %al
; SSE2-NEXT: sete %al		; SSE2-NEXT: sete %al
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX-LABEL: allones_v2i64_and1:		; AVX-LABEL: allones_v2i64_and1:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [1,1]		; AVX-NEXT: vpsllq $63, %xmm0, %xmm0
; AVX-NEXT: vpand %xmm1, %xmm0, %xmm0
; AVX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
; AVX-NEXT: vmovmskpd %xmm0, %eax		; AVX-NEXT: vmovmskpd %xmm0, %eax
; AVX-NEXT: cmpb $3, %al		; AVX-NEXT: cmpb $3, %al
; AVX-NEXT: sete %al		; AVX-NEXT: sete %al
; AVX-NEXT: retq		; AVX-NEXT: retq
;		;
; SKX-LABEL: allones_v2i64_and1:		; SKX-LABEL: allones_v2i64_and1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmq {{.*}}(%rip), %xmm0, %k0		; SKX-NEXT: vptestmq {{.*}}(%rip), %xmm0, %k0
; SKX-NEXT: kmovd %k0, %eax		; SKX-NEXT: kmovd %k0, %eax
; SKX-NEXT: andb $3, %al		; SKX-NEXT: andb $3, %al
; SKX-NEXT: cmpb $3, %al		; SKX-NEXT: cmpb $3, %al
; SKX-NEXT: sete %al		; SKX-NEXT: sete %al
; SKX-NEXT: retq		; SKX-NEXT: retq
%tmp = and <2 x i64> %arg, <i64 1, i64 1>		%tmp = and <2 x i64> %arg, <i64 1, i64 1>
%tmp1 = icmp ne <2 x i64> %tmp, zeroinitializer		%tmp1 = icmp ne <2 x i64> %tmp, zeroinitializer
%tmp2 = bitcast <2 x i1> %tmp1 to i2		%tmp2 = bitcast <2 x i1> %tmp1 to i2
%tmp3 = icmp eq i2 %tmp2, -1		%tmp3 = icmp eq i2 %tmp2, -1
ret i1 %tmp3		ret i1 %tmp3
}		}

define i1 @allzeros_v2i64_and1(<2 x i64> %arg) {		define i1 @allzeros_v2i64_and1(<2 x i64> %arg) {
; SSE2-LABEL: allzeros_v2i64_and1:		; SSE2-LABEL: allzeros_v2i64_and1:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [1,1]		; SSE2-NEXT: psllq $63, %xmm0
; SSE2-NEXT: pand %xmm1, %xmm0		; SSE2-NEXT: movmskpd %xmm0, %eax
; SSE2-NEXT: pcmpeqd %xmm1, %xmm0
; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,0,3,2]
; SSE2-NEXT: pand %xmm0, %xmm1
; SSE2-NEXT: movmskpd %xmm1, %eax
; SSE2-NEXT: testb %al, %al		; SSE2-NEXT: testb %al, %al
; SSE2-NEXT: sete %al		; SSE2-NEXT: sete %al
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX-LABEL: allzeros_v2i64_and1:		; AVX-LABEL: allzeros_v2i64_and1:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [1,1]		; AVX-NEXT: vpsllq $63, %xmm0, %xmm0
; AVX-NEXT: vpand %xmm1, %xmm0, %xmm0
; AVX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
; AVX-NEXT: vmovmskpd %xmm0, %eax		; AVX-NEXT: vmovmskpd %xmm0, %eax
; AVX-NEXT: testb %al, %al		; AVX-NEXT: testb %al, %al
; AVX-NEXT: sete %al		; AVX-NEXT: sete %al
; AVX-NEXT: retq		; AVX-NEXT: retq
;		;
; SKX-LABEL: allzeros_v2i64_and1:		; SKX-LABEL: allzeros_v2i64_and1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmq {{.*}}(%rip), %xmm0, %k0		; SKX-NEXT: vptestmq {{.*}}(%rip), %xmm0, %k0
Show All 23 Lines
; SSE2-NEXT: packssdw %xmm3, %xmm1		; SSE2-NEXT: packssdw %xmm3, %xmm1
; SSE2-NEXT: movmskps %xmm1, %eax		; SSE2-NEXT: movmskps %xmm1, %eax
; SSE2-NEXT: cmpb $15, %al		; SSE2-NEXT: cmpb $15, %al
; SSE2-NEXT: sete %al		; SSE2-NEXT: sete %al
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX1-LABEL: allones_v4i64_and1:		; AVX1-LABEL: allones_v4i64_and1:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vandps {{.*}}(%rip), %ymm0, %ymm0		; AVX1-NEXT: vpsllq $63, %xmm0, %xmm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpsllq $63, %xmm0, %xmm0
; AVX1-NEXT: vpcmpeqq %xmm2, %xmm1, %xmm1		; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqq %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm0
; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
; AVX1-NEXT: vmovmskpd %ymm0, %eax		; AVX1-NEXT: vmovmskpd %ymm0, %eax
; AVX1-NEXT: cmpb $15, %al		; AVX1-NEXT: cmpb $15, %al
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allones_v4i64_and1:		; AVX2-LABEL: allones_v4i64_and1:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm1 = [1,1,1,1]		; AVX2-NEXT: vpsllq $63, %ymm0, %ymm0
; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vmovmskpd %ymm0, %eax		; AVX2-NEXT: vmovmskpd %ymm0, %eax
; AVX2-NEXT: cmpb $15, %al		; AVX2-NEXT: cmpb $15, %al
; AVX2-NEXT: sete %al		; AVX2-NEXT: sete %al
; AVX2-NEXT: vzeroupper		; AVX2-NEXT: vzeroupper
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; SKX-LABEL: allones_v4i64_and1:		; SKX-LABEL: allones_v4i64_and1:
; SKX: # %bb.0:		; SKX: # %bb.0:
Show All 26 Lines
; SSE2-NEXT: packssdw %xmm3, %xmm1		; SSE2-NEXT: packssdw %xmm3, %xmm1
; SSE2-NEXT: movmskps %xmm1, %eax		; SSE2-NEXT: movmskps %xmm1, %eax
; SSE2-NEXT: testb %al, %al		; SSE2-NEXT: testb %al, %al
; SSE2-NEXT: sete %al		; SSE2-NEXT: sete %al
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX1-LABEL: allzeros_v4i64_and1:		; AVX1-LABEL: allzeros_v4i64_and1:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vandps {{.*}}(%rip), %ymm0, %ymm0		; AVX1-NEXT: vpsllq $63, %xmm0, %xmm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpsllq $63, %xmm0, %xmm0
; AVX1-NEXT: vpcmpeqq %xmm2, %xmm1, %xmm1		; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqq %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm0
; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
; AVX1-NEXT: vmovmskpd %ymm0, %eax		; AVX1-NEXT: vmovmskpd %ymm0, %eax
; AVX1-NEXT: testb %al, %al		; AVX1-NEXT: testb %al, %al
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allzeros_v4i64_and1:		; AVX2-LABEL: allzeros_v4i64_and1:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm1 = [1,1,1,1]		; AVX2-NEXT: vpsllq $63, %ymm0, %ymm0
; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vmovmskpd %ymm0, %eax		; AVX2-NEXT: vmovmskpd %ymm0, %eax
; AVX2-NEXT: testb %al, %al		; AVX2-NEXT: testb %al, %al
; AVX2-NEXT: sete %al		; AVX2-NEXT: sete %al
; AVX2-NEXT: vzeroupper		; AVX2-NEXT: vzeroupper
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; SKX-LABEL: allzeros_v4i64_and1:		; SKX-LABEL: allzeros_v4i64_and1:
; SKX: # %bb.0:		; SKX: # %bb.0:
▲ Show 20 Lines • Show All 879 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq
%tmp2 = bitcast <16 x i1> %tmp1 to i16		%tmp2 = bitcast <16 x i1> %tmp1 to i16
%tmp3 = icmp eq i16 %tmp2, 0		%tmp3 = icmp eq i16 %tmp2, 0
ret i1 %tmp3		ret i1 %tmp3
}		}

define i1 @allones_v4i32_and4(<4 x i32> %arg) {		define i1 @allones_v4i32_and4(<4 x i32> %arg) {
; SSE2-LABEL: allones_v4i32_and4:		; SSE2-LABEL: allones_v4i32_and4:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [4,4,4,4]		; SSE2-NEXT: pslld $29, %xmm0
; SSE2-NEXT: pand %xmm1, %xmm0
; SSE2-NEXT: pcmpeqd %xmm1, %xmm0
; SSE2-NEXT: movmskps %xmm0, %eax		; SSE2-NEXT: movmskps %xmm0, %eax
; SSE2-NEXT: cmpb $15, %al		; SSE2-NEXT: cmpb $15, %al
; SSE2-NEXT: sete %al		; SSE2-NEXT: sete %al
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX1-LABEL: allones_v4i32_and4:		; AVX-LABEL: allones_v4i32_and4:
; AVX1: # %bb.0:		; AVX: # %bb.0:
; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [4,4,4,4]		; AVX-NEXT: vpslld $29, %xmm0, %xmm0
; AVX1-NEXT: vpand %xmm1, %xmm0, %xmm0		; AVX-NEXT: vmovmskps %xmm0, %eax
; AVX1-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0		; AVX-NEXT: cmpb $15, %al
; AVX1-NEXT: vmovmskps %xmm0, %eax		; AVX-NEXT: sete %al
; AVX1-NEXT: cmpb $15, %al		; AVX-NEXT: retq
; AVX1-NEXT: sete %al
; AVX1-NEXT: retq
;
; AVX2-LABEL: allones_v4i32_and4:
; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastd {{.*#+}} xmm1 = [4,4,4,4]
; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
; AVX2-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
; AVX2-NEXT: vmovmskps %xmm0, %eax
; AVX2-NEXT: cmpb $15, %al
; AVX2-NEXT: sete %al
; AVX2-NEXT: retq
;		;
; SKX-LABEL: allones_v4i32_and4:		; SKX-LABEL: allones_v4i32_and4:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [4,4,4,4]		; SKX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [4,4,4,4]
; SKX-NEXT: vptestmd %xmm1, %xmm0, %k0		; SKX-NEXT: vptestmd %xmm1, %xmm0, %k0
; SKX-NEXT: kmovd %k0, %eax		; SKX-NEXT: kmovd %k0, %eax
; SKX-NEXT: andb $15, %al		; SKX-NEXT: andb $15, %al
; SKX-NEXT: cmpb $15, %al		; SKX-NEXT: cmpb $15, %al
; SKX-NEXT: sete %al		; SKX-NEXT: sete %al
; SKX-NEXT: retq		; SKX-NEXT: retq
%tmp = and <4 x i32> %arg, <i32 4, i32 4, i32 4, i32 4>		%tmp = and <4 x i32> %arg, <i32 4, i32 4, i32 4, i32 4>
%tmp1 = icmp ne <4 x i32> %tmp, zeroinitializer		%tmp1 = icmp ne <4 x i32> %tmp, zeroinitializer
%tmp2 = bitcast <4 x i1> %tmp1 to i4		%tmp2 = bitcast <4 x i1> %tmp1 to i4
%tmp3 = icmp eq i4 %tmp2, -1		%tmp3 = icmp eq i4 %tmp2, -1
ret i1 %tmp3		ret i1 %tmp3
}		}

define i1 @allzeros_v4i32_and4(<4 x i32> %arg) {		define i1 @allzeros_v4i32_and4(<4 x i32> %arg) {
; SSE2-LABEL: allzeros_v4i32_and4:		; SSE2-LABEL: allzeros_v4i32_and4:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [4,4,4,4]		; SSE2-NEXT: pslld $29, %xmm0
; SSE2-NEXT: pand %xmm1, %xmm0
; SSE2-NEXT: pcmpeqd %xmm1, %xmm0
; SSE2-NEXT: movmskps %xmm0, %eax		; SSE2-NEXT: movmskps %xmm0, %eax
; SSE2-NEXT: testb %al, %al		; SSE2-NEXT: testb %al, %al
; SSE2-NEXT: sete %al		; SSE2-NEXT: sete %al
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX1-LABEL: allzeros_v4i32_and4:		; AVX-LABEL: allzeros_v4i32_and4:
; AVX1: # %bb.0:		; AVX: # %bb.0:
; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [4,4,4,4]		; AVX-NEXT: vpslld $29, %xmm0, %xmm0
; AVX1-NEXT: vpand %xmm1, %xmm0, %xmm0		; AVX-NEXT: vmovmskps %xmm0, %eax
; AVX1-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0		; AVX-NEXT: testb %al, %al
; AVX1-NEXT: vmovmskps %xmm0, %eax		; AVX-NEXT: sete %al
; AVX1-NEXT: testb %al, %al		; AVX-NEXT: retq
; AVX1-NEXT: sete %al
; AVX1-NEXT: retq
;
; AVX2-LABEL: allzeros_v4i32_and4:
; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastd {{.*#+}} xmm1 = [4,4,4,4]
; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
; AVX2-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
; AVX2-NEXT: vmovmskps %xmm0, %eax
; AVX2-NEXT: testb %al, %al
; AVX2-NEXT: sete %al
; AVX2-NEXT: retq
;		;
; SKX-LABEL: allzeros_v4i32_and4:		; SKX-LABEL: allzeros_v4i32_and4:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [4,4,4,4]		; SKX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [4,4,4,4]
; SKX-NEXT: vptestmd %xmm1, %xmm0, %k0		; SKX-NEXT: vptestmd %xmm1, %xmm0, %k0
; SKX-NEXT: kmovd %k0, %eax		; SKX-NEXT: kmovd %k0, %eax
; SKX-NEXT: testb $15, %al		; SKX-NEXT: testb $15, %al
; SKX-NEXT: sete %al		; SKX-NEXT: sete %al
Show All 17 Lines
; SSE2-NEXT: packsswb %xmm0, %xmm0		; SSE2-NEXT: packsswb %xmm0, %xmm0
; SSE2-NEXT: pmovmskb %xmm0, %eax		; SSE2-NEXT: pmovmskb %xmm0, %eax
; SSE2-NEXT: cmpb $-1, %al		; SSE2-NEXT: cmpb $-1, %al
; SSE2-NEXT: sete %al		; SSE2-NEXT: sete %al
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX1-LABEL: allones_v8i32_and4:		; AVX1-LABEL: allones_v8i32_and4:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vandps {{.*}}(%rip), %ymm0, %ymm0		; AVX1-NEXT: vpslld $29, %xmm0, %xmm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpslld $29, %xmm0, %xmm0
; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm1		; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqd %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm0
; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
; AVX1-NEXT: vmovmskps %ymm0, %eax		; AVX1-NEXT: vmovmskps %ymm0, %eax
; AVX1-NEXT: cmpb $-1, %al		; AVX1-NEXT: cmpb $-1, %al
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allones_v8i32_and4:		; AVX2-LABEL: allones_v8i32_and4:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastd {{.*#+}} ymm1 = [4,4,4,4,4,4,4,4]		; AVX2-NEXT: vpslld $29, %ymm0, %ymm0
; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vpcmpeqd %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vmovmskps %ymm0, %eax		; AVX2-NEXT: vmovmskps %ymm0, %eax
; AVX2-NEXT: cmpb $-1, %al		; AVX2-NEXT: cmpb $-1, %al
; AVX2-NEXT: sete %al		; AVX2-NEXT: sete %al
; AVX2-NEXT: vzeroupper		; AVX2-NEXT: vzeroupper
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; SKX-LABEL: allones_v8i32_and4:		; SKX-LABEL: allones_v8i32_and4:
; SKX: # %bb.0:		; SKX: # %bb.0:
Show All 22 Lines
; SSE2-NEXT: packsswb %xmm0, %xmm0		; SSE2-NEXT: packsswb %xmm0, %xmm0
; SSE2-NEXT: pmovmskb %xmm0, %eax		; SSE2-NEXT: pmovmskb %xmm0, %eax
; SSE2-NEXT: testb %al, %al		; SSE2-NEXT: testb %al, %al
; SSE2-NEXT: sete %al		; SSE2-NEXT: sete %al
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX1-LABEL: allzeros_v8i32_and4:		; AVX1-LABEL: allzeros_v8i32_and4:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vandps {{.*}}(%rip), %ymm0, %ymm0		; AVX1-NEXT: vpslld $29, %xmm0, %xmm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpslld $29, %xmm0, %xmm0
; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm1		; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqd %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm0
; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
; AVX1-NEXT: vmovmskps %ymm0, %eax		; AVX1-NEXT: vmovmskps %ymm0, %eax
; AVX1-NEXT: testb %al, %al		; AVX1-NEXT: testb %al, %al
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allzeros_v8i32_and4:		; AVX2-LABEL: allzeros_v8i32_and4:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastd {{.*#+}} ymm1 = [4,4,4,4,4,4,4,4]		; AVX2-NEXT: vpslld $29, %ymm0, %ymm0
; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vpcmpeqd %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vmovmskps %ymm0, %eax		; AVX2-NEXT: vmovmskps %ymm0, %eax
; AVX2-NEXT: testb %al, %al		; AVX2-NEXT: testb %al, %al
; AVX2-NEXT: sete %al		; AVX2-NEXT: sete %al
; AVX2-NEXT: vzeroupper		; AVX2-NEXT: vzeroupper
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; SKX-LABEL: allzeros_v8i32_and4:		; SKX-LABEL: allzeros_v8i32_and4:
; SKX: # %bb.0:		; SKX: # %bb.0:
▲ Show 20 Lines • Show All 164 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq
%tmp2 = bitcast <16 x i1> %tmp1 to i16		%tmp2 = bitcast <16 x i1> %tmp1 to i16
%tmp3 = icmp eq i16 %tmp2, 0		%tmp3 = icmp eq i16 %tmp2, 0
ret i1 %tmp3		ret i1 %tmp3
}		}

define i1 @allones_v2i64_and4(<2 x i64> %arg) {		define i1 @allones_v2i64_and4(<2 x i64> %arg) {
; SSE2-LABEL: allones_v2i64_and4:		; SSE2-LABEL: allones_v2i64_and4:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [4,4]		; SSE2-NEXT: psllq $61, %xmm0
; SSE2-NEXT: pand %xmm1, %xmm0		; SSE2-NEXT: movmskpd %xmm0, %eax
; SSE2-NEXT: pcmpeqd %xmm1, %xmm0
; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,0,3,2]
; SSE2-NEXT: pand %xmm0, %xmm1
; SSE2-NEXT: movmskpd %xmm1, %eax
; SSE2-NEXT: cmpb $3, %al		; SSE2-NEXT: cmpb $3, %al
; SSE2-NEXT: sete %al		; SSE2-NEXT: sete %al
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX-LABEL: allones_v2i64_and4:		; AVX-LABEL: allones_v2i64_and4:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [4,4]		; AVX-NEXT: vpsllq $61, %xmm0, %xmm0
; AVX-NEXT: vpand %xmm1, %xmm0, %xmm0
; AVX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
; AVX-NEXT: vmovmskpd %xmm0, %eax		; AVX-NEXT: vmovmskpd %xmm0, %eax
; AVX-NEXT: cmpb $3, %al		; AVX-NEXT: cmpb $3, %al
; AVX-NEXT: sete %al		; AVX-NEXT: sete %al
; AVX-NEXT: retq		; AVX-NEXT: retq
;		;
; SKX-LABEL: allones_v2i64_and4:		; SKX-LABEL: allones_v2i64_and4:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmq {{.*}}(%rip), %xmm0, %k0		; SKX-NEXT: vptestmq {{.*}}(%rip), %xmm0, %k0
; SKX-NEXT: kmovd %k0, %eax		; SKX-NEXT: kmovd %k0, %eax
; SKX-NEXT: andb $3, %al		; SKX-NEXT: andb $3, %al
; SKX-NEXT: cmpb $3, %al		; SKX-NEXT: cmpb $3, %al
; SKX-NEXT: sete %al		; SKX-NEXT: sete %al
; SKX-NEXT: retq		; SKX-NEXT: retq
%tmp = and <2 x i64> %arg, <i64 4, i64 4>		%tmp = and <2 x i64> %arg, <i64 4, i64 4>
%tmp1 = icmp ne <2 x i64> %tmp, zeroinitializer		%tmp1 = icmp ne <2 x i64> %tmp, zeroinitializer
%tmp2 = bitcast <2 x i1> %tmp1 to i2		%tmp2 = bitcast <2 x i1> %tmp1 to i2
%tmp3 = icmp eq i2 %tmp2, -1		%tmp3 = icmp eq i2 %tmp2, -1
ret i1 %tmp3		ret i1 %tmp3
}		}

define i1 @allzeros_v2i64_and4(<2 x i64> %arg) {		define i1 @allzeros_v2i64_and4(<2 x i64> %arg) {
; SSE2-LABEL: allzeros_v2i64_and4:		; SSE2-LABEL: allzeros_v2i64_and4:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [4,4]		; SSE2-NEXT: psllq $61, %xmm0
; SSE2-NEXT: pand %xmm1, %xmm0		; SSE2-NEXT: movmskpd %xmm0, %eax
; SSE2-NEXT: pcmpeqd %xmm1, %xmm0
; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,0,3,2]
; SSE2-NEXT: pand %xmm0, %xmm1
; SSE2-NEXT: movmskpd %xmm1, %eax
; SSE2-NEXT: testb %al, %al		; SSE2-NEXT: testb %al, %al
; SSE2-NEXT: sete %al		; SSE2-NEXT: sete %al
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX-LABEL: allzeros_v2i64_and4:		; AVX-LABEL: allzeros_v2i64_and4:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [4,4]		; AVX-NEXT: vpsllq $61, %xmm0, %xmm0
; AVX-NEXT: vpand %xmm1, %xmm0, %xmm0
; AVX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
; AVX-NEXT: vmovmskpd %xmm0, %eax		; AVX-NEXT: vmovmskpd %xmm0, %eax
; AVX-NEXT: testb %al, %al		; AVX-NEXT: testb %al, %al
; AVX-NEXT: sete %al		; AVX-NEXT: sete %al
; AVX-NEXT: retq		; AVX-NEXT: retq
;		;
; SKX-LABEL: allzeros_v2i64_and4:		; SKX-LABEL: allzeros_v2i64_and4:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmq {{.*}}(%rip), %xmm0, %k0		; SKX-NEXT: vptestmq {{.*}}(%rip), %xmm0, %k0
Show All 23 Lines
; SSE2-NEXT: packssdw %xmm3, %xmm1		; SSE2-NEXT: packssdw %xmm3, %xmm1
; SSE2-NEXT: movmskps %xmm1, %eax		; SSE2-NEXT: movmskps %xmm1, %eax
; SSE2-NEXT: cmpb $15, %al		; SSE2-NEXT: cmpb $15, %al
; SSE2-NEXT: sete %al		; SSE2-NEXT: sete %al
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX1-LABEL: allones_v4i64_and4:		; AVX1-LABEL: allones_v4i64_and4:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vandps {{.*}}(%rip), %ymm0, %ymm0		; AVX1-NEXT: vpsllq $61, %xmm0, %xmm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpsllq $61, %xmm0, %xmm0
; AVX1-NEXT: vpcmpeqq %xmm2, %xmm1, %xmm1		; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqq %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm0
; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
; AVX1-NEXT: vmovmskpd %ymm0, %eax		; AVX1-NEXT: vmovmskpd %ymm0, %eax
; AVX1-NEXT: cmpb $15, %al		; AVX1-NEXT: cmpb $15, %al
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allones_v4i64_and4:		; AVX2-LABEL: allones_v4i64_and4:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm1 = [4,4,4,4]		; AVX2-NEXT: vpsllq $61, %ymm0, %ymm0
; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vmovmskpd %ymm0, %eax		; AVX2-NEXT: vmovmskpd %ymm0, %eax
; AVX2-NEXT: cmpb $15, %al		; AVX2-NEXT: cmpb $15, %al
; AVX2-NEXT: sete %al		; AVX2-NEXT: sete %al
; AVX2-NEXT: vzeroupper		; AVX2-NEXT: vzeroupper
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; SKX-LABEL: allones_v4i64_and4:		; SKX-LABEL: allones_v4i64_and4:
; SKX: # %bb.0:		; SKX: # %bb.0:
Show All 26 Lines
; SSE2-NEXT: packssdw %xmm3, %xmm1		; SSE2-NEXT: packssdw %xmm3, %xmm1
; SSE2-NEXT: movmskps %xmm1, %eax		; SSE2-NEXT: movmskps %xmm1, %eax
; SSE2-NEXT: testb %al, %al		; SSE2-NEXT: testb %al, %al
; SSE2-NEXT: sete %al		; SSE2-NEXT: sete %al
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX1-LABEL: allzeros_v4i64_and4:		; AVX1-LABEL: allzeros_v4i64_and4:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vandps {{.*}}(%rip), %ymm0, %ymm0		; AVX1-NEXT: vpsllq $61, %xmm0, %xmm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpsllq $61, %xmm0, %xmm0
; AVX1-NEXT: vpcmpeqq %xmm2, %xmm1, %xmm1		; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqq %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm0
; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
; AVX1-NEXT: vmovmskpd %ymm0, %eax		; AVX1-NEXT: vmovmskpd %ymm0, %eax
; AVX1-NEXT: testb %al, %al		; AVX1-NEXT: testb %al, %al
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allzeros_v4i64_and4:		; AVX2-LABEL: allzeros_v4i64_and4:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm1 = [4,4,4,4]		; AVX2-NEXT: vpsllq $61, %ymm0, %ymm0
; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vmovmskpd %ymm0, %eax		; AVX2-NEXT: vmovmskpd %ymm0, %eax
; AVX2-NEXT: testb %al, %al		; AVX2-NEXT: testb %al, %al
; AVX2-NEXT: sete %al		; AVX2-NEXT: sete %al
; AVX2-NEXT: vzeroupper		; AVX2-NEXT: vzeroupper
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; SKX-LABEL: allzeros_v4i64_and4:		; SKX-LABEL: allzeros_v4i64_and4:
; SKX: # %bb.0:		; SKX: # %bb.0:
▲ Show 20 Lines • Show All 180 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Fold (movmsk (setne (and X, (1 << C)), 0)) -> (movmsk (X << C))
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 165644

llvm/trunk/lib/Target/X86/X86ISelLowering.cpp

llvm/trunk/test/CodeGen/X86/movmsk-cmp.ll

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Fold (movmsk (setne (and X, (1 << C)), 0)) -> (movmsk (X << C))ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 165644

llvm/trunk/lib/Target/X86/X86ISelLowering.cpp

llvm/trunk/test/CodeGen/X86/movmsk-cmp.ll

[X86] Fold (movmsk (setne (and X, (1 << C)), 0)) -> (movmsk (X << C))
ClosedPublic