Diff 315093

llvm/lib/CodeGen/SelectionDAG/TargetLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 3,950 Lines • ▼ Show 20 Lines	if (auto *N1C = isConstOrConstSplat(N1)) {
}		}

if (Cond == ISD::SETEQ \|\| Cond == ISD::SETNE) {		if (Cond == ISD::SETEQ \|\| Cond == ISD::SETNE) {
// (X & (C l>>/<< Y)) ==/!= 0 --> ((X <</l>> Y) & C) ==/!= 0		// (X & (C l>>/<< Y)) ==/!= 0 --> ((X <</l>> Y) & C) ==/!= 0
if (C1.isNullValue())		if (C1.isNullValue())
if (SDValue CC = optimizeSetCCByHoistingAndByConstFromLogicalShift(		if (SDValue CC = optimizeSetCCByHoistingAndByConstFromLogicalShift(
VT, N0, N1, Cond, DCI, dl))		VT, N0, N1, Cond, DCI, dl))
return CC;		return CC;

		// For all/any comparisons, replace or(x,shl(y,bw/2)) with and/or(x,y).
		spatelUnsubmitted Not Done Reply Inline Actions Add an example to this comment to make it clearer which patterns we are handling: // When high 32-bits of i64 X are known clear: // all bits clear: (X \| (Y<<32)) == 0 --> (X \| Y) == 0 // all bits set: (X \| (Y<<32)) == -1 --> (X & Y) == -1 spatel: Add an example to this comment to make it clearer which patterns we are handling: // When…
		spatelUnsubmitted Not Done Reply Inline Actions I still think it would be nice to add a code comment like this. This code block is big enough that it's hard to recognize the whole patterns that we are transforming. spatel: I still think it would be nice to add a code comment like this. This code block is big enough…
		// For example, when high 32-bits of i64 X are known clear:
		// all bits clear: (X \| (Y<<32)) == 0 --> (X \| Y) == 0
		// all bits set: (X \| (Y<<32)) == -1 --> (X & Y) == -1
		bool CmpZero = N1C->getAPIntValue().isNullValue();
		bool CmpNegOne = N1C->getAPIntValue().isAllOnesValue();
		if ((CmpZero \|\| CmpNegOne) && N0.hasOneUse()) {
		// Match or(lo,shl(hi,bw/2)) pattern.
		auto IsConcat = [&](SDValue V, SDValue &Lo, SDValue &Hi) {
		unsigned EltBits = V.getScalarValueSizeInBits();
		if (V.getOpcode() != ISD::OR \|\| (EltBits % 2) != 0)
		return false;
		spatelUnsubmitted Not Done Reply Inline Actions I think we should check for the opcode + shift amount match in one shot. Otherwise, we can miss patterns that are identical other than the commuted `or` operands: define i1 @shl_shl(i16 %x, i16 %y) { %zx = zext i16 %x to i64 %zy = zext i16 %y to i64 %sx = shl i64 %zx, 32 %sy = shl i64 %zy, 8 %or = or i64 %sx, %sy %r = icmp eq i64 %or, 0 ret i1 %r } define i1 @shl_shl_commute(i16 %x, i16 %y) { %zx = zext i16 %x to i64 %zy = zext i16 %y to i64 %sx = shl i64 %zx, 32 %sy = shl i64 %zy, 8 %or = or i64 %sy, %sx %r = icmp eq i64 %or, 0 ret i1 %r } spatel: I think we should check for the opcode + shift amount match in one shot. Otherwise, we can miss…
		SDValue LHS = V.getOperand(0);
		SDValue RHS = V.getOperand(1);
		APInt HiBits = APInt::getHighBitsSet(EltBits, EltBits / 2);
		// Unshifted element must have zero upperbits.
		if (RHS.getOpcode() == ISD::SHL &&
		isa<ConstantSDNode>(RHS.getOperand(1)) &&
		RHS.getConstantOperandAPInt(1) == (EltBits / 2) &&
		DAG.MaskedValueIsZero(LHS, HiBits)) {
		Lo = LHS;
		Hi = RHS.getOperand(0);
		yubingUnsubmitted Not Done Reply Inline Actions Hi, Simon. It seems that following combine is incorrect? t16: i1 = setcc t34, Constant:i64<-1>, seteq:ch t34: i64 = or t30, t33 t33: i64 = shl t31, Constant:i8<32> into: t35: i64 = Constant<4294967295> t36: i64 = and t31, Constant:i64<4294967295> t37: i64 = and t30, t36 t38: i1 = setcc t37, Constant:i64<4294967295>, seteq:ch Before combine, t16 is equal to or(x,shl(y,32)) == -1(i64) But aftercombine, t38 is equal to and(x_low, y_low) ==-1(i32) This happens in allones_v64i8_and4 with core-avx2 yubing: Hi, Simon. It seems that following combine is incorrect? t16: i1 = setcc t34, Constant:i64<-1>…
		RKSimonAuthorUnsubmitted Done Reply Inline Actions I'm sorry but I'm not clear what issue you're saying I've missed in allones_v64i8_and4? Being able to reduce the allbits comparison from i64 to i32 is what we're trying to accomplish. We check that 'x' (LHS) is zero in the upper bits, so we know the upper half of the compare bits come from 'y_low' and the lower half from 'x_low'. RKSimon: I'm sorry but I'm not clear what issue you're saying I've missed in allones_v64i8_and4? Being…
		yubingUnsubmitted Not Done Reply Inline Actions Ah, sorry, I should have seen we check if upper half of x is zero. yubing: Ah, sorry, I should have seen we check if upper half of x is zero.
		return true;
		}
		if (LHS.getOpcode() == ISD::SHL &&
		isa<ConstantSDNode>(LHS.getOperand(1)) &&
		LHS.getConstantOperandAPInt(1) == (EltBits / 2) &&
		DAG.MaskedValueIsZero(RHS, HiBits)) {
		Lo = RHS;
		Hi = LHS.getOperand(0);
		return true;
		}
		return false;
		};

		auto MergeConcat = [&](SDValue Lo, SDValue Hi) {
		unsigned EltBits = N0.getScalarValueSizeInBits();
		unsigned HalfBits = EltBits / 2;
		APInt HiBits = APInt::getHighBitsSet(EltBits, HalfBits);
		SDValue LoBits = DAG.getConstant(~HiBits, dl, OpVT);
		SDValue HiMask = DAG.getNode(ISD::AND, dl, OpVT, Hi, LoBits);
		SDValue NewN0 =
		DAG.getNode(CmpZero ? ISD::OR : ISD::AND, dl, OpVT, Lo, HiMask);
		SDValue NewN1 = CmpZero ? DAG.getConstant(0, dl, OpVT) : LoBits;
		return DAG.getSetCC(dl, VT, NewN0, NewN1, Cond);
		};

		SDValue Lo, Hi;
		if (IsConcat(N0, Lo, Hi))
		return MergeConcat(Lo, Hi);

		if (N0.getOpcode() == ISD::AND \|\| N0.getOpcode() == ISD::OR) {
		SDValue Lo0, Lo1, Hi0, Hi1;
		if (IsConcat(N0.getOperand(0), Lo0, Hi0) &&
		IsConcat(N0.getOperand(1), Lo1, Hi1)) {
		return MergeConcat(DAG.getNode(N0.getOpcode(), dl, OpVT, Lo0, Lo1),
		DAG.getNode(N0.getOpcode(), dl, OpVT, Hi0, Hi1));
		}
		}
		}
}		}

// If we have "setcc X, C0", check to see if we can shrink the immediate		// If we have "setcc X, C0", check to see if we can shrink the immediate
// by changing cc.		// by changing cc.
// TODO: Support this for vectors after legalize ops.		// TODO: Support this for vectors after legalize ops.
if (!VT.isVector() \|\| DCI.isBeforeLegalizeOps()) {		if (!VT.isVector() \|\| DCI.isBeforeLegalizeOps()) {
// SETUGT X, SINTMAX -> SETLT X, 0		// SETUGT X, SINTMAX -> SETLT X, 0
// SETUGE X, SINTMIN -> SETLT X, 0		// SETUGE X, SINTMIN -> SETLT X, 0
▲ Show 20 Lines • Show All 4,332 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/avx512-mask-op.ll

	Show First 20 Lines • Show All 2,142 Lines • ▼ Show 20 Lines
	End:			End:
	ret void			ret void
	}			}

	define void @ktest_2(<32 x float> %in, float * %base) {			define void @ktest_2(<32 x float> %in, float * %base) {
	;			;
	; KNL-LABEL: ktest_2:			; KNL-LABEL: ktest_2:
	; KNL: ## %bb.0:			; KNL: ## %bb.0:
	; KNL-NEXT: vcmpgtps 64(%rdi), %zmm1, %k1			; KNL-NEXT: vcmpgtps (%rdi), %zmm0, %k1
	; KNL-NEXT: vcmpgtps (%rdi), %zmm0, %k2			; KNL-NEXT: vcmpgtps 64(%rdi), %zmm1, %k2
	; KNL-NEXT: vmovups 4(%rdi), %zmm2 {%k2} {z}			; KNL-NEXT: vmovups 68(%rdi), %zmm2 {%k2} {z}
	; KNL-NEXT: vmovups 68(%rdi), %zmm3 {%k1} {z}			; KNL-NEXT: vmovups 4(%rdi), %zmm3 {%k1} {z}
	; KNL-NEXT: vcmpltps %zmm3, %zmm1, %k0			; KNL-NEXT: vcmpltps %zmm3, %zmm0, %k0
	; KNL-NEXT: vcmpltps %zmm2, %zmm0, %k3			; KNL-NEXT: vcmpltps %zmm2, %zmm1, %k3
	; KNL-NEXT: korw %k3, %k2, %k2			; KNL-NEXT: korw %k3, %k2, %k2
	; KNL-NEXT: kmovw %k2, %eax
	; KNL-NEXT: korw %k0, %k1, %k0			; KNL-NEXT: korw %k0, %k1, %k0
	; KNL-NEXT: kmovw %k0, %ecx			; KNL-NEXT: kortestw %k2, %k0
	; KNL-NEXT: shll $16, %ecx
	; KNL-NEXT: orl %eax, %ecx
	; KNL-NEXT: je LBB45_2			; KNL-NEXT: je LBB45_2
	; KNL-NEXT: ## %bb.1: ## %L1			; KNL-NEXT: ## %bb.1: ## %L1
	; KNL-NEXT: vmovaps %zmm0, (%rdi)			; KNL-NEXT: vmovaps %zmm0, (%rdi)
	; KNL-NEXT: vmovaps %zmm1, 64(%rdi)			; KNL-NEXT: vmovaps %zmm1, 64(%rdi)
	; KNL-NEXT: vzeroupper			; KNL-NEXT: vzeroupper
	; KNL-NEXT: retq			; KNL-NEXT: retq
	; KNL-NEXT: LBB45_2: ## %L2			; KNL-NEXT: LBB45_2: ## %L2
	; KNL-NEXT: vmovaps %zmm0, 4(%rdi)			; KNL-NEXT: vmovaps %zmm0, 4(%rdi)
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; AVX512BW-NEXT: LBB45_2: ## %L2			; AVX512BW-NEXT: LBB45_2: ## %L2
	; AVX512BW-NEXT: vmovaps %zmm0, 4(%rdi)			; AVX512BW-NEXT: vmovaps %zmm0, 4(%rdi)
	; AVX512BW-NEXT: vmovaps %zmm1, 68(%rdi)			; AVX512BW-NEXT: vmovaps %zmm1, 68(%rdi)
	; AVX512BW-NEXT: vzeroupper			; AVX512BW-NEXT: vzeroupper
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512DQ-LABEL: ktest_2:			; AVX512DQ-LABEL: ktest_2:
	; AVX512DQ: ## %bb.0:			; AVX512DQ: ## %bb.0:
	; AVX512DQ-NEXT: vcmpgtps 64(%rdi), %zmm1, %k1			; AVX512DQ-NEXT: vcmpgtps (%rdi), %zmm0, %k1
	; AVX512DQ-NEXT: vcmpgtps (%rdi), %zmm0, %k2			; AVX512DQ-NEXT: vcmpgtps 64(%rdi), %zmm1, %k2
	; AVX512DQ-NEXT: vmovups 4(%rdi), %zmm2 {%k2} {z}			; AVX512DQ-NEXT: vmovups 68(%rdi), %zmm2 {%k2} {z}
	; AVX512DQ-NEXT: vmovups 68(%rdi), %zmm3 {%k1} {z}			; AVX512DQ-NEXT: vmovups 4(%rdi), %zmm3 {%k1} {z}
	; AVX512DQ-NEXT: vcmpltps %zmm3, %zmm1, %k0			; AVX512DQ-NEXT: vcmpltps %zmm3, %zmm0, %k0
	; AVX512DQ-NEXT: vcmpltps %zmm2, %zmm0, %k3			; AVX512DQ-NEXT: vcmpltps %zmm2, %zmm1, %k3
	; AVX512DQ-NEXT: korw %k3, %k2, %k2			; AVX512DQ-NEXT: korw %k3, %k2, %k2
	; AVX512DQ-NEXT: kmovw %k2, %eax
	; AVX512DQ-NEXT: korw %k0, %k1, %k0			; AVX512DQ-NEXT: korw %k0, %k1, %k0
	; AVX512DQ-NEXT: kmovw %k0, %ecx			; AVX512DQ-NEXT: kortestw %k2, %k0
	; AVX512DQ-NEXT: shll $16, %ecx
	; AVX512DQ-NEXT: orl %eax, %ecx
	; AVX512DQ-NEXT: je LBB45_2			; AVX512DQ-NEXT: je LBB45_2
	; AVX512DQ-NEXT: ## %bb.1: ## %L1			; AVX512DQ-NEXT: ## %bb.1: ## %L1
	; AVX512DQ-NEXT: vmovaps %zmm0, (%rdi)			; AVX512DQ-NEXT: vmovaps %zmm0, (%rdi)
	; AVX512DQ-NEXT: vmovaps %zmm1, 64(%rdi)			; AVX512DQ-NEXT: vmovaps %zmm1, 64(%rdi)
	; AVX512DQ-NEXT: vzeroupper			; AVX512DQ-NEXT: vzeroupper
	; AVX512DQ-NEXT: retq			; AVX512DQ-NEXT: retq
	; AVX512DQ-NEXT: LBB45_2: ## %L2			; AVX512DQ-NEXT: LBB45_2: ## %L2
	; AVX512DQ-NEXT: vmovaps %zmm0, 4(%rdi)			; AVX512DQ-NEXT: vmovaps %zmm0, 4(%rdi)
	▲ Show 20 Lines • Show All 2,613 Lines • ▼ Show 20 Lines
	; KNL-NEXT: vpcmpeqw %ymm5, %ymm1, %ymm1			; KNL-NEXT: vpcmpeqw %ymm5, %ymm1, %ymm1
	; KNL-NEXT: vpcmpeqw %ymm5, %ymm2, %ymm2			; KNL-NEXT: vpcmpeqw %ymm5, %ymm2, %ymm2
	; KNL-NEXT: vinserti64x4 $1, %ymm1, %zmm2, %zmm1			; KNL-NEXT: vinserti64x4 $1, %ymm1, %zmm2, %zmm1
	; KNL-NEXT: vextracti64x4 $1, %zmm3, %ymm2			; KNL-NEXT: vextracti64x4 $1, %zmm3, %ymm2
	; KNL-NEXT: vpcmpeqw %ymm5, %ymm2, %ymm2			; KNL-NEXT: vpcmpeqw %ymm5, %ymm2, %ymm2
	; KNL-NEXT: vpcmpeqw %ymm5, %ymm3, %ymm3			; KNL-NEXT: vpcmpeqw %ymm5, %ymm3, %ymm3
	; KNL-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2			; KNL-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; KNL-NEXT: vpternlogq $200, %zmm1, %zmm0, %zmm2			; KNL-NEXT: vpternlogq $200, %zmm1, %zmm0, %zmm2
	; KNL-NEXT: vpmovsxwd %ymm2, %zmm0
	; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0
	; KNL-NEXT: kmovw %k0, %eax
	; KNL-NEXT: vextracti64x4 $1, %zmm2, %ymm0			; KNL-NEXT: vextracti64x4 $1, %zmm2, %ymm0
				; KNL-NEXT: vpor %ymm0, %ymm2, %ymm0
	; KNL-NEXT: vpmovsxwd %ymm0, %zmm0			; KNL-NEXT: vpmovsxwd %ymm0, %zmm0
				; KNL-NEXT: vpslld $31, %zmm0, %zmm0
	; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0			; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0
	; KNL-NEXT: kmovw %k0, %ecx			; KNL-NEXT: kortestw %k0, %k0
	; KNL-NEXT: shll $16, %ecx
	; KNL-NEXT: orl %eax, %ecx
	; KNL-NEXT: je LBB77_1			; KNL-NEXT: je LBB77_1
	; KNL-NEXT: ## %bb.2: ## %exit			; KNL-NEXT: ## %bb.2: ## %exit
	; KNL-NEXT: vzeroupper			; KNL-NEXT: vzeroupper
	; KNL-NEXT: retq			; KNL-NEXT: retq
	; KNL-NEXT: LBB77_1: ## %bar			; KNL-NEXT: LBB77_1: ## %bar
	; KNL-NEXT: pushq %rax			; KNL-NEXT: pushq %rax
	; KNL-NEXT: .cfi_def_cfa_offset 16			; KNL-NEXT: .cfi_def_cfa_offset 16
	; KNL-NEXT: vzeroupper			; KNL-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; AVX512DQ-NEXT: vpcmpeqw %ymm5, %ymm1, %ymm1			; AVX512DQ-NEXT: vpcmpeqw %ymm5, %ymm1, %ymm1
	; AVX512DQ-NEXT: vpcmpeqw %ymm5, %ymm2, %ymm2			; AVX512DQ-NEXT: vpcmpeqw %ymm5, %ymm2, %ymm2
	; AVX512DQ-NEXT: vinserti64x4 $1, %ymm1, %zmm2, %zmm1			; AVX512DQ-NEXT: vinserti64x4 $1, %ymm1, %zmm2, %zmm1
	; AVX512DQ-NEXT: vextracti64x4 $1, %zmm3, %ymm2			; AVX512DQ-NEXT: vextracti64x4 $1, %zmm3, %ymm2
	; AVX512DQ-NEXT: vpcmpeqw %ymm5, %ymm2, %ymm2			; AVX512DQ-NEXT: vpcmpeqw %ymm5, %ymm2, %ymm2
	; AVX512DQ-NEXT: vpcmpeqw %ymm5, %ymm3, %ymm3			; AVX512DQ-NEXT: vpcmpeqw %ymm5, %ymm3, %ymm3
	; AVX512DQ-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2			; AVX512DQ-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512DQ-NEXT: vpternlogq $200, %zmm1, %zmm0, %zmm2			; AVX512DQ-NEXT: vpternlogq $200, %zmm1, %zmm0, %zmm2
	; AVX512DQ-NEXT: vpmovsxwd %ymm2, %zmm0
	; AVX512DQ-NEXT: vpmovd2m %zmm0, %k0
	; AVX512DQ-NEXT: kmovw %k0, %eax
	; AVX512DQ-NEXT: vextracti64x4 $1, %zmm2, %ymm0			; AVX512DQ-NEXT: vextracti64x4 $1, %zmm2, %ymm0
				; AVX512DQ-NEXT: vpor %ymm0, %ymm2, %ymm0
	; AVX512DQ-NEXT: vpmovsxwd %ymm0, %zmm0			; AVX512DQ-NEXT: vpmovsxwd %ymm0, %zmm0
				; AVX512DQ-NEXT: vpslld $31, %zmm0, %zmm0
	; AVX512DQ-NEXT: vpmovd2m %zmm0, %k0			; AVX512DQ-NEXT: vpmovd2m %zmm0, %k0
	; AVX512DQ-NEXT: kmovw %k0, %ecx			; AVX512DQ-NEXT: kortestw %k0, %k0
	; AVX512DQ-NEXT: shll $16, %ecx
	; AVX512DQ-NEXT: orl %eax, %ecx
	; AVX512DQ-NEXT: je LBB77_1			; AVX512DQ-NEXT: je LBB77_1
	; AVX512DQ-NEXT: ## %bb.2: ## %exit			; AVX512DQ-NEXT: ## %bb.2: ## %exit
	; AVX512DQ-NEXT: vzeroupper			; AVX512DQ-NEXT: vzeroupper
	; AVX512DQ-NEXT: retq			; AVX512DQ-NEXT: retq
	; AVX512DQ-NEXT: LBB77_1: ## %bar			; AVX512DQ-NEXT: LBB77_1: ## %bar
	; AVX512DQ-NEXT: pushq %rax			; AVX512DQ-NEXT: pushq %rax
	; AVX512DQ-NEXT: .cfi_def_cfa_offset 16			; AVX512DQ-NEXT: .cfi_def_cfa_offset 16
	; AVX512DQ-NEXT: vzeroupper			; AVX512DQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; KNL-NEXT: vpcmpeqb %ymm5, %ymm1, %ymm1			; KNL-NEXT: vpcmpeqb %ymm5, %ymm1, %ymm1
	; KNL-NEXT: vpcmpeqb %ymm5, %ymm2, %ymm2			; KNL-NEXT: vpcmpeqb %ymm5, %ymm2, %ymm2
	; KNL-NEXT: vinserti64x4 $1, %ymm1, %zmm2, %zmm1			; KNL-NEXT: vinserti64x4 $1, %ymm1, %zmm2, %zmm1
	; KNL-NEXT: vextracti64x4 $1, %zmm3, %ymm2			; KNL-NEXT: vextracti64x4 $1, %zmm3, %ymm2
	; KNL-NEXT: vpcmpeqb %ymm5, %ymm2, %ymm2			; KNL-NEXT: vpcmpeqb %ymm5, %ymm2, %ymm2
	; KNL-NEXT: vpcmpeqb %ymm5, %ymm3, %ymm3			; KNL-NEXT: vpcmpeqb %ymm5, %ymm3, %ymm3
	; KNL-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2			; KNL-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; KNL-NEXT: vpternlogq $200, %zmm1, %zmm0, %zmm2			; KNL-NEXT: vpternlogq $200, %zmm1, %zmm0, %zmm2
	; KNL-NEXT: vpmovmskb %ymm2, %eax
	; KNL-NEXT: vextracti64x4 $1, %zmm2, %ymm0			; KNL-NEXT: vextracti64x4 $1, %zmm2, %ymm0
	; KNL-NEXT: vpmovmskb %ymm0, %ecx			; KNL-NEXT: vpor %ymm0, %ymm2, %ymm0
	; KNL-NEXT: shlq $32, %rcx			; KNL-NEXT: vpmovmskb %ymm0, %eax
	; KNL-NEXT: orq %rax, %rcx			; KNL-NEXT: testl %eax, %eax
	; KNL-NEXT: je LBB78_1			; KNL-NEXT: je LBB78_1
	; KNL-NEXT: ## %bb.2: ## %exit			; KNL-NEXT: ## %bb.2: ## %exit
	; KNL-NEXT: vzeroupper			; KNL-NEXT: vzeroupper
	; KNL-NEXT: retq			; KNL-NEXT: retq
	; KNL-NEXT: LBB78_1: ## %bar			; KNL-NEXT: LBB78_1: ## %bar
	; KNL-NEXT: pushq %rax			; KNL-NEXT: pushq %rax
	; KNL-NEXT: .cfi_def_cfa_offset 16			; KNL-NEXT: .cfi_def_cfa_offset 16
	; KNL-NEXT: vzeroupper			; KNL-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; AVX512DQ-NEXT: vpcmpeqb %ymm5, %ymm1, %ymm1			; AVX512DQ-NEXT: vpcmpeqb %ymm5, %ymm1, %ymm1
	; AVX512DQ-NEXT: vpcmpeqb %ymm5, %ymm2, %ymm2			; AVX512DQ-NEXT: vpcmpeqb %ymm5, %ymm2, %ymm2
	; AVX512DQ-NEXT: vinserti64x4 $1, %ymm1, %zmm2, %zmm1			; AVX512DQ-NEXT: vinserti64x4 $1, %ymm1, %zmm2, %zmm1
	; AVX512DQ-NEXT: vextracti64x4 $1, %zmm3, %ymm2			; AVX512DQ-NEXT: vextracti64x4 $1, %zmm3, %ymm2
	; AVX512DQ-NEXT: vpcmpeqb %ymm5, %ymm2, %ymm2			; AVX512DQ-NEXT: vpcmpeqb %ymm5, %ymm2, %ymm2
	; AVX512DQ-NEXT: vpcmpeqb %ymm5, %ymm3, %ymm3			; AVX512DQ-NEXT: vpcmpeqb %ymm5, %ymm3, %ymm3
	; AVX512DQ-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2			; AVX512DQ-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512DQ-NEXT: vpternlogq $200, %zmm1, %zmm0, %zmm2			; AVX512DQ-NEXT: vpternlogq $200, %zmm1, %zmm0, %zmm2
	; AVX512DQ-NEXT: vpmovmskb %ymm2, %eax
	; AVX512DQ-NEXT: vextracti64x4 $1, %zmm2, %ymm0			; AVX512DQ-NEXT: vextracti64x4 $1, %zmm2, %ymm0
	; AVX512DQ-NEXT: vpmovmskb %ymm0, %ecx			; AVX512DQ-NEXT: vpor %ymm0, %ymm2, %ymm0
	; AVX512DQ-NEXT: shlq $32, %rcx			; AVX512DQ-NEXT: vpmovmskb %ymm0, %eax
	; AVX512DQ-NEXT: orq %rax, %rcx			; AVX512DQ-NEXT: testl %eax, %eax
	; AVX512DQ-NEXT: je LBB78_1			; AVX512DQ-NEXT: je LBB78_1
	; AVX512DQ-NEXT: ## %bb.2: ## %exit			; AVX512DQ-NEXT: ## %bb.2: ## %exit
	; AVX512DQ-NEXT: vzeroupper			; AVX512DQ-NEXT: vzeroupper
	; AVX512DQ-NEXT: retq			; AVX512DQ-NEXT: retq
	; AVX512DQ-NEXT: LBB78_1: ## %bar			; AVX512DQ-NEXT: LBB78_1: ## %bar
	; AVX512DQ-NEXT: pushq %rax			; AVX512DQ-NEXT: pushq %rax
	; AVX512DQ-NEXT: .cfi_def_cfa_offset 16			; AVX512DQ-NEXT: .cfi_def_cfa_offset 16
	; AVX512DQ-NEXT: vzeroupper			; AVX512DQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 581 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/cmp-concat.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 \| FileCheck %s			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 \| FileCheck %s

	define i1 @cmp_allbits_concat_i8(i8 %x, i8 %y) {			define i1 @cmp_allbits_concat_i8(i8 %x, i8 %y) {
	; CHECK-LABEL: cmp_allbits_concat_i8:			; CHECK-LABEL: cmp_allbits_concat_i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: movzbl %sil, %eax			; CHECK-NEXT: andl %esi, %edi
	; CHECK-NEXT: shll $8, %edi			; CHECK-NEXT: cmpb $-1, %dil
	; CHECK-NEXT: orl %eax, %edi
	; CHECK-NEXT: cmpw $-1, %di
	; CHECK-NEXT: sete %al			; CHECK-NEXT: sete %al
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%zx = zext i8 %x to i16			%zx = zext i8 %x to i16
	%zy = zext i8 %y to i16			%zy = zext i8 %y to i16
	%sh = shl i16 %zx, 8			%sh = shl i16 %zx, 8
	%or = or i16 %zy, %sh			%or = or i16 %zy, %sh
	%r = icmp eq i16 %or, -1			%r = icmp eq i16 %or, -1
	ret i1 %r			ret i1 %r
	}			}

	define i1 @cmp_anybits_concat_i32(i32 %x, i32 %y) {			define i1 @cmp_anybits_concat_i32(i32 %x, i32 %y) {
	; CHECK-LABEL: cmp_anybits_concat_i32:			; CHECK-LABEL: cmp_anybits_concat_i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: # kill: def $edi killed $edi def $rdi			; CHECK-NEXT: orl %esi, %edi
	; CHECK-NEXT: movl %esi, %eax
	; CHECK-NEXT: shlq $32, %rdi
	; CHECK-NEXT: orq %rax, %rdi
	; CHECK-NEXT: setne %al			; CHECK-NEXT: setne %al
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%zx = zext i32 %x to i64			%zx = zext i32 %x to i64
	%zy = zext i32 %y to i64			%zy = zext i32 %y to i64
	%sh = shl i64 %zx, 32			%sh = shl i64 %zx, 32
	%or = or i64 %zy, %sh			%or = or i64 %zy, %sh
	%r = icmp ne i64 %or, 0			%r = icmp ne i64 %or, 0
	ret i1 %r			ret i1 %r
	}			}

	define i1 @cmp_anybits_concat_shl_shl_i16(i16 %x, i16 %y) {			define i1 @cmp_anybits_concat_shl_shl_i16(i16 %x, i16 %y) {
	; CHECK-LABEL: cmp_anybits_concat_shl_shl_i16:			; CHECK-LABEL: cmp_anybits_concat_shl_shl_i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: # kill: def $esi killed $esi def $rsi			; CHECK-NEXT: # kill: def $esi killed $esi def $rsi
				; CHECK-NEXT: # kill: def $edi killed $edi def $rdi
	; CHECK-NEXT: movzwl %di, %eax			; CHECK-NEXT: movzwl %di, %eax
	; CHECK-NEXT: movzwl %si, %ecx			; CHECK-NEXT: movzwl %si, %ecx
	; CHECK-NEXT: shlq $32, %rax
	; CHECK-NEXT: shlq $8, %rcx			; CHECK-NEXT: shlq $8, %rcx
	; CHECK-NEXT: orq %rax, %rcx			; CHECK-NEXT: orq %rax, %rcx
	; CHECK-NEXT: sete %al			; CHECK-NEXT: sete %al
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%zx = zext i16 %x to i64			%zx = zext i16 %x to i64
	%zy = zext i16 %y to i64			%zy = zext i16 %y to i64
	%sx = shl i64 %zx, 32			%sx = shl i64 %zx, 32
	%sy = shl i64 %zy, 8			%sy = shl i64 %zy, 8
	%or = or i64 %sx, %sy			%or = or i64 %sx, %sy
	%r = icmp eq i64 %or, 0			%r = icmp eq i64 %or, 0
	ret i1 %r			ret i1 %r
	}			}

	define i1 @cmp_anybits_concat_shl_shl_i16_commute(i16 %x, i16 %y) {			define i1 @cmp_anybits_concat_shl_shl_i16_commute(i16 %x, i16 %y) {
	; CHECK-LABEL: cmp_anybits_concat_shl_shl_i16_commute:			; CHECK-LABEL: cmp_anybits_concat_shl_shl_i16_commute:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: # kill: def $esi killed $esi def $rsi			; CHECK-NEXT: # kill: def $esi killed $esi def $rsi
				; CHECK-NEXT: # kill: def $edi killed $edi def $rdi
	; CHECK-NEXT: movzwl %di, %eax			; CHECK-NEXT: movzwl %di, %eax
	; CHECK-NEXT: movzwl %si, %ecx			; CHECK-NEXT: movzwl %si, %ecx
	; CHECK-NEXT: shlq $32, %rax
	; CHECK-NEXT: shlq $8, %rcx			; CHECK-NEXT: shlq $8, %rcx
	; CHECK-NEXT: orq %rax, %rcx			; CHECK-NEXT: orq %rax, %rcx
	; CHECK-NEXT: sete %al			; CHECK-NEXT: sete %al
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%zx = zext i16 %x to i64			%zx = zext i16 %x to i64
	%zy = zext i16 %y to i64			%zy = zext i16 %y to i64
	%sx = shl i64 %zx, 32			%sx = shl i64 %zx, 32
	%sy = shl i64 %zy, 8			%sy = shl i64 %zy, 8
	%or = or i64 %sy, %sx			%or = or i64 %sy, %sx
	%r = icmp eq i64 %or, 0			%r = icmp eq i64 %or, 0
	ret i1 %r			ret i1 %r
	}			}

				; FIXME: Add vector support, but its only worth it if we can freely truncate the
				; concat'd vectors.

	define <16 x i8> @cmp_allbits_concat_v16i8(<16 x i8> %x, <16 x i8> %y) {			define <16 x i8> @cmp_allbits_concat_v16i8(<16 x i8> %x, <16 x i8> %y) {
	; CHECK-LABEL: cmp_allbits_concat_v16i8:			; CHECK-LABEL: cmp_allbits_concat_v16i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: movdqa %xmm1, %xmm2			; CHECK-NEXT: movdqa %xmm1, %xmm2
	; CHECK-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1],xmm2[2],xmm0[2],xmm2[3],xmm0[3],xmm2[4],xmm0[4],xmm2[5],xmm0[5],xmm2[6],xmm0[6],xmm2[7],xmm0[7]			; CHECK-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1],xmm2[2],xmm0[2],xmm2[3],xmm0[3],xmm2[4],xmm0[4],xmm2[5],xmm0[5],xmm2[6],xmm0[6],xmm2[7],xmm0[7]
	; CHECK-NEXT: punpckhbw {{.*#+}} xmm1 = xmm1[8],xmm0[8],xmm1[9],xmm0[9],xmm1[10],xmm0[10],xmm1[11],xmm0[11],xmm1[12],xmm0[12],xmm1[13],xmm0[13],xmm1[14],xmm0[14],xmm1[15],xmm0[15]			; CHECK-NEXT: punpckhbw {{.*#+}} xmm1 = xmm1[8],xmm0[8],xmm1[9],xmm0[9],xmm1[10],xmm0[10],xmm1[11],xmm0[11],xmm1[12],xmm0[12],xmm1[13],xmm0[13],xmm1[14],xmm0[14],xmm1[15],xmm0[15]
	; CHECK-NEXT: pcmpeqd %xmm0, %xmm0			; CHECK-NEXT: pcmpeqd %xmm0, %xmm0
	; CHECK-NEXT: pcmpeqw %xmm0, %xmm1			; CHECK-NEXT: pcmpeqw %xmm0, %xmm1
	Show All 39 Lines

llvm/test/CodeGen/X86/movmsk-cmp.ll

Show First 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	; AVX-NEXT: retq
%tmp1 = bitcast <16 x i1> %tmp to i16		%tmp1 = bitcast <16 x i1> %tmp to i16
%tmp2 = icmp eq i16 %tmp1, 0		%tmp2 = icmp eq i16 %tmp1, 0
ret i1 %tmp2		ret i1 %tmp2
}		}

define i1 @allones_v32i8_sign(<32 x i8> %arg) {		define i1 @allones_v32i8_sign(<32 x i8> %arg) {
; SSE-LABEL: allones_v32i8_sign:		; SSE-LABEL: allones_v32i8_sign:
; SSE: # %bb.0:		; SSE: # %bb.0:
		; SSE-NEXT: pand %xmm1, %xmm0
; SSE-NEXT: pmovmskb %xmm0, %eax		; SSE-NEXT: pmovmskb %xmm0, %eax
; SSE-NEXT: pmovmskb %xmm1, %ecx		; SSE-NEXT: cmpw $-1, %ax
; SSE-NEXT: shll $16, %ecx
; SSE-NEXT: orl %eax, %ecx
; SSE-NEXT: cmpl $-1, %ecx
; SSE-NEXT: sete %al		; SSE-NEXT: sete %al
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: allones_v32i8_sign:		; AVX1-LABEL: allones_v32i8_sign:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
		; AVX1-NEXT: vpand %xmm0, %xmm1, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %eax		; AVX1-NEXT: vpmovmskb %xmm0, %eax
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0		; AVX1-NEXT: cmpw $-1, %ax
; AVX1-NEXT: vpmovmskb %xmm0, %ecx
; AVX1-NEXT: shll $16, %ecx
; AVX1-NEXT: orl %eax, %ecx
; AVX1-NEXT: cmpl $-1, %ecx
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allones_v32i8_sign:		; AVX2-LABEL: allones_v32i8_sign:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpmovmskb %ymm0, %eax		; AVX2-NEXT: vpmovmskb %ymm0, %eax
; AVX2-NEXT: cmpl $-1, %eax		; AVX2-NEXT: cmpl $-1, %eax
Show All 12 Lines	; AVX512-NEXT: retq
%tmp1 = bitcast <32 x i1> %tmp to i32		%tmp1 = bitcast <32 x i1> %tmp to i32
%tmp2 = icmp eq i32 %tmp1, -1		%tmp2 = icmp eq i32 %tmp1, -1
ret i1 %tmp2		ret i1 %tmp2
}		}

define i1 @allzeros_v32i8_sign(<32 x i8> %arg) {		define i1 @allzeros_v32i8_sign(<32 x i8> %arg) {
; SSE-LABEL: allzeros_v32i8_sign:		; SSE-LABEL: allzeros_v32i8_sign:
; SSE: # %bb.0:		; SSE: # %bb.0:
		; SSE-NEXT: por %xmm1, %xmm0
; SSE-NEXT: pmovmskb %xmm0, %eax		; SSE-NEXT: pmovmskb %xmm0, %eax
; SSE-NEXT: pmovmskb %xmm1, %ecx		; SSE-NEXT: testl %eax, %eax
; SSE-NEXT: shll $16, %ecx
; SSE-NEXT: orl %eax, %ecx
; SSE-NEXT: sete %al		; SSE-NEXT: sete %al
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: allzeros_v32i8_sign:		; AVX1-LABEL: allzeros_v32i8_sign:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
		; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %eax		; AVX1-NEXT: vpmovmskb %xmm0, %eax
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0		; AVX1-NEXT: testl %eax, %eax
; AVX1-NEXT: vpmovmskb %xmm0, %ecx
; AVX1-NEXT: shll $16, %ecx
; AVX1-NEXT: orl %eax, %ecx
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allzeros_v32i8_sign:		; AVX2-LABEL: allzeros_v32i8_sign:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpmovmskb %ymm0, %eax		; AVX2-NEXT: vpmovmskb %ymm0, %eax
; AVX2-NEXT: testl %eax, %eax		; AVX2-NEXT: testl %eax, %eax
Show All 12 Lines	; AVX512-NEXT: retq
%tmp1 = bitcast <32 x i1> %tmp to i32		%tmp1 = bitcast <32 x i1> %tmp to i32
%tmp2 = icmp eq i32 %tmp1, 0		%tmp2 = icmp eq i32 %tmp1, 0
ret i1 %tmp2		ret i1 %tmp2
}		}

define i1 @allones_v64i8_sign(<64 x i8> %arg) {		define i1 @allones_v64i8_sign(<64 x i8> %arg) {
; SSE-LABEL: allones_v64i8_sign:		; SSE-LABEL: allones_v64i8_sign:
; SSE: # %bb.0:		; SSE: # %bb.0:
		; SSE-NEXT: pand %xmm2, %xmm0
		; SSE-NEXT: pand %xmm1, %xmm0
		; SSE-NEXT: pand %xmm3, %xmm0
; SSE-NEXT: pmovmskb %xmm0, %eax		; SSE-NEXT: pmovmskb %xmm0, %eax
; SSE-NEXT: pmovmskb %xmm1, %ecx		; SSE-NEXT: cmpw $-1, %ax
; SSE-NEXT: shll $16, %ecx
; SSE-NEXT: orl %eax, %ecx
; SSE-NEXT: pmovmskb %xmm2, %eax
; SSE-NEXT: pmovmskb %xmm3, %edx
; SSE-NEXT: shll $16, %edx
; SSE-NEXT: orl %eax, %edx
; SSE-NEXT: shlq $32, %rdx
; SSE-NEXT: orq %rcx, %rdx
; SSE-NEXT: cmpq $-1, %rdx
; SSE-NEXT: sete %al		; SSE-NEXT: sete %al
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: allones_v64i8_sign:		; AVX1-LABEL: allones_v64i8_sign:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
		; AVX1-NEXT: vpand %xmm0, %xmm1, %xmm0
		; AVX1-NEXT: vpand %xmm0, %xmm2, %xmm0
		; AVX1-NEXT: vpand %xmm0, %xmm3, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %eax		; AVX1-NEXT: vpmovmskb %xmm0, %eax
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0		; AVX1-NEXT: cmpw $-1, %ax
; AVX1-NEXT: vpmovmskb %xmm0, %ecx
; AVX1-NEXT: shll $16, %ecx
; AVX1-NEXT: orl %eax, %ecx
; AVX1-NEXT: vpmovmskb %xmm1, %eax
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %edx
; AVX1-NEXT: shll $16, %edx
; AVX1-NEXT: orl %eax, %edx
; AVX1-NEXT: shlq $32, %rdx
; AVX1-NEXT: orq %rcx, %rdx
; AVX1-NEXT: cmpq $-1, %rdx
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allones_v64i8_sign:		; AVX2-LABEL: allones_v64i8_sign:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpmovmskb %ymm1, %eax		; AVX2-NEXT: vpand %ymm0, %ymm1, %ymm0
; AVX2-NEXT: shlq $32, %rax		; AVX2-NEXT: vpmovmskb %ymm0, %eax
; AVX2-NEXT: vpmovmskb %ymm0, %ecx		; AVX2-NEXT: cmpl $-1, %eax
; AVX2-NEXT: orq %rax, %rcx
; AVX2-NEXT: cmpq $-1, %rcx
; AVX2-NEXT: sete %al		; AVX2-NEXT: sete %al
; AVX2-NEXT: vzeroupper		; AVX2-NEXT: vzeroupper
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; KNL-LABEL: allones_v64i8_sign:		; KNL-LABEL: allones_v64i8_sign:
; KNL: # %bb.0:		; KNL: # %bb.0:
; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm1		; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm1
; KNL-NEXT: vpmovmskb %ymm1, %eax		; KNL-NEXT: vpand %ymm0, %ymm1, %ymm0
; KNL-NEXT: shlq $32, %rax		; KNL-NEXT: vpmovmskb %ymm0, %eax
; KNL-NEXT: vpmovmskb %ymm0, %ecx		; KNL-NEXT: cmpl $-1, %eax
; KNL-NEXT: orq %rax, %rcx
; KNL-NEXT: cmpq $-1, %rcx
; KNL-NEXT: sete %al		; KNL-NEXT: sete %al
; KNL-NEXT: vzeroupper		; KNL-NEXT: vzeroupper
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: allones_v64i8_sign:		; SKX-LABEL: allones_v64i8_sign:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpmovb2m %zmm0, %k0		; SKX-NEXT: vpmovb2m %zmm0, %k0
; SKX-NEXT: kortestq %k0, %k0		; SKX-NEXT: kortestq %k0, %k0
; SKX-NEXT: setb %al		; SKX-NEXT: setb %al
; SKX-NEXT: vzeroupper		; SKX-NEXT: vzeroupper
; SKX-NEXT: retq		; SKX-NEXT: retq
%tmp = icmp slt <64 x i8> %arg, zeroinitializer		%tmp = icmp slt <64 x i8> %arg, zeroinitializer
%tmp1 = bitcast <64 x i1> %tmp to i64		%tmp1 = bitcast <64 x i1> %tmp to i64
%tmp2 = icmp eq i64 %tmp1, -1		%tmp2 = icmp eq i64 %tmp1, -1
ret i1 %tmp2		ret i1 %tmp2
}		}

define i1 @allzeros_v64i8_sign(<64 x i8> %arg) {		define i1 @allzeros_v64i8_sign(<64 x i8> %arg) {
; SSE-LABEL: allzeros_v64i8_sign:		; SSE-LABEL: allzeros_v64i8_sign:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: pmovmskb %xmm0, %eax		; SSE-NEXT: por %xmm3, %xmm1
; SSE-NEXT: pmovmskb %xmm1, %ecx		; SSE-NEXT: por %xmm2, %xmm1
; SSE-NEXT: shll $16, %ecx		; SSE-NEXT: por %xmm0, %xmm1
; SSE-NEXT: orl %eax, %ecx		; SSE-NEXT: pmovmskb %xmm1, %eax
; SSE-NEXT: pmovmskb %xmm2, %eax		; SSE-NEXT: testl %eax, %eax
; SSE-NEXT: pmovmskb %xmm3, %edx
; SSE-NEXT: shll $16, %edx
; SSE-NEXT: orl %eax, %edx
; SSE-NEXT: shlq $32, %rdx
; SSE-NEXT: orq %rcx, %rdx
; SSE-NEXT: sete %al		; SSE-NEXT: sete %al
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: allzeros_v64i8_sign:		; AVX1-LABEL: allzeros_v64i8_sign:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
		; AVX1-NEXT: vpor %xmm2, %xmm3, %xmm2
		; AVX1-NEXT: vpor %xmm2, %xmm1, %xmm1
		; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %eax		; AVX1-NEXT: vpmovmskb %xmm0, %eax
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0		; AVX1-NEXT: testl %eax, %eax
; AVX1-NEXT: vpmovmskb %xmm0, %ecx
; AVX1-NEXT: shll $16, %ecx
; AVX1-NEXT: orl %eax, %ecx
; AVX1-NEXT: vpmovmskb %xmm1, %eax
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %edx
; AVX1-NEXT: shll $16, %edx
; AVX1-NEXT: orl %eax, %edx
; AVX1-NEXT: shlq $32, %rdx
; AVX1-NEXT: orq %rcx, %rdx
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allzeros_v64i8_sign:		; AVX2-LABEL: allzeros_v64i8_sign:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpmovmskb %ymm1, %eax		; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
; AVX2-NEXT: shlq $32, %rax		; AVX2-NEXT: vpmovmskb %ymm0, %eax
; AVX2-NEXT: vpmovmskb %ymm0, %ecx		; AVX2-NEXT: testl %eax, %eax
; AVX2-NEXT: orq %rax, %rcx
; AVX2-NEXT: sete %al		; AVX2-NEXT: sete %al
; AVX2-NEXT: vzeroupper		; AVX2-NEXT: vzeroupper
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; KNL-LABEL: allzeros_v64i8_sign:		; KNL-LABEL: allzeros_v64i8_sign:
; KNL: # %bb.0:		; KNL: # %bb.0:
; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm1		; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm1
; KNL-NEXT: vpmovmskb %ymm1, %eax		; KNL-NEXT: vpor %ymm1, %ymm0, %ymm0
; KNL-NEXT: shlq $32, %rax		; KNL-NEXT: vpmovmskb %ymm0, %eax
; KNL-NEXT: vpmovmskb %ymm0, %ecx		; KNL-NEXT: testl %eax, %eax
; KNL-NEXT: orq %rax, %rcx
; KNL-NEXT: sete %al		; KNL-NEXT: sete %al
; KNL-NEXT: vzeroupper		; KNL-NEXT: vzeroupper
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: allzeros_v64i8_sign:		; SKX-LABEL: allzeros_v64i8_sign:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpmovb2m %zmm0, %k0		; SKX-NEXT: vpmovb2m %zmm0, %k0
; SKX-NEXT: kortestq %k0, %k0		; SKX-NEXT: kortestq %k0, %k0
▲ Show 20 Lines • Show All 189 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq
%tmp2 = icmp eq i16 %tmp1, 0		%tmp2 = icmp eq i16 %tmp1, 0
ret i1 %tmp2		ret i1 %tmp2
}		}

define i1 @allones_v32i16_sign(<32 x i16> %arg) {		define i1 @allones_v32i16_sign(<32 x i16> %arg) {
; SSE-LABEL: allones_v32i16_sign:		; SSE-LABEL: allones_v32i16_sign:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: packsswb %xmm1, %xmm0		; SSE-NEXT: packsswb %xmm1, %xmm0
; SSE-NEXT: pmovmskb %xmm0, %eax
; SSE-NEXT: packsswb %xmm3, %xmm2		; SSE-NEXT: packsswb %xmm3, %xmm2
; SSE-NEXT: pmovmskb %xmm2, %ecx		; SSE-NEXT: pand %xmm0, %xmm2
; SSE-NEXT: shll $16, %ecx		; SSE-NEXT: pmovmskb %xmm2, %eax
; SSE-NEXT: orl %eax, %ecx		; SSE-NEXT: cmpw $-1, %ax
; SSE-NEXT: cmpl $-1, %ecx
; SSE-NEXT: sete %al		; SSE-NEXT: sete %al
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: allones_v32i16_sign:		; AVX1-LABEL: allones_v32i16_sign:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm0		; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm0
		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
		; AVX1-NEXT: vpacksswb %xmm2, %xmm1, %xmm1
		; AVX1-NEXT: vpand %xmm0, %xmm1, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %eax		; AVX1-NEXT: vpmovmskb %xmm0, %eax
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0		; AVX1-NEXT: cmpw $-1, %ax
; AVX1-NEXT: vpacksswb %xmm0, %xmm1, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %ecx
; AVX1-NEXT: shll $16, %ecx
; AVX1-NEXT: orl %eax, %ecx
; AVX1-NEXT: cmpl $-1, %ecx
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allones_v32i16_sign:		; AVX2-LABEL: allones_v32i16_sign:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpacksswb %ymm1, %ymm0, %ymm0		; AVX2-NEXT: vpacksswb %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vpmovmskb %ymm0, %eax		; AVX2-NEXT: vpmovmskb %ymm0, %eax
Show All 9 Lines
; KNL-NEXT: vpmovsxwd %ymm2, %zmm2		; KNL-NEXT: vpmovsxwd %ymm2, %zmm2
; KNL-NEXT: vptestmd %zmm2, %zmm2, %k0		; KNL-NEXT: vptestmd %zmm2, %zmm2, %k0
; KNL-NEXT: kmovw %k0, %eax		; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm0		; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm0
; KNL-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0		; KNL-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
; KNL-NEXT: vpmovsxwd %ymm0, %zmm0		; KNL-NEXT: vpmovsxwd %ymm0, %zmm0
; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0		; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0
; KNL-NEXT: kmovw %k0, %ecx		; KNL-NEXT: kmovw %k0, %ecx
; KNL-NEXT: shll $16, %ecx		; KNL-NEXT: andl %eax, %ecx
; KNL-NEXT: orl %eax, %ecx		; KNL-NEXT: cmpl $65535, %ecx # imm = 0xFFFF
; KNL-NEXT: cmpl $-1, %ecx
; KNL-NEXT: sete %al		; KNL-NEXT: sete %al
; KNL-NEXT: vzeroupper		; KNL-NEXT: vzeroupper
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: allones_v32i16_sign:		; SKX-LABEL: allones_v32i16_sign:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpmovw2m %zmm0, %k0		; SKX-NEXT: vpmovw2m %zmm0, %k0
; SKX-NEXT: kortestd %k0, %k0		; SKX-NEXT: kortestd %k0, %k0
; SKX-NEXT: setb %al		; SKX-NEXT: setb %al
; SKX-NEXT: vzeroupper		; SKX-NEXT: vzeroupper
; SKX-NEXT: retq		; SKX-NEXT: retq
%tmp = icmp slt <32 x i16> %arg, zeroinitializer		%tmp = icmp slt <32 x i16> %arg, zeroinitializer
%tmp1 = bitcast <32 x i1> %tmp to i32		%tmp1 = bitcast <32 x i1> %tmp to i32
%tmp2 = icmp eq i32 %tmp1, -1		%tmp2 = icmp eq i32 %tmp1, -1
ret i1 %tmp2		ret i1 %tmp2
}		}

define i1 @allzeros_v32i16_sign(<32 x i16> %arg) {		define i1 @allzeros_v32i16_sign(<32 x i16> %arg) {
; SSE-LABEL: allzeros_v32i16_sign:		; SSE-LABEL: allzeros_v32i16_sign:
; SSE: # %bb.0:		; SSE: # %bb.0:
		; SSE-NEXT: packsswb %xmm3, %xmm2
; SSE-NEXT: packsswb %xmm1, %xmm0		; SSE-NEXT: packsswb %xmm1, %xmm0
		; SSE-NEXT: por %xmm2, %xmm0
; SSE-NEXT: pmovmskb %xmm0, %eax		; SSE-NEXT: pmovmskb %xmm0, %eax
; SSE-NEXT: packsswb %xmm3, %xmm2		; SSE-NEXT: testl %eax, %eax
; SSE-NEXT: pmovmskb %xmm2, %ecx
; SSE-NEXT: shll $16, %ecx
; SSE-NEXT: orl %eax, %ecx
; SSE-NEXT: sete %al		; SSE-NEXT: sete %al
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: allzeros_v32i16_sign:		; AVX1-LABEL: allzeros_v32i16_sign:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
		; AVX1-NEXT: vpacksswb %xmm2, %xmm1, %xmm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm0		; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm0
		; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %eax		; AVX1-NEXT: vpmovmskb %xmm0, %eax
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0		; AVX1-NEXT: testl %eax, %eax
; AVX1-NEXT: vpacksswb %xmm0, %xmm1, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %ecx
; AVX1-NEXT: shll $16, %ecx
; AVX1-NEXT: orl %eax, %ecx
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allzeros_v32i16_sign:		; AVX2-LABEL: allzeros_v32i16_sign:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpacksswb %ymm1, %ymm0, %ymm0		; AVX2-NEXT: vpacksswb %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vpmovmskb %ymm0, %eax		; AVX2-NEXT: vpmovmskb %ymm0, %eax
; AVX2-NEXT: testl %eax, %eax		; AVX2-NEXT: testl %eax, %eax
; AVX2-NEXT: sete %al		; AVX2-NEXT: sete %al
; AVX2-NEXT: vzeroupper		; AVX2-NEXT: vzeroupper
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; KNL-LABEL: allzeros_v32i16_sign:		; KNL-LABEL: allzeros_v32i16_sign:
; KNL: # %bb.0:		; KNL: # %bb.0:
; KNL-NEXT: vpxor %xmm1, %xmm1, %xmm1		; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm1
; KNL-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm2		; KNL-NEXT: vpxor %xmm2, %xmm2, %xmm2
; KNL-NEXT: vpmovsxwd %ymm2, %zmm2		; KNL-NEXT: vpcmpgtw %ymm1, %ymm2, %ymm1
; KNL-NEXT: vptestmd %zmm2, %zmm2, %k0		; KNL-NEXT: vpcmpgtw %ymm0, %ymm2, %ymm0
; KNL-NEXT: kmovw %k0, %eax		; KNL-NEXT: vpor %ymm1, %ymm0, %ymm0
; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm0
; KNL-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
; KNL-NEXT: vpmovsxwd %ymm0, %zmm0		; KNL-NEXT: vpmovsxwd %ymm0, %zmm0
; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0		; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0
; KNL-NEXT: kmovw %k0, %ecx		; KNL-NEXT: kortestw %k0, %k0
; KNL-NEXT: shll $16, %ecx
; KNL-NEXT: orl %eax, %ecx
; KNL-NEXT: sete %al		; KNL-NEXT: sete %al
; KNL-NEXT: vzeroupper		; KNL-NEXT: vzeroupper
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: allzeros_v32i16_sign:		; SKX-LABEL: allzeros_v32i16_sign:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpmovw2m %zmm0, %k0		; SKX-NEXT: vpmovw2m %zmm0, %k0
; SKX-NEXT: kortestd %k0, %k0		; SKX-NEXT: kortestd %k0, %k0
▲ Show 20 Lines • Show All 684 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq
%tmp3 = icmp eq i16 %tmp2, 0		%tmp3 = icmp eq i16 %tmp2, 0
ret i1 %tmp3		ret i1 %tmp3
}		}

define i1 @allones_v32i8_and1(<32 x i8> %arg) {		define i1 @allones_v32i8_and1(<32 x i8> %arg) {
; SSE-LABEL: allones_v32i8_and1:		; SSE-LABEL: allones_v32i8_and1:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: psllw $7, %xmm0		; SSE-NEXT: psllw $7, %xmm0
; SSE-NEXT: pmovmskb %xmm0, %eax
; SSE-NEXT: psllw $7, %xmm1		; SSE-NEXT: psllw $7, %xmm1
; SSE-NEXT: pmovmskb %xmm1, %ecx		; SSE-NEXT: pand %xmm0, %xmm1
; SSE-NEXT: shll $16, %ecx		; SSE-NEXT: pmovmskb %xmm1, %eax
; SSE-NEXT: orl %eax, %ecx		; SSE-NEXT: cmpw $-1, %ax
; SSE-NEXT: cmpl $-1, %ecx
; SSE-NEXT: sete %al		; SSE-NEXT: sete %al
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: allones_v32i8_and1:		; AVX1-LABEL: allones_v32i8_and1:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vpsllw $7, %xmm0, %xmm1		; AVX1-NEXT: vpsllw $7, %xmm0, %xmm1
; AVX1-NEXT: vpmovmskb %xmm1, %eax
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX1-NEXT: vpsllw $7, %xmm0, %xmm0		; AVX1-NEXT: vpsllw $7, %xmm0, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %ecx		; AVX1-NEXT: vpand %xmm1, %xmm0, %xmm0
; AVX1-NEXT: shll $16, %ecx		; AVX1-NEXT: vpmovmskb %xmm0, %eax
; AVX1-NEXT: orl %eax, %ecx		; AVX1-NEXT: cmpw $-1, %ax
; AVX1-NEXT: cmpl $-1, %ecx
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allones_v32i8_and1:		; AVX2-LABEL: allones_v32i8_and1:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpsllw $7, %ymm0, %ymm0		; AVX2-NEXT: vpsllw $7, %ymm0, %ymm0
; AVX2-NEXT: vpmovmskb %ymm0, %eax		; AVX2-NEXT: vpmovmskb %ymm0, %eax
Show All 23 Lines	; SKX-NEXT: retq
%tmp2 = bitcast <32 x i1> %tmp1 to i32		%tmp2 = bitcast <32 x i1> %tmp1 to i32
%tmp3 = icmp eq i32 %tmp2, -1		%tmp3 = icmp eq i32 %tmp2, -1
ret i1 %tmp3		ret i1 %tmp3
}		}

define i1 @allzeros_v32i8_and1(<32 x i8> %arg) {		define i1 @allzeros_v32i8_and1(<32 x i8> %arg) {
; SSE-LABEL: allzeros_v32i8_and1:		; SSE-LABEL: allzeros_v32i8_and1:
; SSE: # %bb.0:		; SSE: # %bb.0:
		; SSE-NEXT: por %xmm1, %xmm0
; SSE-NEXT: psllw $7, %xmm0		; SSE-NEXT: psllw $7, %xmm0
; SSE-NEXT: pmovmskb %xmm0, %eax		; SSE-NEXT: pmovmskb %xmm0, %eax
; SSE-NEXT: psllw $7, %xmm1		; SSE-NEXT: testl %eax, %eax
; SSE-NEXT: pmovmskb %xmm1, %ecx
; SSE-NEXT: shll $16, %ecx
; SSE-NEXT: orl %eax, %ecx
; SSE-NEXT: sete %al		; SSE-NEXT: sete %al
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: allzeros_v32i8_and1:		; AVX1-LABEL: allzeros_v32i8_and1:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vpsllw $7, %xmm0, %xmm1		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
; AVX1-NEXT: vpmovmskb %xmm1, %eax		; AVX1-NEXT: vpsllw $7, %xmm1, %xmm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX1-NEXT: vpsllw $7, %xmm0, %xmm0		; AVX1-NEXT: vpsllw $7, %xmm0, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %ecx		; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
; AVX1-NEXT: shll $16, %ecx		; AVX1-NEXT: vpmovmskb %xmm0, %eax
; AVX1-NEXT: orl %eax, %ecx		; AVX1-NEXT: testl %eax, %eax
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allzeros_v32i8_and1:		; AVX2-LABEL: allzeros_v32i8_and1:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpsllw $7, %ymm0, %ymm0		; AVX2-NEXT: vpsllw $7, %ymm0, %ymm0
; AVX2-NEXT: vpmovmskb %ymm0, %eax		; AVX2-NEXT: vpmovmskb %ymm0, %eax
Show All 23 Lines	; SKX-NEXT: retq
%tmp2 = bitcast <32 x i1> %tmp1 to i32		%tmp2 = bitcast <32 x i1> %tmp1 to i32
%tmp3 = icmp eq i32 %tmp2, 0		%tmp3 = icmp eq i32 %tmp2, 0
ret i1 %tmp3		ret i1 %tmp3
}		}

define i1 @allones_v64i8_and1(<64 x i8> %arg) {		define i1 @allones_v64i8_and1(<64 x i8> %arg) {
; SSE-LABEL: allones_v64i8_and1:		; SSE-LABEL: allones_v64i8_and1:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: psllw $7, %xmm0
; SSE-NEXT: pmovmskb %xmm0, %eax
; SSE-NEXT: psllw $7, %xmm1		; SSE-NEXT: psllw $7, %xmm1
; SSE-NEXT: pmovmskb %xmm1, %ecx		; SSE-NEXT: psllw $7, %xmm3
; SSE-NEXT: shll $16, %ecx		; SSE-NEXT: psllw $7, %xmm0
; SSE-NEXT: orl %eax, %ecx
; SSE-NEXT: psllw $7, %xmm2		; SSE-NEXT: psllw $7, %xmm2
		; SSE-NEXT: pand %xmm0, %xmm2
		; SSE-NEXT: pand %xmm1, %xmm2
		; SSE-NEXT: pand %xmm3, %xmm2
; SSE-NEXT: pmovmskb %xmm2, %eax		; SSE-NEXT: pmovmskb %xmm2, %eax
; SSE-NEXT: psllw $7, %xmm3		; SSE-NEXT: cmpw $-1, %ax
; SSE-NEXT: pmovmskb %xmm3, %edx
; SSE-NEXT: shll $16, %edx
; SSE-NEXT: orl %eax, %edx
; SSE-NEXT: shlq $32, %rdx
; SSE-NEXT: orq %rcx, %rdx
; SSE-NEXT: cmpq $-1, %rdx
; SSE-NEXT: sete %al		; SSE-NEXT: sete %al
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: allones_v64i8_and1:		; AVX1-LABEL: allones_v64i8_and1:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vpsllw $7, %xmm0, %xmm2		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vpmovmskb %xmm2, %eax		; AVX1-NEXT: vpsllw $7, %xmm2, %xmm2
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
		; AVX1-NEXT: vpsllw $7, %xmm3, %xmm3
; AVX1-NEXT: vpsllw $7, %xmm0, %xmm0		; AVX1-NEXT: vpsllw $7, %xmm0, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %ecx		; AVX1-NEXT: vpsllw $7, %xmm1, %xmm1
; AVX1-NEXT: shll $16, %ecx		; AVX1-NEXT: vpand %xmm0, %xmm1, %xmm0
; AVX1-NEXT: orl %eax, %ecx		; AVX1-NEXT: vpand %xmm0, %xmm2, %xmm0
; AVX1-NEXT: vpsllw $7, %xmm1, %xmm0		; AVX1-NEXT: vpand %xmm0, %xmm3, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %eax		; AVX1-NEXT: vpmovmskb %xmm0, %eax
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0		; AVX1-NEXT: cmpw $-1, %ax
; AVX1-NEXT: vpsllw $7, %xmm0, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %edx
; AVX1-NEXT: shll $16, %edx
; AVX1-NEXT: orl %eax, %edx
; AVX1-NEXT: shlq $32, %rdx
; AVX1-NEXT: orq %rcx, %rdx
; AVX1-NEXT: cmpq $-1, %rdx
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allones_v64i8_and1:		; AVX2-LABEL: allones_v64i8_and1:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpsllw $7, %ymm1, %ymm1
; AVX2-NEXT: vpmovmskb %ymm1, %eax
; AVX2-NEXT: shlq $32, %rax
; AVX2-NEXT: vpsllw $7, %ymm0, %ymm0		; AVX2-NEXT: vpsllw $7, %ymm0, %ymm0
; AVX2-NEXT: vpmovmskb %ymm0, %ecx		; AVX2-NEXT: vpsllw $7, %ymm1, %ymm1
; AVX2-NEXT: orq %rax, %rcx		; AVX2-NEXT: vpand %ymm0, %ymm1, %ymm0
; AVX2-NEXT: cmpq $-1, %rcx		; AVX2-NEXT: vpmovmskb %ymm0, %eax
		; AVX2-NEXT: cmpl $-1, %eax
; AVX2-NEXT: sete %al		; AVX2-NEXT: sete %al
; AVX2-NEXT: vzeroupper		; AVX2-NEXT: vzeroupper
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; KNL-LABEL: allones_v64i8_and1:		; KNL-LABEL: allones_v64i8_and1:
; KNL: # %bb.0:		; KNL: # %bb.0:
; KNL-NEXT: vpsllw $7, %ymm0, %ymm1		; KNL-NEXT: vpsllw $7, %ymm0, %ymm1
; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm0		; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm0
; KNL-NEXT: vpsllw $7, %ymm0, %ymm0		; KNL-NEXT: vpsllw $7, %ymm0, %ymm0
		; KNL-NEXT: vpand %ymm1, %ymm0, %ymm0
; KNL-NEXT: vpmovmskb %ymm0, %eax		; KNL-NEXT: vpmovmskb %ymm0, %eax
; KNL-NEXT: shlq $32, %rax		; KNL-NEXT: cmpl $-1, %eax
; KNL-NEXT: vpmovmskb %ymm1, %ecx
; KNL-NEXT: orq %rax, %rcx
; KNL-NEXT: cmpq $-1, %rcx
; KNL-NEXT: sete %al		; KNL-NEXT: sete %al
; KNL-NEXT: vzeroupper		; KNL-NEXT: vzeroupper
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: allones_v64i8_and1:		; SKX-LABEL: allones_v64i8_and1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmb {{.*}}(%rip), %zmm0, %k0		; SKX-NEXT: vptestmb {{.*}}(%rip), %zmm0, %k0
; SKX-NEXT: kortestq %k0, %k0		; SKX-NEXT: kortestq %k0, %k0
; SKX-NEXT: setb %al		; SKX-NEXT: setb %al
; SKX-NEXT: vzeroupper		; SKX-NEXT: vzeroupper
; SKX-NEXT: retq		; SKX-NEXT: retq
%tmp = and <64 x i8> %arg, <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>		%tmp = and <64 x i8> %arg, <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>
%tmp1 = icmp ne <64 x i8> %tmp, zeroinitializer		%tmp1 = icmp ne <64 x i8> %tmp, zeroinitializer
%tmp2 = bitcast <64 x i1> %tmp1 to i64		%tmp2 = bitcast <64 x i1> %tmp1 to i64
%tmp3 = icmp eq i64 %tmp2, -1		%tmp3 = icmp eq i64 %tmp2, -1
ret i1 %tmp3		ret i1 %tmp3
}		}

define i1 @allzeros_v64i8_and1(<64 x i8> %arg) {		define i1 @allzeros_v64i8_and1(<64 x i8> %arg) {
; SSE-LABEL: allzeros_v64i8_and1:		; SSE-LABEL: allzeros_v64i8_and1:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: psllw $7, %xmm0		; SSE-NEXT: por %xmm3, %xmm1
; SSE-NEXT: pmovmskb %xmm0, %eax		; SSE-NEXT: por %xmm2, %xmm1
		; SSE-NEXT: por %xmm0, %xmm1
; SSE-NEXT: psllw $7, %xmm1		; SSE-NEXT: psllw $7, %xmm1
; SSE-NEXT: pmovmskb %xmm1, %ecx		; SSE-NEXT: pmovmskb %xmm1, %eax
; SSE-NEXT: shll $16, %ecx		; SSE-NEXT: testl %eax, %eax
; SSE-NEXT: orl %eax, %ecx
; SSE-NEXT: psllw $7, %xmm2
; SSE-NEXT: pmovmskb %xmm2, %eax
; SSE-NEXT: psllw $7, %xmm3
; SSE-NEXT: pmovmskb %xmm3, %edx
; SSE-NEXT: shll $16, %edx
; SSE-NEXT: orl %eax, %edx
; SSE-NEXT: shlq $32, %rdx
; SSE-NEXT: orq %rcx, %rdx
; SSE-NEXT: sete %al		; SSE-NEXT: sete %al
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: allzeros_v64i8_and1:		; AVX1-LABEL: allzeros_v64i8_and1:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vpsllw $7, %xmm0, %xmm2		; AVX1-NEXT: vpsllw $7, %xmm1, %xmm2
; AVX1-NEXT: vpmovmskb %xmm2, %eax		; AVX1-NEXT: vpsllw $7, %xmm0, %xmm3
		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm1
		; AVX1-NEXT: vpsllw $7, %xmm1, %xmm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX1-NEXT: vpsllw $7, %xmm0, %xmm0		; AVX1-NEXT: vpsllw $7, %xmm0, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %ecx		; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
; AVX1-NEXT: shll $16, %ecx		; AVX1-NEXT: vpor %xmm0, %xmm2, %xmm0
; AVX1-NEXT: orl %eax, %ecx		; AVX1-NEXT: vpor %xmm0, %xmm3, %xmm0
; AVX1-NEXT: vpsllw $7, %xmm1, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %eax		; AVX1-NEXT: vpmovmskb %xmm0, %eax
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0		; AVX1-NEXT: testl %eax, %eax
; AVX1-NEXT: vpsllw $7, %xmm0, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %edx
; AVX1-NEXT: shll $16, %edx
; AVX1-NEXT: orl %eax, %edx
; AVX1-NEXT: shlq $32, %rdx
; AVX1-NEXT: orq %rcx, %rdx
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allzeros_v64i8_and1:		; AVX2-LABEL: allzeros_v64i8_and1:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpsllw $7, %ymm1, %ymm1		; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vpmovmskb %ymm1, %eax
; AVX2-NEXT: shlq $32, %rax
; AVX2-NEXT: vpsllw $7, %ymm0, %ymm0		; AVX2-NEXT: vpsllw $7, %ymm0, %ymm0
; AVX2-NEXT: vpmovmskb %ymm0, %ecx		; AVX2-NEXT: vpmovmskb %ymm0, %eax
; AVX2-NEXT: orq %rax, %rcx		; AVX2-NEXT: testl %eax, %eax
; AVX2-NEXT: sete %al		; AVX2-NEXT: sete %al
; AVX2-NEXT: vzeroupper		; AVX2-NEXT: vzeroupper
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; KNL-LABEL: allzeros_v64i8_and1:		; KNL-LABEL: allzeros_v64i8_and1:
; KNL: # %bb.0:		; KNL: # %bb.0:
; KNL-NEXT: vpsllw $7, %ymm0, %ymm1		; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm1
; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm0		; KNL-NEXT: vpsllw $7, %ymm1, %ymm1
; KNL-NEXT: vpsllw $7, %ymm0, %ymm0		; KNL-NEXT: vpsllw $7, %ymm0, %ymm0
		; KNL-NEXT: vpor %ymm1, %ymm0, %ymm0
; KNL-NEXT: vpmovmskb %ymm0, %eax		; KNL-NEXT: vpmovmskb %ymm0, %eax
; KNL-NEXT: shlq $32, %rax		; KNL-NEXT: testl %eax, %eax
; KNL-NEXT: vpmovmskb %ymm1, %ecx
; KNL-NEXT: orq %rax, %rcx
; KNL-NEXT: sete %al		; KNL-NEXT: sete %al
; KNL-NEXT: vzeroupper		; KNL-NEXT: vzeroupper
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: allzeros_v64i8_and1:		; SKX-LABEL: allzeros_v64i8_and1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmb {{.*}}(%rip), %zmm0, %k0		; SKX-NEXT: vptestmb {{.*}}(%rip), %zmm0, %k0
; SKX-NEXT: kortestq %k0, %k0		; SKX-NEXT: kortestq %k0, %k0
▲ Show 20 Lines • Show All 153 Lines • ▼ Show 20 Lines
}		}

define i1 @allones_v32i16_and1(<32 x i16> %arg) {		define i1 @allones_v32i16_and1(<32 x i16> %arg) {
; SSE-LABEL: allones_v32i16_and1:		; SSE-LABEL: allones_v32i16_and1:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: psllw $15, %xmm1		; SSE-NEXT: psllw $15, %xmm1
; SSE-NEXT: psllw $15, %xmm0		; SSE-NEXT: psllw $15, %xmm0
; SSE-NEXT: packsswb %xmm1, %xmm0		; SSE-NEXT: packsswb %xmm1, %xmm0
; SSE-NEXT: pmovmskb %xmm0, %eax
; SSE-NEXT: psllw $15, %xmm3		; SSE-NEXT: psllw $15, %xmm3
; SSE-NEXT: psllw $15, %xmm2		; SSE-NEXT: psllw $15, %xmm2
; SSE-NEXT: packsswb %xmm3, %xmm2		; SSE-NEXT: packsswb %xmm3, %xmm2
; SSE-NEXT: pmovmskb %xmm2, %ecx		; SSE-NEXT: pand %xmm0, %xmm2
; SSE-NEXT: shll $16, %ecx		; SSE-NEXT: pmovmskb %xmm2, %eax
; SSE-NEXT: orl %eax, %ecx		; SSE-NEXT: cmpw $-1, %ax
; SSE-NEXT: cmpl $-1, %ecx
; SSE-NEXT: sete %al		; SSE-NEXT: sete %al
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: allones_v32i16_and1:		; AVX1-LABEL: allones_v32i16_and1:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vpsllw $15, %xmm2, %xmm2		; AVX1-NEXT: vpsllw $15, %xmm2, %xmm2
; AVX1-NEXT: vpsllw $15, %xmm0, %xmm0		; AVX1-NEXT: vpsllw $15, %xmm0, %xmm0
; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm0		; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %eax		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0		; AVX1-NEXT: vpsllw $15, %xmm2, %xmm2
; AVX1-NEXT: vpsllw $15, %xmm0, %xmm0
; AVX1-NEXT: vpsllw $15, %xmm1, %xmm1		; AVX1-NEXT: vpsllw $15, %xmm1, %xmm1
; AVX1-NEXT: vpacksswb %xmm0, %xmm1, %xmm0		; AVX1-NEXT: vpacksswb %xmm2, %xmm1, %xmm1
; AVX1-NEXT: vpmovmskb %xmm0, %ecx		; AVX1-NEXT: vpand %xmm0, %xmm1, %xmm0
; AVX1-NEXT: shll $16, %ecx		; AVX1-NEXT: vpmovmskb %xmm0, %eax
; AVX1-NEXT: orl %eax, %ecx		; AVX1-NEXT: cmpw $-1, %ax
; AVX1-NEXT: cmpl $-1, %ecx
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allones_v32i16_and1:		; AVX2-LABEL: allones_v32i16_and1:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpsllw $15, %ymm1, %ymm1		; AVX2-NEXT: vpsllw $15, %ymm1, %ymm1
; AVX2-NEXT: vpsllw $15, %ymm0, %ymm0		; AVX2-NEXT: vpsllw $15, %ymm0, %ymm0
Show All 12 Lines
; KNL-NEXT: vptestmd %zmm1, %zmm1, %k0		; KNL-NEXT: vptestmd %zmm1, %zmm1, %k0
; KNL-NEXT: kmovw %k0, %eax		; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm0		; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm0
; KNL-NEXT: vpsllw $15, %ymm0, %ymm0		; KNL-NEXT: vpsllw $15, %ymm0, %ymm0
; KNL-NEXT: vpsraw $15, %ymm0, %ymm0		; KNL-NEXT: vpsraw $15, %ymm0, %ymm0
; KNL-NEXT: vpmovsxwd %ymm0, %zmm0		; KNL-NEXT: vpmovsxwd %ymm0, %zmm0
; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0		; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0
; KNL-NEXT: kmovw %k0, %ecx		; KNL-NEXT: kmovw %k0, %ecx
; KNL-NEXT: shll $16, %ecx		; KNL-NEXT: andl %eax, %ecx
; KNL-NEXT: orl %eax, %ecx		; KNL-NEXT: cmpl $65535, %ecx # imm = 0xFFFF
; KNL-NEXT: cmpl $-1, %ecx
; KNL-NEXT: sete %al		; KNL-NEXT: sete %al
; KNL-NEXT: vzeroupper		; KNL-NEXT: vzeroupper
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: allones_v32i16_and1:		; SKX-LABEL: allones_v32i16_and1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmw {{.*}}(%rip), %zmm0, %k0		; SKX-NEXT: vptestmw {{.*}}(%rip), %zmm0, %k0
; SKX-NEXT: kortestd %k0, %k0		; SKX-NEXT: kortestd %k0, %k0
; SKX-NEXT: setb %al		; SKX-NEXT: setb %al
; SKX-NEXT: vzeroupper		; SKX-NEXT: vzeroupper
; SKX-NEXT: retq		; SKX-NEXT: retq
%tmp = and <32 x i16> %arg, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>		%tmp = and <32 x i16> %arg, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>
%tmp1 = icmp ne <32 x i16> %tmp, zeroinitializer		%tmp1 = icmp ne <32 x i16> %tmp, zeroinitializer
%tmp2 = bitcast <32 x i1> %tmp1 to i32		%tmp2 = bitcast <32 x i1> %tmp1 to i32
%tmp3 = icmp eq i32 %tmp2, -1		%tmp3 = icmp eq i32 %tmp2, -1
ret i1 %tmp3		ret i1 %tmp3
}		}

define i1 @allzeros_v32i16_and1(<32 x i16> %arg) {		define i1 @allzeros_v32i16_and1(<32 x i16> %arg) {
; SSE-LABEL: allzeros_v32i16_and1:		; SSE-LABEL: allzeros_v32i16_and1:
; SSE: # %bb.0:		; SSE: # %bb.0:
		; SSE-NEXT: psllw $15, %xmm3
		; SSE-NEXT: psllw $15, %xmm2
		; SSE-NEXT: packsswb %xmm3, %xmm2
; SSE-NEXT: psllw $15, %xmm1		; SSE-NEXT: psllw $15, %xmm1
; SSE-NEXT: psllw $15, %xmm0		; SSE-NEXT: psllw $15, %xmm0
; SSE-NEXT: packsswb %xmm1, %xmm0		; SSE-NEXT: packsswb %xmm1, %xmm0
		; SSE-NEXT: por %xmm2, %xmm0
; SSE-NEXT: pmovmskb %xmm0, %eax		; SSE-NEXT: pmovmskb %xmm0, %eax
; SSE-NEXT: psllw $15, %xmm3		; SSE-NEXT: testl %eax, %eax
; SSE-NEXT: psllw $15, %xmm2
; SSE-NEXT: packsswb %xmm3, %xmm2
; SSE-NEXT: pmovmskb %xmm2, %ecx
; SSE-NEXT: shll $16, %ecx
; SSE-NEXT: orl %eax, %ecx
; SSE-NEXT: sete %al		; SSE-NEXT: sete %al
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: allzeros_v32i16_and1:		; AVX1-LABEL: allzeros_v32i16_and1:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
		; AVX1-NEXT: vpsllw $15, %xmm2, %xmm2
		; AVX1-NEXT: vpsllw $15, %xmm1, %xmm1
		; AVX1-NEXT: vpacksswb %xmm2, %xmm1, %xmm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vpsllw $15, %xmm2, %xmm2		; AVX1-NEXT: vpsllw $15, %xmm2, %xmm2
; AVX1-NEXT: vpsllw $15, %xmm0, %xmm0		; AVX1-NEXT: vpsllw $15, %xmm0, %xmm0
; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm0		; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm0
		; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %eax		; AVX1-NEXT: vpmovmskb %xmm0, %eax
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0		; AVX1-NEXT: testl %eax, %eax
; AVX1-NEXT: vpsllw $15, %xmm0, %xmm0
; AVX1-NEXT: vpsllw $15, %xmm1, %xmm1
; AVX1-NEXT: vpacksswb %xmm0, %xmm1, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %ecx
; AVX1-NEXT: shll $16, %ecx
; AVX1-NEXT: orl %eax, %ecx
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allzeros_v32i16_and1:		; AVX2-LABEL: allzeros_v32i16_and1:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpsllw $15, %ymm1, %ymm1		; AVX2-NEXT: vpsllw $15, %ymm1, %ymm1
; AVX2-NEXT: vpsllw $15, %ymm0, %ymm0		; AVX2-NEXT: vpsllw $15, %ymm0, %ymm0
; AVX2-NEXT: vpacksswb %ymm1, %ymm0, %ymm0		; AVX2-NEXT: vpacksswb %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vpmovmskb %ymm0, %eax		; AVX2-NEXT: vpmovmskb %ymm0, %eax
; AVX2-NEXT: testl %eax, %eax		; AVX2-NEXT: testl %eax, %eax
; AVX2-NEXT: sete %al		; AVX2-NEXT: sete %al
; AVX2-NEXT: vzeroupper		; AVX2-NEXT: vzeroupper
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; KNL-LABEL: allzeros_v32i16_and1:		; KNL-LABEL: allzeros_v32i16_and1:
; KNL: # %bb.0:		; KNL: # %bb.0:
; KNL-NEXT: vpsllw $15, %ymm0, %ymm1		; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm1
		; KNL-NEXT: vpsllw $15, %ymm1, %ymm1
; KNL-NEXT: vpsraw $15, %ymm1, %ymm1		; KNL-NEXT: vpsraw $15, %ymm1, %ymm1
; KNL-NEXT: vpmovsxwd %ymm1, %zmm1
; KNL-NEXT: vptestmd %zmm1, %zmm1, %k0
; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm0
; KNL-NEXT: vpsllw $15, %ymm0, %ymm0		; KNL-NEXT: vpsllw $15, %ymm0, %ymm0
; KNL-NEXT: vpsraw $15, %ymm0, %ymm0		; KNL-NEXT: vpsraw $15, %ymm0, %ymm0
		; KNL-NEXT: vpor %ymm1, %ymm0, %ymm0
; KNL-NEXT: vpmovsxwd %ymm0, %zmm0		; KNL-NEXT: vpmovsxwd %ymm0, %zmm0
; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0		; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0
; KNL-NEXT: kmovw %k0, %ecx		; KNL-NEXT: kortestw %k0, %k0
; KNL-NEXT: shll $16, %ecx
; KNL-NEXT: orl %eax, %ecx
; KNL-NEXT: sete %al		; KNL-NEXT: sete %al
; KNL-NEXT: vzeroupper		; KNL-NEXT: vzeroupper
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: allzeros_v32i16_and1:		; SKX-LABEL: allzeros_v32i16_and1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmw {{.*}}(%rip), %zmm0, %k0		; SKX-NEXT: vptestmw {{.*}}(%rip), %zmm0, %k0
; SKX-NEXT: kortestd %k0, %k0		; SKX-NEXT: kortestd %k0, %k0
▲ Show 20 Lines • Show All 791 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq
%tmp3 = icmp eq i16 %tmp2, 0		%tmp3 = icmp eq i16 %tmp2, 0
ret i1 %tmp3		ret i1 %tmp3
}		}

define i1 @allones_v32i8_and4(<32 x i8> %arg) {		define i1 @allones_v32i8_and4(<32 x i8> %arg) {
; SSE-LABEL: allones_v32i8_and4:		; SSE-LABEL: allones_v32i8_and4:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: psllw $5, %xmm0		; SSE-NEXT: psllw $5, %xmm0
; SSE-NEXT: pmovmskb %xmm0, %eax
; SSE-NEXT: psllw $5, %xmm1		; SSE-NEXT: psllw $5, %xmm1
; SSE-NEXT: pmovmskb %xmm1, %ecx		; SSE-NEXT: pand %xmm0, %xmm1
; SSE-NEXT: shll $16, %ecx		; SSE-NEXT: pmovmskb %xmm1, %eax
; SSE-NEXT: orl %eax, %ecx		; SSE-NEXT: cmpw $-1, %ax
; SSE-NEXT: cmpl $-1, %ecx
; SSE-NEXT: sete %al		; SSE-NEXT: sete %al
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: allones_v32i8_and4:		; AVX1-LABEL: allones_v32i8_and4:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vpsllw $5, %xmm0, %xmm1		; AVX1-NEXT: vpsllw $5, %xmm0, %xmm1
; AVX1-NEXT: vpmovmskb %xmm1, %eax
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX1-NEXT: vpsllw $5, %xmm0, %xmm0		; AVX1-NEXT: vpsllw $5, %xmm0, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %ecx		; AVX1-NEXT: vpand %xmm1, %xmm0, %xmm0
; AVX1-NEXT: shll $16, %ecx		; AVX1-NEXT: vpmovmskb %xmm0, %eax
; AVX1-NEXT: orl %eax, %ecx		; AVX1-NEXT: cmpw $-1, %ax
; AVX1-NEXT: cmpl $-1, %ecx
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allones_v32i8_and4:		; AVX2-LABEL: allones_v32i8_and4:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpsllw $5, %ymm0, %ymm0		; AVX2-NEXT: vpsllw $5, %ymm0, %ymm0
; AVX2-NEXT: vpmovmskb %ymm0, %eax		; AVX2-NEXT: vpmovmskb %ymm0, %eax
Show All 23 Lines	; SKX-NEXT: retq
%tmp2 = bitcast <32 x i1> %tmp1 to i32		%tmp2 = bitcast <32 x i1> %tmp1 to i32
%tmp3 = icmp eq i32 %tmp2, -1		%tmp3 = icmp eq i32 %tmp2, -1
ret i1 %tmp3		ret i1 %tmp3
}		}

define i1 @allzeros_v32i8_and4(<32 x i8> %arg) {		define i1 @allzeros_v32i8_and4(<32 x i8> %arg) {
; SSE-LABEL: allzeros_v32i8_and4:		; SSE-LABEL: allzeros_v32i8_and4:
; SSE: # %bb.0:		; SSE: # %bb.0:
		; SSE-NEXT: por %xmm1, %xmm0
; SSE-NEXT: psllw $5, %xmm0		; SSE-NEXT: psllw $5, %xmm0
; SSE-NEXT: pmovmskb %xmm0, %eax		; SSE-NEXT: pmovmskb %xmm0, %eax
; SSE-NEXT: psllw $5, %xmm1		; SSE-NEXT: testl %eax, %eax
; SSE-NEXT: pmovmskb %xmm1, %ecx
; SSE-NEXT: shll $16, %ecx
; SSE-NEXT: orl %eax, %ecx
; SSE-NEXT: sete %al		; SSE-NEXT: sete %al
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: allzeros_v32i8_and4:		; AVX1-LABEL: allzeros_v32i8_and4:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vpsllw $5, %xmm0, %xmm1		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
; AVX1-NEXT: vpmovmskb %xmm1, %eax		; AVX1-NEXT: vpsllw $5, %xmm1, %xmm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX1-NEXT: vpsllw $5, %xmm0, %xmm0		; AVX1-NEXT: vpsllw $5, %xmm0, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %ecx		; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
; AVX1-NEXT: shll $16, %ecx		; AVX1-NEXT: vpmovmskb %xmm0, %eax
; AVX1-NEXT: orl %eax, %ecx		; AVX1-NEXT: testl %eax, %eax
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allzeros_v32i8_and4:		; AVX2-LABEL: allzeros_v32i8_and4:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpsllw $5, %ymm0, %ymm0		; AVX2-NEXT: vpsllw $5, %ymm0, %ymm0
; AVX2-NEXT: vpmovmskb %ymm0, %eax		; AVX2-NEXT: vpmovmskb %ymm0, %eax
Show All 23 Lines	; SKX-NEXT: retq
%tmp2 = bitcast <32 x i1> %tmp1 to i32		%tmp2 = bitcast <32 x i1> %tmp1 to i32
%tmp3 = icmp eq i32 %tmp2, 0		%tmp3 = icmp eq i32 %tmp2, 0
ret i1 %tmp3		ret i1 %tmp3
}		}

define i1 @allones_v64i8_and4(<64 x i8> %arg) {		define i1 @allones_v64i8_and4(<64 x i8> %arg) {
; SSE-LABEL: allones_v64i8_and4:		; SSE-LABEL: allones_v64i8_and4:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: psllw $5, %xmm0
; SSE-NEXT: pmovmskb %xmm0, %eax
; SSE-NEXT: psllw $5, %xmm1		; SSE-NEXT: psllw $5, %xmm1
; SSE-NEXT: pmovmskb %xmm1, %ecx		; SSE-NEXT: psllw $5, %xmm3
; SSE-NEXT: shll $16, %ecx		; SSE-NEXT: psllw $5, %xmm0
; SSE-NEXT: orl %eax, %ecx
; SSE-NEXT: psllw $5, %xmm2		; SSE-NEXT: psllw $5, %xmm2
		; SSE-NEXT: pand %xmm0, %xmm2
		; SSE-NEXT: pand %xmm1, %xmm2
		; SSE-NEXT: pand %xmm3, %xmm2
; SSE-NEXT: pmovmskb %xmm2, %eax		; SSE-NEXT: pmovmskb %xmm2, %eax
; SSE-NEXT: psllw $5, %xmm3		; SSE-NEXT: cmpw $-1, %ax
		RKSimonAuthorUnsubmitted Done Reply Inline Actions BTW - we should be able to catch these concats as well by extending this patch's approach in a future commit RKSimon: BTW - we should be able to catch these concats as well by extending this patch's approach in a…
; SSE-NEXT: pmovmskb %xmm3, %edx
; SSE-NEXT: shll $16, %edx
; SSE-NEXT: orl %eax, %edx
; SSE-NEXT: shlq $32, %rdx
; SSE-NEXT: orq %rcx, %rdx
; SSE-NEXT: cmpq $-1, %rdx
; SSE-NEXT: sete %al		; SSE-NEXT: sete %al
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: allones_v64i8_and4:		; AVX1-LABEL: allones_v64i8_and4:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vpsllw $5, %xmm0, %xmm2		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vpmovmskb %xmm2, %eax		; AVX1-NEXT: vpsllw $5, %xmm2, %xmm2
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
		; AVX1-NEXT: vpsllw $5, %xmm3, %xmm3
; AVX1-NEXT: vpsllw $5, %xmm0, %xmm0		; AVX1-NEXT: vpsllw $5, %xmm0, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %ecx		; AVX1-NEXT: vpsllw $5, %xmm1, %xmm1
; AVX1-NEXT: shll $16, %ecx		; AVX1-NEXT: vpand %xmm0, %xmm1, %xmm0
; AVX1-NEXT: orl %eax, %ecx		; AVX1-NEXT: vpand %xmm0, %xmm2, %xmm0
; AVX1-NEXT: vpsllw $5, %xmm1, %xmm0		; AVX1-NEXT: vpand %xmm0, %xmm3, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %eax		; AVX1-NEXT: vpmovmskb %xmm0, %eax
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0		; AVX1-NEXT: cmpw $-1, %ax
; AVX1-NEXT: vpsllw $5, %xmm0, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %edx
; AVX1-NEXT: shll $16, %edx
; AVX1-NEXT: orl %eax, %edx
; AVX1-NEXT: shlq $32, %rdx
; AVX1-NEXT: orq %rcx, %rdx
; AVX1-NEXT: cmpq $-1, %rdx
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allones_v64i8_and4:		; AVX2-LABEL: allones_v64i8_and4:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpsllw $5, %ymm1, %ymm1
; AVX2-NEXT: vpmovmskb %ymm1, %eax
; AVX2-NEXT: shlq $32, %rax
; AVX2-NEXT: vpsllw $5, %ymm0, %ymm0		; AVX2-NEXT: vpsllw $5, %ymm0, %ymm0
; AVX2-NEXT: vpmovmskb %ymm0, %ecx		; AVX2-NEXT: vpsllw $5, %ymm1, %ymm1
; AVX2-NEXT: orq %rax, %rcx		; AVX2-NEXT: vpand %ymm0, %ymm1, %ymm0
; AVX2-NEXT: cmpq $-1, %rcx		; AVX2-NEXT: vpmovmskb %ymm0, %eax
		; AVX2-NEXT: cmpl $-1, %eax
; AVX2-NEXT: sete %al		; AVX2-NEXT: sete %al
; AVX2-NEXT: vzeroupper		; AVX2-NEXT: vzeroupper
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; KNL-LABEL: allones_v64i8_and4:		; KNL-LABEL: allones_v64i8_and4:
; KNL: # %bb.0:		; KNL: # %bb.0:
; KNL-NEXT: vpsllw $5, %ymm0, %ymm1		; KNL-NEXT: vpsllw $5, %ymm0, %ymm1
; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm0		; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm0
; KNL-NEXT: vpsllw $5, %ymm0, %ymm0		; KNL-NEXT: vpsllw $5, %ymm0, %ymm0
		; KNL-NEXT: vpand %ymm1, %ymm0, %ymm0
; KNL-NEXT: vpmovmskb %ymm0, %eax		; KNL-NEXT: vpmovmskb %ymm0, %eax
; KNL-NEXT: shlq $32, %rax		; KNL-NEXT: cmpl $-1, %eax
; KNL-NEXT: vpmovmskb %ymm1, %ecx
; KNL-NEXT: orq %rax, %rcx
; KNL-NEXT: cmpq $-1, %rcx
; KNL-NEXT: sete %al		; KNL-NEXT: sete %al
; KNL-NEXT: vzeroupper		; KNL-NEXT: vzeroupper
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: allones_v64i8_and4:		; SKX-LABEL: allones_v64i8_and4:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmb {{.*}}(%rip), %zmm0, %k0		; SKX-NEXT: vptestmb {{.*}}(%rip), %zmm0, %k0
; SKX-NEXT: kortestq %k0, %k0		; SKX-NEXT: kortestq %k0, %k0
; SKX-NEXT: setb %al		; SKX-NEXT: setb %al
; SKX-NEXT: vzeroupper		; SKX-NEXT: vzeroupper
; SKX-NEXT: retq		; SKX-NEXT: retq
%tmp = and <64 x i8> %arg, <i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4>		%tmp = and <64 x i8> %arg, <i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4>
%tmp1 = icmp ne <64 x i8> %tmp, zeroinitializer		%tmp1 = icmp ne <64 x i8> %tmp, zeroinitializer
%tmp2 = bitcast <64 x i1> %tmp1 to i64		%tmp2 = bitcast <64 x i1> %tmp1 to i64
%tmp3 = icmp eq i64 %tmp2, -1		%tmp3 = icmp eq i64 %tmp2, -1
ret i1 %tmp3		ret i1 %tmp3
}		}

define i1 @allzeros_v64i8_and4(<64 x i8> %arg) {		define i1 @allzeros_v64i8_and4(<64 x i8> %arg) {
; SSE-LABEL: allzeros_v64i8_and4:		; SSE-LABEL: allzeros_v64i8_and4:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: psllw $5, %xmm0		; SSE-NEXT: por %xmm3, %xmm1
; SSE-NEXT: pmovmskb %xmm0, %eax		; SSE-NEXT: por %xmm2, %xmm1
		; SSE-NEXT: por %xmm0, %xmm1
; SSE-NEXT: psllw $5, %xmm1		; SSE-NEXT: psllw $5, %xmm1
; SSE-NEXT: pmovmskb %xmm1, %ecx		; SSE-NEXT: pmovmskb %xmm1, %eax
; SSE-NEXT: shll $16, %ecx		; SSE-NEXT: testl %eax, %eax
; SSE-NEXT: orl %eax, %ecx
; SSE-NEXT: psllw $5, %xmm2
; SSE-NEXT: pmovmskb %xmm2, %eax
; SSE-NEXT: psllw $5, %xmm3
; SSE-NEXT: pmovmskb %xmm3, %edx
; SSE-NEXT: shll $16, %edx
; SSE-NEXT: orl %eax, %edx
; SSE-NEXT: shlq $32, %rdx
; SSE-NEXT: orq %rcx, %rdx
; SSE-NEXT: sete %al		; SSE-NEXT: sete %al
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: allzeros_v64i8_and4:		; AVX1-LABEL: allzeros_v64i8_and4:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vpsllw $5, %xmm0, %xmm2		; AVX1-NEXT: vpsllw $5, %xmm1, %xmm2
; AVX1-NEXT: vpmovmskb %xmm2, %eax		; AVX1-NEXT: vpsllw $5, %xmm0, %xmm3
		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm1
		; AVX1-NEXT: vpsllw $5, %xmm1, %xmm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX1-NEXT: vpsllw $5, %xmm0, %xmm0		; AVX1-NEXT: vpsllw $5, %xmm0, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %ecx		; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
; AVX1-NEXT: shll $16, %ecx		; AVX1-NEXT: vpor %xmm0, %xmm2, %xmm0
; AVX1-NEXT: orl %eax, %ecx		; AVX1-NEXT: vpor %xmm0, %xmm3, %xmm0
; AVX1-NEXT: vpsllw $5, %xmm1, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %eax		; AVX1-NEXT: vpmovmskb %xmm0, %eax
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0		; AVX1-NEXT: testl %eax, %eax
; AVX1-NEXT: vpsllw $5, %xmm0, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %edx
; AVX1-NEXT: shll $16, %edx
; AVX1-NEXT: orl %eax, %edx
; AVX1-NEXT: shlq $32, %rdx
; AVX1-NEXT: orq %rcx, %rdx
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allzeros_v64i8_and4:		; AVX2-LABEL: allzeros_v64i8_and4:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpsllw $5, %ymm1, %ymm1		; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vpmovmskb %ymm1, %eax
; AVX2-NEXT: shlq $32, %rax
; AVX2-NEXT: vpsllw $5, %ymm0, %ymm0		; AVX2-NEXT: vpsllw $5, %ymm0, %ymm0
; AVX2-NEXT: vpmovmskb %ymm0, %ecx		; AVX2-NEXT: vpmovmskb %ymm0, %eax
; AVX2-NEXT: orq %rax, %rcx		; AVX2-NEXT: testl %eax, %eax
; AVX2-NEXT: sete %al		; AVX2-NEXT: sete %al
; AVX2-NEXT: vzeroupper		; AVX2-NEXT: vzeroupper
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; KNL-LABEL: allzeros_v64i8_and4:		; KNL-LABEL: allzeros_v64i8_and4:
; KNL: # %bb.0:		; KNL: # %bb.0:
; KNL-NEXT: vpsllw $5, %ymm0, %ymm1		; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm1
; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm0		; KNL-NEXT: vpsllw $5, %ymm1, %ymm1
; KNL-NEXT: vpsllw $5, %ymm0, %ymm0		; KNL-NEXT: vpsllw $5, %ymm0, %ymm0
		; KNL-NEXT: vpor %ymm1, %ymm0, %ymm0
; KNL-NEXT: vpmovmskb %ymm0, %eax		; KNL-NEXT: vpmovmskb %ymm0, %eax
; KNL-NEXT: shlq $32, %rax		; KNL-NEXT: testl %eax, %eax
; KNL-NEXT: vpmovmskb %ymm1, %ecx
; KNL-NEXT: orq %rax, %rcx
; KNL-NEXT: sete %al		; KNL-NEXT: sete %al
; KNL-NEXT: vzeroupper		; KNL-NEXT: vzeroupper
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: allzeros_v64i8_and4:		; SKX-LABEL: allzeros_v64i8_and4:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmb {{.*}}(%rip), %zmm0, %k0		; SKX-NEXT: vptestmb {{.*}}(%rip), %zmm0, %k0
; SKX-NEXT: kortestq %k0, %k0		; SKX-NEXT: kortestq %k0, %k0
▲ Show 20 Lines • Show All 153 Lines • ▼ Show 20 Lines
}		}

define i1 @allones_v32i16_and4(<32 x i16> %arg) {		define i1 @allones_v32i16_and4(<32 x i16> %arg) {
; SSE-LABEL: allones_v32i16_and4:		; SSE-LABEL: allones_v32i16_and4:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: psllw $13, %xmm1		; SSE-NEXT: psllw $13, %xmm1
; SSE-NEXT: psllw $13, %xmm0		; SSE-NEXT: psllw $13, %xmm0
; SSE-NEXT: packsswb %xmm1, %xmm0		; SSE-NEXT: packsswb %xmm1, %xmm0
; SSE-NEXT: pmovmskb %xmm0, %eax
; SSE-NEXT: psllw $13, %xmm3		; SSE-NEXT: psllw $13, %xmm3
; SSE-NEXT: psllw $13, %xmm2		; SSE-NEXT: psllw $13, %xmm2
; SSE-NEXT: packsswb %xmm3, %xmm2		; SSE-NEXT: packsswb %xmm3, %xmm2
; SSE-NEXT: pmovmskb %xmm2, %ecx		; SSE-NEXT: pand %xmm0, %xmm2
; SSE-NEXT: shll $16, %ecx		; SSE-NEXT: pmovmskb %xmm2, %eax
; SSE-NEXT: orl %eax, %ecx		; SSE-NEXT: cmpw $-1, %ax
; SSE-NEXT: cmpl $-1, %ecx
; SSE-NEXT: sete %al		; SSE-NEXT: sete %al
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: allones_v32i16_and4:		; AVX1-LABEL: allones_v32i16_and4:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vpsllw $13, %xmm2, %xmm2		; AVX1-NEXT: vpsllw $13, %xmm2, %xmm2
; AVX1-NEXT: vpsllw $13, %xmm0, %xmm0		; AVX1-NEXT: vpsllw $13, %xmm0, %xmm0
; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm0		; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %eax		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0		; AVX1-NEXT: vpsllw $13, %xmm2, %xmm2
; AVX1-NEXT: vpsllw $13, %xmm0, %xmm0
; AVX1-NEXT: vpsllw $13, %xmm1, %xmm1		; AVX1-NEXT: vpsllw $13, %xmm1, %xmm1
; AVX1-NEXT: vpacksswb %xmm0, %xmm1, %xmm0		; AVX1-NEXT: vpacksswb %xmm2, %xmm1, %xmm1
; AVX1-NEXT: vpmovmskb %xmm0, %ecx		; AVX1-NEXT: vpand %xmm0, %xmm1, %xmm0
; AVX1-NEXT: shll $16, %ecx		; AVX1-NEXT: vpmovmskb %xmm0, %eax
; AVX1-NEXT: orl %eax, %ecx		; AVX1-NEXT: cmpw $-1, %ax
; AVX1-NEXT: cmpl $-1, %ecx
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allones_v32i16_and4:		; AVX2-LABEL: allones_v32i16_and4:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpsllw $13, %ymm1, %ymm1		; AVX2-NEXT: vpsllw $13, %ymm1, %ymm1
; AVX2-NEXT: vpsllw $13, %ymm0, %ymm0		; AVX2-NEXT: vpsllw $13, %ymm0, %ymm0
Show All 12 Lines
; KNL-NEXT: vptestmd %zmm1, %zmm1, %k0		; KNL-NEXT: vptestmd %zmm1, %zmm1, %k0
; KNL-NEXT: kmovw %k0, %eax		; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm0		; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm0
; KNL-NEXT: vpsllw $13, %ymm0, %ymm0		; KNL-NEXT: vpsllw $13, %ymm0, %ymm0
; KNL-NEXT: vpsraw $15, %ymm0, %ymm0		; KNL-NEXT: vpsraw $15, %ymm0, %ymm0
; KNL-NEXT: vpmovsxwd %ymm0, %zmm0		; KNL-NEXT: vpmovsxwd %ymm0, %zmm0
; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0		; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0
; KNL-NEXT: kmovw %k0, %ecx		; KNL-NEXT: kmovw %k0, %ecx
; KNL-NEXT: shll $16, %ecx		; KNL-NEXT: andl %eax, %ecx
; KNL-NEXT: orl %eax, %ecx		; KNL-NEXT: cmpl $65535, %ecx # imm = 0xFFFF
; KNL-NEXT: cmpl $-1, %ecx
; KNL-NEXT: sete %al		; KNL-NEXT: sete %al
; KNL-NEXT: vzeroupper		; KNL-NEXT: vzeroupper
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: allones_v32i16_and4:		; SKX-LABEL: allones_v32i16_and4:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmw {{.*}}(%rip), %zmm0, %k0		; SKX-NEXT: vptestmw {{.*}}(%rip), %zmm0, %k0
; SKX-NEXT: kortestd %k0, %k0		; SKX-NEXT: kortestd %k0, %k0
; SKX-NEXT: setb %al		; SKX-NEXT: setb %al
; SKX-NEXT: vzeroupper		; SKX-NEXT: vzeroupper
; SKX-NEXT: retq		; SKX-NEXT: retq
%tmp = and <32 x i16> %arg, <i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4>		%tmp = and <32 x i16> %arg, <i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4>
%tmp1 = icmp ne <32 x i16> %tmp, zeroinitializer		%tmp1 = icmp ne <32 x i16> %tmp, zeroinitializer
%tmp2 = bitcast <32 x i1> %tmp1 to i32		%tmp2 = bitcast <32 x i1> %tmp1 to i32
%tmp3 = icmp eq i32 %tmp2, -1		%tmp3 = icmp eq i32 %tmp2, -1
ret i1 %tmp3		ret i1 %tmp3
}		}

define i1 @allzeros_v32i16_and4(<32 x i16> %arg) {		define i1 @allzeros_v32i16_and4(<32 x i16> %arg) {
; SSE-LABEL: allzeros_v32i16_and4:		; SSE-LABEL: allzeros_v32i16_and4:
; SSE: # %bb.0:		; SSE: # %bb.0:
		; SSE-NEXT: psllw $13, %xmm3
		; SSE-NEXT: psllw $13, %xmm2
		; SSE-NEXT: packsswb %xmm3, %xmm2
; SSE-NEXT: psllw $13, %xmm1		; SSE-NEXT: psllw $13, %xmm1
; SSE-NEXT: psllw $13, %xmm0		; SSE-NEXT: psllw $13, %xmm0
; SSE-NEXT: packsswb %xmm1, %xmm0		; SSE-NEXT: packsswb %xmm1, %xmm0
		; SSE-NEXT: por %xmm2, %xmm0
; SSE-NEXT: pmovmskb %xmm0, %eax		; SSE-NEXT: pmovmskb %xmm0, %eax
; SSE-NEXT: psllw $13, %xmm3		; SSE-NEXT: testl %eax, %eax
; SSE-NEXT: psllw $13, %xmm2
; SSE-NEXT: packsswb %xmm3, %xmm2
; SSE-NEXT: pmovmskb %xmm2, %ecx
; SSE-NEXT: shll $16, %ecx
; SSE-NEXT: orl %eax, %ecx
; SSE-NEXT: sete %al		; SSE-NEXT: sete %al
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: allzeros_v32i16_and4:		; AVX1-LABEL: allzeros_v32i16_and4:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
		; AVX1-NEXT: vpsllw $13, %xmm2, %xmm2
		; AVX1-NEXT: vpsllw $13, %xmm1, %xmm1
		; AVX1-NEXT: vpacksswb %xmm2, %xmm1, %xmm1
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vpsllw $13, %xmm2, %xmm2		; AVX1-NEXT: vpsllw $13, %xmm2, %xmm2
; AVX1-NEXT: vpsllw $13, %xmm0, %xmm0		; AVX1-NEXT: vpsllw $13, %xmm0, %xmm0
; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm0		; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm0
		; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %eax		; AVX1-NEXT: vpmovmskb %xmm0, %eax
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0		; AVX1-NEXT: testl %eax, %eax
; AVX1-NEXT: vpsllw $13, %xmm0, %xmm0
; AVX1-NEXT: vpsllw $13, %xmm1, %xmm1
; AVX1-NEXT: vpacksswb %xmm0, %xmm1, %xmm0
; AVX1-NEXT: vpmovmskb %xmm0, %ecx
; AVX1-NEXT: shll $16, %ecx
; AVX1-NEXT: orl %eax, %ecx
; AVX1-NEXT: sete %al		; AVX1-NEXT: sete %al
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: allzeros_v32i16_and4:		; AVX2-LABEL: allzeros_v32i16_and4:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpsllw $13, %ymm1, %ymm1		; AVX2-NEXT: vpsllw $13, %ymm1, %ymm1
; AVX2-NEXT: vpsllw $13, %ymm0, %ymm0		; AVX2-NEXT: vpsllw $13, %ymm0, %ymm0
; AVX2-NEXT: vpacksswb %ymm1, %ymm0, %ymm0		; AVX2-NEXT: vpacksswb %ymm1, %ymm0, %ymm0
; AVX2-NEXT: vpmovmskb %ymm0, %eax		; AVX2-NEXT: vpmovmskb %ymm0, %eax
; AVX2-NEXT: testl %eax, %eax		; AVX2-NEXT: testl %eax, %eax
; AVX2-NEXT: sete %al		; AVX2-NEXT: sete %al
; AVX2-NEXT: vzeroupper		; AVX2-NEXT: vzeroupper
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; KNL-LABEL: allzeros_v32i16_and4:		; KNL-LABEL: allzeros_v32i16_and4:
; KNL: # %bb.0:		; KNL: # %bb.0:
; KNL-NEXT: vpsllw $13, %ymm0, %ymm1		; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm1
		; KNL-NEXT: vpsllw $13, %ymm1, %ymm1
; KNL-NEXT: vpsraw $15, %ymm1, %ymm1		; KNL-NEXT: vpsraw $15, %ymm1, %ymm1
; KNL-NEXT: vpmovsxwd %ymm1, %zmm1
; KNL-NEXT: vptestmd %zmm1, %zmm1, %k0
; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vextracti64x4 $1, %zmm0, %ymm0
; KNL-NEXT: vpsllw $13, %ymm0, %ymm0		; KNL-NEXT: vpsllw $13, %ymm0, %ymm0
; KNL-NEXT: vpsraw $15, %ymm0, %ymm0		; KNL-NEXT: vpsraw $15, %ymm0, %ymm0
		; KNL-NEXT: vpor %ymm1, %ymm0, %ymm0
; KNL-NEXT: vpmovsxwd %ymm0, %zmm0		; KNL-NEXT: vpmovsxwd %ymm0, %zmm0
; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0		; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0
; KNL-NEXT: kmovw %k0, %ecx		; KNL-NEXT: kortestw %k0, %k0
; KNL-NEXT: shll $16, %ecx
; KNL-NEXT: orl %eax, %ecx
; KNL-NEXT: sete %al		; KNL-NEXT: sete %al
; KNL-NEXT: vzeroupper		; KNL-NEXT: vzeroupper
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: allzeros_v32i16_and4:		; SKX-LABEL: allzeros_v32i16_and4:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmw {{.*}}(%rip), %zmm0, %k0		; SKX-NEXT: vptestmw {{.*}}(%rip), %zmm0, %k0
; SKX-NEXT: kortestd %k0, %k0		; SKX-NEXT: kortestd %k0, %k0
▲ Show 20 Lines • Show All 1,326 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[DAG] Simplify OR(X,SHL(Y,BW/2)) eq/ne 0/-1 'all/any-of' style patterns
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 315093

llvm/lib/CodeGen/SelectionDAG/TargetLowering.cpp

llvm/test/CodeGen/X86/avx512-mask-op.ll

llvm/test/CodeGen/X86/cmp-concat.ll

llvm/test/CodeGen/X86/movmsk-cmp.ll

This is an archive of the discontinued LLVM Phabricator instance.

[DAG] Simplify OR(X,SHL(Y,BW/2)) eq/ne 0/-1 'all/any-of' style patternsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 315093

llvm/lib/CodeGen/SelectionDAG/TargetLowering.cpp

llvm/test/CodeGen/X86/avx512-mask-op.ll

llvm/test/CodeGen/X86/cmp-concat.ll

llvm/test/CodeGen/X86/movmsk-cmp.ll

[DAG] Simplify OR(X,SHL(Y,BW/2)) eq/ne 0/-1 'all/any-of' style patterns
ClosedPublic