This is an archive of the discontinued LLVM Phabricator instance.

[x86] improve codegen for bit-masked vector compare and select (PR46531)
ClosedPublic

Authored by spatel on Jul 2 2020, 12:03 PM.

Download Raw Diff

Details

Reviewers

RKSimon
craig.topper
lebedev.ri

Summary

We canonicalize patterns like:

%s = lshr i32 %a0, 1
%t = trunc i32 %s to i1

to:

%a = and i32 %a0, 2
%c = icmp ne i32 %a, 0

...in IR, but the bit-shifting original sequence may be better for x86 vector codegen.

I tried several variants of the transform, and it's tricky to not induce regressions. In particular, I did not find a way to cleanly handle non-splat constants, so I've left that as a TODO item here (negative tests for those are included here). AVX512 resulted in some diffs, but didn't look meaningful, so I left that out too. Some of the 256-bit AVX1 diffs are questionable, but close enough that it's probably not meaningful.

Diff Detail

Event Timeline

spatel created this revision.Jul 2 2020, 12:03 PM

Herald added a project: Restricted Project. · View Herald TranscriptJul 2 2020, 12:03 PM

Herald added subscribers: hiraditya, mcrosier. · View Herald Transcript

LGTM, cheers - this is OK as a first step, but getting nonuniform cases working is going to be necessary as well.

This revision is now accepted and ready to land.Jul 3 2020, 7:32 AM

spatel mentioned this in D83181: [x86] improve codegen for non-splat bit-masked vector compare and select (PR46531).Jul 5 2020, 1:12 PM

rG26543f1c0cee

spatel mentioned this in rG91149002872f: [x86] improve codegen for non-splat bit-masked vector compare and select….Jul 8 2020, 5:23 AM

Revision Contents

Path

Size

llvm/

lib/

Target/

X86/

X86ISelLowering.cpp

25 lines

test/

CodeGen/

X86/

vselect-pcmp.ll

270 lines

Diff 275190

llvm/lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 40,178 Lines • ▼ Show 20 Lines	if ((LHSIsConst \|\|
else		else
RHS = RHS.getOperand(0);		RHS = RHS.getOperand(0);

SDValue Select = DAG.getSelect(DL, IntVT, Cond, LHS, RHS);		SDValue Select = DAG.getSelect(DL, IntVT, Cond, LHS, RHS);
return DAG.getBitcast(VT, Select);		return DAG.getBitcast(VT, Select);
}		}
}		}

		// If this is "((X & C) == 0) ? Y : Z" and C is a constant mask vector of
		// single bits, then invert the predicate and swap the select operands.
		// This can lower using a vector shift bit-hack rather than mask and compare.
		if (DCI.isBeforeLegalize() && !Subtarget.hasAVX512() &&
		N->getOpcode() == ISD::VSELECT && Cond.getOpcode() == ISD::SETCC &&
		Cond.hasOneUse() && CondVT.getVectorElementType() == MVT::i1 &&
		Cond.getOperand(0).getOpcode() == ISD::AND &&
		isNullOrNullSplat(Cond.getOperand(1)) &&
		cast<CondCodeSDNode>(Cond.getOperand(2))->get() == ISD::SETEQ &&
		Cond.getOperand(0).getValueType() == VT) {
		// The 'and' mask must be composed of power-of-2 constants.
		// TODO: This is limited to splats because the availability/lowering of
		// non-uniform shifts and variable blend types is lumpy. Supporting
		// arbitrary power-of-2 vector constants will make the code more
		// complicated and may require target limitations to ensure that the
		// transform is profitable.
		auto *C = isConstOrConstSplat(Cond.getOperand(0).getOperand(1));
		if (C && C->getAPIntValue().isPowerOf2()) {
		// vselect (X & C == 0), LHS, RHS --> vselect (X & C != 0), RHS, LHS
		SDValue NotCond = DAG.getSetCC(DL, CondVT, Cond.getOperand(0),
		Cond.getOperand(1), ISD::SETNE);
		return DAG.getSelect(DL, VT, NotCond, RHS, LHS);
		}
		}

return SDValue();		return SDValue();
}		}

/// Combine:		/// Combine:
/// (brcond/cmov/setcc .., (cmp (atomic_load_add x, 1), 0), COND_S)		/// (brcond/cmov/setcc .., (cmp (atomic_load_add x, 1), 0), COND_S)
/// to:		/// to:
/// (brcond/cmov/setcc .., (LADD x, 1), COND_LE)		/// (brcond/cmov/setcc .., (LADD x, 1), COND_LE)
/// i.e., reusing the EFLAGS produced by the LOCKed instruction.		/// i.e., reusing the EFLAGS produced by the LOCKed instruction.
▲ Show 20 Lines • Show All 9,711 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vselect-pcmp.ll

Show First 20 Lines • Show All 386 Lines • ▼ Show 20 Lines	; AVX512VL-NEXT: retq
%cmp = fcmp olt <4 x float> %x, zeroinitializer		%cmp = fcmp olt <4 x float> %x, zeroinitializer
%sel = select <4 x i1> %cmp, <4 x float> %x, <4 x float> %y		%sel = select <4 x i1> %cmp, <4 x float> %x, <4 x float> %y
ret <4 x float> %sel		ret <4 x float> %sel
}		}

define <4 x i64> @blend_splat1_mask_cond_v4i64(<4 x i64> %x, <4 x i64> %y, <4 x i64> %z) {		define <4 x i64> @blend_splat1_mask_cond_v4i64(<4 x i64> %x, <4 x i64> %y, <4 x i64> %z) {
; AVX1-LABEL: blend_splat1_mask_cond_v4i64:		; AVX1-LABEL: blend_splat1_mask_cond_v4i64:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vandps {{.*}}(%rip), %ymm0, %ymm0		; AVX1-NEXT: vpsllq $63, %xmm0, %xmm3
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4		; AVX1-NEXT: vpsllq $63, %xmm0, %xmm0
; AVX1-NEXT: vpcmpeqq %xmm4, %xmm3, %xmm3		; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm3, %ymm0
; AVX1-NEXT: vpcmpeqq %xmm4, %xmm0, %xmm0		; AVX1-NEXT: vblendvpd %ymm0, %ymm2, %ymm1, %ymm0
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0
; AVX1-NEXT: vblendvpd %ymm0, %ymm1, %ymm2, %ymm0
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: blend_splat1_mask_cond_v4i64:		; AVX2-LABEL: blend_splat1_mask_cond_v4i64:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm3 = [1,1,1,1]		; AVX2-NEXT: vpsllq $63, %ymm0, %ymm0
; AVX2-NEXT: vpand %ymm3, %ymm0, %ymm0		; AVX2-NEXT: vblendvpd %ymm0, %ymm2, %ymm1, %ymm0
; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3
; AVX2-NEXT: vpcmpeqq %ymm3, %ymm0, %ymm0
; AVX2-NEXT: vblendvpd %ymm0, %ymm1, %ymm2, %ymm0
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; AVX512F-LABEL: blend_splat1_mask_cond_v4i64:		; AVX512F-LABEL: blend_splat1_mask_cond_v4i64:
; AVX512F: # %bb.0:		; AVX512F: # %bb.0:
; AVX512F-NEXT: # kill: def $ymm2 killed $ymm2 def $zmm2		; AVX512F-NEXT: # kill: def $ymm2 killed $ymm2 def $zmm2
; AVX512F-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1		; AVX512F-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1
; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0		; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0
; AVX512F-NEXT: vptestnmq {{.*}}(%rip){1to8}, %zmm0, %k1		; AVX512F-NEXT: vptestnmq {{.*}}(%rip){1to8}, %zmm0, %k1
; AVX512F-NEXT: vpblendmq %zmm1, %zmm2, %zmm0 {%k1}		; AVX512F-NEXT: vpblendmq %zmm1, %zmm2, %zmm0 {%k1}
; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0		; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
; AVX512F-NEXT: retq		; AVX512F-NEXT: retq
;		;
; AVX512VL-LABEL: blend_splat1_mask_cond_v4i64:		; AVX512VL-LABEL: blend_splat1_mask_cond_v4i64:
; AVX512VL: # %bb.0:		; AVX512VL: # %bb.0:
; AVX512VL-NEXT: vptestnmq {{.*}}(%rip){1to4}, %ymm0, %k1		; AVX512VL-NEXT: vptestnmq {{.*}}(%rip){1to4}, %ymm0, %k1
; AVX512VL-NEXT: vpblendmq %ymm1, %ymm2, %ymm0 {%k1}		; AVX512VL-NEXT: vpblendmq %ymm1, %ymm2, %ymm0 {%k1}
; AVX512VL-NEXT: retq		; AVX512VL-NEXT: retq
%a = and <4 x i64> %x, <i64 1, i64 1, i64 1, i64 1>		%a = and <4 x i64> %x, <i64 1, i64 1, i64 1, i64 1>
%c = icmp eq <4 x i64> %a, zeroinitializer		%c = icmp eq <4 x i64> %a, zeroinitializer
%r = select <4 x i1> %c, <4 x i64> %y, <4 x i64> %z		%r = select <4 x i1> %c, <4 x i64> %y, <4 x i64> %z
ret <4 x i64> %r		ret <4 x i64> %r
}		}

define <4 x i32> @blend_splat1_mask_cond_v4i32(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @blend_splat1_mask_cond_v4i32(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; AVX1-LABEL: blend_splat1_mask_cond_v4i32:		; AVX12-LABEL: blend_splat1_mask_cond_v4i32:
; AVX1: # %bb.0:		; AVX12: # %bb.0:
; AVX1-NEXT: vpand {{.*}}(%rip), %xmm0, %xmm0		; AVX12-NEXT: vpslld $31, %xmm0, %xmm0
; AVX1-NEXT: vpxor %xmm3, %xmm3, %xmm3		; AVX12-NEXT: vblendvps %xmm0, %xmm2, %xmm1, %xmm0
; AVX1-NEXT: vpcmpeqd %xmm3, %xmm0, %xmm0		; AVX12-NEXT: retq
; AVX1-NEXT: vblendvps %xmm0, %xmm1, %xmm2, %xmm0
; AVX1-NEXT: retq
;
; AVX2-LABEL: blend_splat1_mask_cond_v4i32:
; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastd {{.*#+}} xmm3 = [1,1,1,1]
; AVX2-NEXT: vpand %xmm3, %xmm0, %xmm0
; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3
; AVX2-NEXT: vpcmpeqd %xmm3, %xmm0, %xmm0
; AVX2-NEXT: vblendvps %xmm0, %xmm1, %xmm2, %xmm0
; AVX2-NEXT: retq
;		;
; AVX512F-LABEL: blend_splat1_mask_cond_v4i32:		; AVX512F-LABEL: blend_splat1_mask_cond_v4i32:
; AVX512F: # %bb.0:		; AVX512F: # %bb.0:
; AVX512F-NEXT: # kill: def $xmm2 killed $xmm2 def $zmm2		; AVX512F-NEXT: # kill: def $xmm2 killed $xmm2 def $zmm2
; AVX512F-NEXT: # kill: def $xmm1 killed $xmm1 def $zmm1		; AVX512F-NEXT: # kill: def $xmm1 killed $xmm1 def $zmm1
; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0		; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
; AVX512F-NEXT: vptestnmd {{.*}}(%rip){1to16}, %zmm0, %k1		; AVX512F-NEXT: vptestnmd {{.*}}(%rip){1to16}, %zmm0, %k1
; AVX512F-NEXT: vpblendmd %zmm1, %zmm2, %zmm0 {%k1}		; AVX512F-NEXT: vpblendmd %zmm1, %zmm2, %zmm0 {%k1}
Show All 10 Lines	; AVX512VL-NEXT: retq
%c = icmp eq <4 x i32> %a, zeroinitializer		%c = icmp eq <4 x i32> %a, zeroinitializer
%r = select <4 x i1> %c, <4 x i32> %y, <4 x i32> %z		%r = select <4 x i1> %c, <4 x i32> %y, <4 x i32> %z
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <16 x i16> @blend_splat1_mask_cond_v16i16(<16 x i16> %x, <16 x i16> %y, <16 x i16> %z) {		define <16 x i16> @blend_splat1_mask_cond_v16i16(<16 x i16> %x, <16 x i16> %y, <16 x i16> %z) {
; AVX1-LABEL: blend_splat1_mask_cond_v16i16:		; AVX1-LABEL: blend_splat1_mask_cond_v16i16:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vandps {{.*}}(%rip), %ymm0, %ymm0		; AVX1-NEXT: vpsllw $15, %xmm0, %xmm3
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3		; AVX1-NEXT: vpsraw $15, %xmm3, %xmm3
; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX1-NEXT: vpcmpeqw %xmm4, %xmm3, %xmm3		; AVX1-NEXT: vpsllw $15, %xmm0, %xmm0
; AVX1-NEXT: vpcmpeqw %xmm4, %xmm0, %xmm0		; AVX1-NEXT: vpsraw $15, %xmm0, %xmm0
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0		; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm3, %ymm0
; AVX1-NEXT: vandnps %ymm2, %ymm0, %ymm2		; AVX1-NEXT: vandnps %ymm1, %ymm0, %ymm1
; AVX1-NEXT: vandps %ymm0, %ymm1, %ymm0		; AVX1-NEXT: vandps %ymm0, %ymm2, %ymm0
; AVX1-NEXT: vorps %ymm2, %ymm0, %ymm0		; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: blend_splat1_mask_cond_v16i16:		; AVX2-LABEL: blend_splat1_mask_cond_v16i16:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpand {{.*}}(%rip), %ymm0, %ymm0		; AVX2-NEXT: vpsllw $15, %ymm0, %ymm0
; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3		; AVX2-NEXT: vpsraw $15, %ymm0, %ymm0
; AVX2-NEXT: vpcmpeqw %ymm3, %ymm0, %ymm0		; AVX2-NEXT: vpblendvb %ymm0, %ymm2, %ymm1, %ymm0
; AVX2-NEXT: vpblendvb %ymm0, %ymm1, %ymm2, %ymm0
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; AVX512-LABEL: blend_splat1_mask_cond_v16i16:		; AVX512-LABEL: blend_splat1_mask_cond_v16i16:
; AVX512: # %bb.0:		; AVX512: # %bb.0:
; AVX512-NEXT: vpand {{.*}}(%rip), %ymm0, %ymm0		; AVX512-NEXT: vpand {{.*}}(%rip), %ymm0, %ymm0
; AVX512-NEXT: vpxor %xmm3, %xmm3, %xmm3		; AVX512-NEXT: vpxor %xmm3, %xmm3, %xmm3
; AVX512-NEXT: vpcmpeqw %ymm3, %ymm0, %ymm0		; AVX512-NEXT: vpcmpeqw %ymm3, %ymm0, %ymm0
; AVX512-NEXT: vpblendvb %ymm0, %ymm1, %ymm2, %ymm0		; AVX512-NEXT: vpblendvb %ymm0, %ymm1, %ymm2, %ymm0
; AVX512-NEXT: retq		; AVX512-NEXT: retq
%a = and <16 x i16> %x, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>		%a = and <16 x i16> %x, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>
%c = icmp eq <16 x i16> %a, zeroinitializer		%c = icmp eq <16 x i16> %a, zeroinitializer
%r = select <16 x i1> %c, <16 x i16> %y, <16 x i16> %z		%r = select <16 x i1> %c, <16 x i16> %y, <16 x i16> %z
ret <16 x i16> %r		ret <16 x i16> %r
}		}

define <16 x i8> @blend_splat1_mask_cond_v16i8(<16 x i8> %x, <16 x i8> %y, <16 x i8> %z) {		define <16 x i8> @blend_splat1_mask_cond_v16i8(<16 x i8> %x, <16 x i8> %y, <16 x i8> %z) {
; AVX-LABEL: blend_splat1_mask_cond_v16i8:		; AVX12-LABEL: blend_splat1_mask_cond_v16i8:
; AVX: # %bb.0:		; AVX12: # %bb.0:
; AVX-NEXT: vpand {{.*}}(%rip), %xmm0, %xmm0		; AVX12-NEXT: vpsllw $7, %xmm0, %xmm0
; AVX-NEXT: vpxor %xmm3, %xmm3, %xmm3		; AVX12-NEXT: vpblendvb %xmm0, %xmm2, %xmm1, %xmm0
; AVX-NEXT: vpcmpeqb %xmm3, %xmm0, %xmm0		; AVX12-NEXT: retq
; AVX-NEXT: vpblendvb %xmm0, %xmm1, %xmm2, %xmm0		;
; AVX-NEXT: retq		; AVX512-LABEL: blend_splat1_mask_cond_v16i8:
		; AVX512: # %bb.0:
		; AVX512-NEXT: vpand {{.*}}(%rip), %xmm0, %xmm0
		; AVX512-NEXT: vpxor %xmm3, %xmm3, %xmm3
		; AVX512-NEXT: vpcmpeqb %xmm3, %xmm0, %xmm0
		; AVX512-NEXT: vpblendvb %xmm0, %xmm1, %xmm2, %xmm0
		; AVX512-NEXT: retq
%a = and <16 x i8> %x, <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>		%a = and <16 x i8> %x, <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>
%c = icmp eq <16 x i8> %a, zeroinitializer		%c = icmp eq <16 x i8> %a, zeroinitializer
%r = select <16 x i1> %c, <16 x i8> %y, <16 x i8> %z		%r = select <16 x i1> %c, <16 x i8> %y, <16 x i8> %z
ret <16 x i8> %r		ret <16 x i8> %r
}		}

define <2 x i64> @blend_splatmax_mask_cond_v2i64(<2 x i64> %x, <2 x i64> %y, <2 x i64> %z) {		define <2 x i64> @blend_splatmax_mask_cond_v2i64(<2 x i64> %x, <2 x i64> %y, <2 x i64> %z) {
; AVX12-LABEL: blend_splatmax_mask_cond_v2i64:		; AVX12-LABEL: blend_splatmax_mask_cond_v2i64:
; AVX12: # %bb.0:		; AVX12: # %bb.0:
; AVX12-NEXT: vpand {{.*}}(%rip), %xmm0, %xmm0		; AVX12-NEXT: vblendvpd %xmm0, %xmm2, %xmm1, %xmm0
; AVX12-NEXT: vpxor %xmm3, %xmm3, %xmm3
; AVX12-NEXT: vpcmpeqq %xmm3, %xmm0, %xmm0
; AVX12-NEXT: vblendvpd %xmm0, %xmm1, %xmm2, %xmm0
; AVX12-NEXT: retq		; AVX12-NEXT: retq
;		;
; AVX512F-LABEL: blend_splatmax_mask_cond_v2i64:		; AVX512F-LABEL: blend_splatmax_mask_cond_v2i64:
; AVX512F: # %bb.0:		; AVX512F: # %bb.0:
; AVX512F-NEXT: # kill: def $xmm2 killed $xmm2 def $zmm2		; AVX512F-NEXT: # kill: def $xmm2 killed $xmm2 def $zmm2
; AVX512F-NEXT: # kill: def $xmm1 killed $xmm1 def $zmm1		; AVX512F-NEXT: # kill: def $xmm1 killed $xmm1 def $zmm1
; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0		; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
; AVX512F-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]		; AVX512F-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
Show All 10 Lines
; AVX512VL-NEXT: retq		; AVX512VL-NEXT: retq
%a = and <2 x i64> %x, <i64 9223372036854775808, i64 9223372036854775808>		%a = and <2 x i64> %x, <i64 9223372036854775808, i64 9223372036854775808>
%c = icmp eq <2 x i64> %a, zeroinitializer		%c = icmp eq <2 x i64> %a, zeroinitializer
%r = select <2 x i1> %c, <2 x i64> %y, <2 x i64> %z		%r = select <2 x i1> %c, <2 x i64> %y, <2 x i64> %z
ret <2 x i64> %r		ret <2 x i64> %r
}		}

define <8 x i32> @blend_splatmax_mask_cond_v8i32(<8 x i32> %x, <8 x i32> %y, <8 x i32> %z) {		define <8 x i32> @blend_splatmax_mask_cond_v8i32(<8 x i32> %x, <8 x i32> %y, <8 x i32> %z) {
; AVX1-LABEL: blend_splatmax_mask_cond_v8i32:		; AVX12-LABEL: blend_splatmax_mask_cond_v8i32:
; AVX1: # %bb.0:		; AVX12: # %bb.0:
; AVX1-NEXT: vandps {{.*}}(%rip), %ymm0, %ymm0		; AVX12-NEXT: vblendvps %ymm0, %ymm2, %ymm1, %ymm0
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3		; AVX12-NEXT: retq
; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
; AVX1-NEXT: vpcmpeqd %xmm4, %xmm3, %xmm3
; AVX1-NEXT: vpcmpeqd %xmm4, %xmm0, %xmm0
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0
; AVX1-NEXT: vblendvps %ymm0, %ymm1, %ymm2, %ymm0
; AVX1-NEXT: retq
;
; AVX2-LABEL: blend_splatmax_mask_cond_v8i32:
; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastd {{.*#+}} ymm3 = [2147483648,2147483648,2147483648,2147483648,2147483648,2147483648,2147483648,2147483648]
; AVX2-NEXT: vpand %ymm3, %ymm0, %ymm0
; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3
; AVX2-NEXT: vpcmpeqd %ymm3, %ymm0, %ymm0
; AVX2-NEXT: vblendvps %ymm0, %ymm1, %ymm2, %ymm0
; AVX2-NEXT: retq
;		;
; AVX512F-LABEL: blend_splatmax_mask_cond_v8i32:		; AVX512F-LABEL: blend_splatmax_mask_cond_v8i32:
; AVX512F: # %bb.0:		; AVX512F: # %bb.0:
; AVX512F-NEXT: # kill: def $ymm2 killed $ymm2 def $zmm2		; AVX512F-NEXT: # kill: def $ymm2 killed $ymm2 def $zmm2
; AVX512F-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1		; AVX512F-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1
; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0		; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0
; AVX512F-NEXT: vptestnmd {{.*}}(%rip){1to16}, %zmm0, %k1		; AVX512F-NEXT: vptestnmd {{.*}}(%rip){1to16}, %zmm0, %k1
; AVX512F-NEXT: vpblendmd %zmm1, %zmm2, %zmm0 {%k1}		; AVX512F-NEXT: vpblendmd %zmm1, %zmm2, %zmm0 {%k1}
; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0		; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
; AVX512F-NEXT: retq		; AVX512F-NEXT: retq
;		;
; AVX512VL-LABEL: blend_splatmax_mask_cond_v8i32:		; AVX512VL-LABEL: blend_splatmax_mask_cond_v8i32:
; AVX512VL: # %bb.0:		; AVX512VL: # %bb.0:
; AVX512VL-NEXT: vptestnmd {{.*}}(%rip){1to8}, %ymm0, %k1		; AVX512VL-NEXT: vptestnmd {{.*}}(%rip){1to8}, %ymm0, %k1
; AVX512VL-NEXT: vpblendmd %ymm1, %ymm2, %ymm0 {%k1}		; AVX512VL-NEXT: vpblendmd %ymm1, %ymm2, %ymm0 {%k1}
; AVX512VL-NEXT: retq		; AVX512VL-NEXT: retq
%a = and <8 x i32> %x, <i32 2147483648, i32 2147483648, i32 2147483648, i32 2147483648, i32 2147483648, i32 2147483648, i32 2147483648, i32 2147483648>		%a = and <8 x i32> %x, <i32 2147483648, i32 2147483648, i32 2147483648, i32 2147483648, i32 2147483648, i32 2147483648, i32 2147483648, i32 2147483648>
%c = icmp eq <8 x i32> %a, zeroinitializer		%c = icmp eq <8 x i32> %a, zeroinitializer
%r = select <8 x i1> %c, <8 x i32> %y, <8 x i32> %z		%r = select <8 x i1> %c, <8 x i32> %y, <8 x i32> %z
ret <8 x i32> %r		ret <8 x i32> %r
}		}

define <8 x i16> @blend_splatmax_mask_cond_v8i16(<8 x i16> %x, <8 x i16> %y, <8 x i16> %z) {		define <8 x i16> @blend_splatmax_mask_cond_v8i16(<8 x i16> %x, <8 x i16> %y, <8 x i16> %z) {
; AVX-LABEL: blend_splatmax_mask_cond_v8i16:		; AVX12-LABEL: blend_splatmax_mask_cond_v8i16:
; AVX: # %bb.0:		; AVX12: # %bb.0:
; AVX-NEXT: vpand {{.*}}(%rip), %xmm0, %xmm0		; AVX12-NEXT: vpsraw $15, %xmm0, %xmm0
; AVX-NEXT: vpxor %xmm3, %xmm3, %xmm3		; AVX12-NEXT: vpblendvb %xmm0, %xmm2, %xmm1, %xmm0
; AVX-NEXT: vpcmpeqw %xmm3, %xmm0, %xmm0		; AVX12-NEXT: retq
; AVX-NEXT: vpblendvb %xmm0, %xmm1, %xmm2, %xmm0		;
; AVX-NEXT: retq		; AVX512-LABEL: blend_splatmax_mask_cond_v8i16:
		; AVX512: # %bb.0:
		; AVX512-NEXT: vpand {{.*}}(%rip), %xmm0, %xmm0
		; AVX512-NEXT: vpxor %xmm3, %xmm3, %xmm3
		; AVX512-NEXT: vpcmpeqw %xmm3, %xmm0, %xmm0
		; AVX512-NEXT: vpblendvb %xmm0, %xmm1, %xmm2, %xmm0
		; AVX512-NEXT: retq
%a = and <8 x i16> %x, <i16 32768, i16 32768, i16 32768, i16 32768, i16 32768, i16 32768, i16 32768, i16 32768>		%a = and <8 x i16> %x, <i16 32768, i16 32768, i16 32768, i16 32768, i16 32768, i16 32768, i16 32768, i16 32768>
%c = icmp eq <8 x i16> %a, zeroinitializer		%c = icmp eq <8 x i16> %a, zeroinitializer
%r = select <8 x i1> %c, <8 x i16> %y, <8 x i16> %z		%r = select <8 x i1> %c, <8 x i16> %y, <8 x i16> %z
ret <8 x i16> %r		ret <8 x i16> %r
}		}

define <32 x i8> @blend_splatmax_mask_cond_v32i8(<32 x i8> %x, <32 x i8> %y, <32 x i8> %z) {		define <32 x i8> @blend_splatmax_mask_cond_v32i8(<32 x i8> %x, <32 x i8> %y, <32 x i8> %z) {
; AVX1-LABEL: blend_splatmax_mask_cond_v32i8:		; AVX1-LABEL: blend_splatmax_mask_cond_v32i8:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vandps {{.*}}(%rip), %ymm0, %ymm0
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4		; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
; AVX1-NEXT: vpcmpeqb %xmm4, %xmm3, %xmm3		; AVX1-NEXT: vpcmpgtb %xmm3, %xmm4, %xmm3
; AVX1-NEXT: vpcmpeqb %xmm4, %xmm0, %xmm0		; AVX1-NEXT: vpcmpgtb %xmm0, %xmm4, %xmm0
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0		; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0
; AVX1-NEXT: vandnps %ymm2, %ymm0, %ymm2		; AVX1-NEXT: vandnps %ymm1, %ymm0, %ymm1
; AVX1-NEXT: vandps %ymm0, %ymm1, %ymm0		; AVX1-NEXT: vandps %ymm0, %ymm2, %ymm0
; AVX1-NEXT: vorps %ymm2, %ymm0, %ymm0		; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: blend_splatmax_mask_cond_v32i8:		; AVX2-LABEL: blend_splatmax_mask_cond_v32i8:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpand {{.*}}(%rip), %ymm0, %ymm0		; AVX2-NEXT: vpblendvb %ymm0, %ymm2, %ymm1, %ymm0
; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3
; AVX2-NEXT: vpcmpeqb %ymm3, %ymm0, %ymm0
; AVX2-NEXT: vpblendvb %ymm0, %ymm1, %ymm2, %ymm0
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; AVX512-LABEL: blend_splatmax_mask_cond_v32i8:		; AVX512-LABEL: blend_splatmax_mask_cond_v32i8:
; AVX512: # %bb.0:		; AVX512: # %bb.0:
; AVX512-NEXT: vpand {{.*}}(%rip), %ymm0, %ymm0		; AVX512-NEXT: vpand {{.*}}(%rip), %ymm0, %ymm0
; AVX512-NEXT: vpxor %xmm3, %xmm3, %xmm3		; AVX512-NEXT: vpxor %xmm3, %xmm3, %xmm3
; AVX512-NEXT: vpcmpeqb %ymm3, %ymm0, %ymm0		; AVX512-NEXT: vpcmpeqb %ymm3, %ymm0, %ymm0
; AVX512-NEXT: vpblendvb %ymm0, %ymm1, %ymm2, %ymm0		; AVX512-NEXT: vpblendvb %ymm0, %ymm1, %ymm2, %ymm0
; AVX512-NEXT: retq		; AVX512-NEXT: retq
%a = and <32 x i8> %x, <i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128>		%a = and <32 x i8> %x, <i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128>
%c = icmp eq <32 x i8> %a, zeroinitializer		%c = icmp eq <32 x i8> %a, zeroinitializer
%r = select <32 x i1> %c, <32 x i8> %y, <32 x i8> %z		%r = select <32 x i1> %c, <32 x i8> %y, <32 x i8> %z
ret <32 x i8> %r		ret <32 x i8> %r
}		}

define <4 x i64> @blend_splat_mask_cond_v4i64(<4 x i64> %x, <4 x i64> %y, <4 x i64> %z) {		define <4 x i64> @blend_splat_mask_cond_v4i64(<4 x i64> %x, <4 x i64> %y, <4 x i64> %z) {
; AVX1-LABEL: blend_splat_mask_cond_v4i64:		; AVX1-LABEL: blend_splat_mask_cond_v4i64:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vandps {{.*}}(%rip), %ymm0, %ymm0		; AVX1-NEXT: vpsllq $62, %xmm0, %xmm3
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4		; AVX1-NEXT: vpsllq $62, %xmm0, %xmm0
; AVX1-NEXT: vpcmpeqq %xmm4, %xmm3, %xmm3		; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm3, %ymm0
; AVX1-NEXT: vpcmpeqq %xmm4, %xmm0, %xmm0		; AVX1-NEXT: vblendvpd %ymm0, %ymm2, %ymm1, %ymm0
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0
; AVX1-NEXT: vblendvpd %ymm0, %ymm1, %ymm2, %ymm0
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: blend_splat_mask_cond_v4i64:		; AVX2-LABEL: blend_splat_mask_cond_v4i64:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm3 = [2,2,2,2]		; AVX2-NEXT: vpsllq $62, %ymm0, %ymm0
; AVX2-NEXT: vpand %ymm3, %ymm0, %ymm0		; AVX2-NEXT: vblendvpd %ymm0, %ymm2, %ymm1, %ymm0
; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3
; AVX2-NEXT: vpcmpeqq %ymm3, %ymm0, %ymm0
; AVX2-NEXT: vblendvpd %ymm0, %ymm1, %ymm2, %ymm0
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; AVX512F-LABEL: blend_splat_mask_cond_v4i64:		; AVX512F-LABEL: blend_splat_mask_cond_v4i64:
; AVX512F: # %bb.0:		; AVX512F: # %bb.0:
; AVX512F-NEXT: # kill: def $ymm2 killed $ymm2 def $zmm2		; AVX512F-NEXT: # kill: def $ymm2 killed $ymm2 def $zmm2
; AVX512F-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1		; AVX512F-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1
; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0		; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0
; AVX512F-NEXT: vptestnmq {{.*}}(%rip){1to8}, %zmm0, %k1		; AVX512F-NEXT: vptestnmq {{.*}}(%rip){1to8}, %zmm0, %k1
; AVX512F-NEXT: vpblendmq %zmm1, %zmm2, %zmm0 {%k1}		; AVX512F-NEXT: vpblendmq %zmm1, %zmm2, %zmm0 {%k1}
; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0		; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
; AVX512F-NEXT: retq		; AVX512F-NEXT: retq
;		;
; AVX512VL-LABEL: blend_splat_mask_cond_v4i64:		; AVX512VL-LABEL: blend_splat_mask_cond_v4i64:
; AVX512VL: # %bb.0:		; AVX512VL: # %bb.0:
; AVX512VL-NEXT: vptestnmq {{.*}}(%rip){1to4}, %ymm0, %k1		; AVX512VL-NEXT: vptestnmq {{.*}}(%rip){1to4}, %ymm0, %k1
; AVX512VL-NEXT: vpblendmq %ymm1, %ymm2, %ymm0 {%k1}		; AVX512VL-NEXT: vpblendmq %ymm1, %ymm2, %ymm0 {%k1}
; AVX512VL-NEXT: retq		; AVX512VL-NEXT: retq
%a = and <4 x i64> %x, <i64 2, i64 2, i64 2, i64 2>		%a = and <4 x i64> %x, <i64 2, i64 2, i64 2, i64 2>
%c = icmp eq <4 x i64> %a, zeroinitializer		%c = icmp eq <4 x i64> %a, zeroinitializer
%r = select <4 x i1> %c, <4 x i64> %y, <4 x i64> %z		%r = select <4 x i1> %c, <4 x i64> %y, <4 x i64> %z
ret <4 x i64> %r		ret <4 x i64> %r
}		}

define <4 x i32> @blend_splat_mask_cond_v4i32(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @blend_splat_mask_cond_v4i32(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; AVX1-LABEL: blend_splat_mask_cond_v4i32:		; AVX12-LABEL: blend_splat_mask_cond_v4i32:
; AVX1: # %bb.0:		; AVX12: # %bb.0:
; AVX1-NEXT: vpand {{.*}}(%rip), %xmm0, %xmm0		; AVX12-NEXT: vpslld $15, %xmm0, %xmm0
; AVX1-NEXT: vpxor %xmm3, %xmm3, %xmm3		; AVX12-NEXT: vblendvps %xmm0, %xmm2, %xmm1, %xmm0
; AVX1-NEXT: vpcmpeqd %xmm3, %xmm0, %xmm0		; AVX12-NEXT: retq
; AVX1-NEXT: vblendvps %xmm0, %xmm1, %xmm2, %xmm0
; AVX1-NEXT: retq
;
; AVX2-LABEL: blend_splat_mask_cond_v4i32:
; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastd {{.*#+}} xmm3 = [65536,65536,65536,65536]
; AVX2-NEXT: vpand %xmm3, %xmm0, %xmm0
; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3
; AVX2-NEXT: vpcmpeqd %xmm3, %xmm0, %xmm0
; AVX2-NEXT: vblendvps %xmm0, %xmm1, %xmm2, %xmm0
; AVX2-NEXT: retq
;		;
; AVX512F-LABEL: blend_splat_mask_cond_v4i32:		; AVX512F-LABEL: blend_splat_mask_cond_v4i32:
; AVX512F: # %bb.0:		; AVX512F: # %bb.0:
; AVX512F-NEXT: # kill: def $xmm2 killed $xmm2 def $zmm2		; AVX512F-NEXT: # kill: def $xmm2 killed $xmm2 def $zmm2
; AVX512F-NEXT: # kill: def $xmm1 killed $xmm1 def $zmm1		; AVX512F-NEXT: # kill: def $xmm1 killed $xmm1 def $zmm1
; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0		; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
; AVX512F-NEXT: vptestnmd {{.*}}(%rip){1to16}, %zmm0, %k1		; AVX512F-NEXT: vptestnmd {{.*}}(%rip){1to16}, %zmm0, %k1
; AVX512F-NEXT: vpblendmd %zmm1, %zmm2, %zmm0 {%k1}		; AVX512F-NEXT: vpblendmd %zmm1, %zmm2, %zmm0 {%k1}
Show All 10 Lines	; AVX512VL-NEXT: retq
%c = icmp eq <4 x i32> %a, zeroinitializer		%c = icmp eq <4 x i32> %a, zeroinitializer
%r = select <4 x i1> %c, <4 x i32> %y, <4 x i32> %z		%r = select <4 x i1> %c, <4 x i32> %y, <4 x i32> %z
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <16 x i16> @blend_splat_mask_cond_v16i16(<16 x i16> %x, <16 x i16> %y, <16 x i16> %z) {		define <16 x i16> @blend_splat_mask_cond_v16i16(<16 x i16> %x, <16 x i16> %y, <16 x i16> %z) {
; AVX1-LABEL: blend_splat_mask_cond_v16i16:		; AVX1-LABEL: blend_splat_mask_cond_v16i16:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vandps {{.*}}(%rip), %ymm0, %ymm0		; AVX1-NEXT: vpsllw $5, %xmm0, %xmm3
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3		; AVX1-NEXT: vpsraw $15, %xmm3, %xmm3
; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX1-NEXT: vpcmpeqw %xmm4, %xmm3, %xmm3		; AVX1-NEXT: vpsllw $5, %xmm0, %xmm0
; AVX1-NEXT: vpcmpeqw %xmm4, %xmm0, %xmm0		; AVX1-NEXT: vpsraw $15, %xmm0, %xmm0
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0		; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm3, %ymm0
; AVX1-NEXT: vandnps %ymm2, %ymm0, %ymm2		; AVX1-NEXT: vandnps %ymm1, %ymm0, %ymm1
; AVX1-NEXT: vandps %ymm0, %ymm1, %ymm0		; AVX1-NEXT: vandps %ymm0, %ymm2, %ymm0
; AVX1-NEXT: vorps %ymm2, %ymm0, %ymm0		; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: blend_splat_mask_cond_v16i16:		; AVX2-LABEL: blend_splat_mask_cond_v16i16:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpand {{.*}}(%rip), %ymm0, %ymm0		; AVX2-NEXT: vpsllw $5, %ymm0, %ymm0
; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3		; AVX2-NEXT: vpsraw $15, %ymm0, %ymm0
; AVX2-NEXT: vpcmpeqw %ymm3, %ymm0, %ymm0		; AVX2-NEXT: vpblendvb %ymm0, %ymm2, %ymm1, %ymm0
; AVX2-NEXT: vpblendvb %ymm0, %ymm1, %ymm2, %ymm0
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; AVX512-LABEL: blend_splat_mask_cond_v16i16:		; AVX512-LABEL: blend_splat_mask_cond_v16i16:
; AVX512: # %bb.0:		; AVX512: # %bb.0:
; AVX512-NEXT: vpand {{.*}}(%rip), %ymm0, %ymm0		; AVX512-NEXT: vpand {{.*}}(%rip), %ymm0, %ymm0
; AVX512-NEXT: vpxor %xmm3, %xmm3, %xmm3		; AVX512-NEXT: vpxor %xmm3, %xmm3, %xmm3
; AVX512-NEXT: vpcmpeqw %ymm3, %ymm0, %ymm0		; AVX512-NEXT: vpcmpeqw %ymm3, %ymm0, %ymm0
; AVX512-NEXT: vpblendvb %ymm0, %ymm1, %ymm2, %ymm0		; AVX512-NEXT: vpblendvb %ymm0, %ymm1, %ymm2, %ymm0
; AVX512-NEXT: retq		; AVX512-NEXT: retq
%a = and <16 x i16> %x, <i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024>		%a = and <16 x i16> %x, <i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024, i16 1024>
%c = icmp eq <16 x i16> %a, zeroinitializer		%c = icmp eq <16 x i16> %a, zeroinitializer
%r = select <16 x i1> %c, <16 x i16> %y, <16 x i16> %z		%r = select <16 x i1> %c, <16 x i16> %y, <16 x i16> %z
ret <16 x i16> %r		ret <16 x i16> %r
}		}

define <16 x i8> @blend_splat_mask_cond_v16i8(<16 x i8> %x, <16 x i8> %y, <16 x i8> %z) {		define <16 x i8> @blend_splat_mask_cond_v16i8(<16 x i8> %x, <16 x i8> %y, <16 x i8> %z) {
; AVX-LABEL: blend_splat_mask_cond_v16i8:		; AVX12-LABEL: blend_splat_mask_cond_v16i8:
; AVX: # %bb.0:		; AVX12: # %bb.0:
; AVX-NEXT: vpand {{.*}}(%rip), %xmm0, %xmm0		; AVX12-NEXT: vpsllw $5, %xmm0, %xmm0
; AVX-NEXT: vpxor %xmm3, %xmm3, %xmm3		; AVX12-NEXT: vpblendvb %xmm0, %xmm2, %xmm1, %xmm0
; AVX-NEXT: vpcmpeqb %xmm3, %xmm0, %xmm0		; AVX12-NEXT: retq
; AVX-NEXT: vpblendvb %xmm0, %xmm1, %xmm2, %xmm0		;
; AVX-NEXT: retq		; AVX512-LABEL: blend_splat_mask_cond_v16i8:
		; AVX512: # %bb.0:
		; AVX512-NEXT: vpand {{.*}}(%rip), %xmm0, %xmm0
		; AVX512-NEXT: vpxor %xmm3, %xmm3, %xmm3
		; AVX512-NEXT: vpcmpeqb %xmm3, %xmm0, %xmm0
		; AVX512-NEXT: vpblendvb %xmm0, %xmm1, %xmm2, %xmm0
		; AVX512-NEXT: retq
%a = and <16 x i8> %x, <i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4>		%a = and <16 x i8> %x, <i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4>
%c = icmp eq <16 x i8> %a, zeroinitializer		%c = icmp eq <16 x i8> %a, zeroinitializer
%r = select <16 x i1> %c, <16 x i8> %y, <16 x i8> %z		%r = select <16 x i1> %c, <16 x i8> %y, <16 x i8> %z
ret <16 x i8> %r		ret <16 x i8> %r
}		}

define <4 x i64> @blend_mask_cond_v4i64(<4 x i64> %x, <4 x i64> %y, <4 x i64> %z) {		define <4 x i64> @blend_mask_cond_v4i64(<4 x i64> %x, <4 x i64> %y, <4 x i64> %z) {
; AVX1-LABEL: blend_mask_cond_v4i64:		; AVX1-LABEL: blend_mask_cond_v4i64:
▲ Show 20 Lines • Show All 114 Lines • ▼ Show 20 Lines
; AVX-NEXT: retq		; AVX-NEXT: retq
%a = and <16 x i8> %x, <i8 1, i8 2, i8 4, i8 8, i8 16, i8 32, i8 64, i8 128, i8 4, i8 4, i8 4, i8 4, i8 2, i8 2, i8 2, i8 2>		%a = and <16 x i8> %x, <i8 1, i8 2, i8 4, i8 8, i8 16, i8 32, i8 64, i8 128, i8 4, i8 4, i8 4, i8 4, i8 2, i8 2, i8 2, i8 2>
%c = icmp eq <16 x i8> %a, zeroinitializer		%c = icmp eq <16 x i8> %a, zeroinitializer
%r = select <16 x i1> %c, <16 x i8> %y, <16 x i8> %z		%r = select <16 x i1> %c, <16 x i8> %y, <16 x i8> %z
ret <16 x i8> %r		ret <16 x i8> %r
}		}

define void @PR46531(i32* %x, i32* %y, i32* %z) {		define void @PR46531(i32* %x, i32* %y, i32* %z) {
; AVX1-LABEL: PR46531:		; AVX12-LABEL: PR46531:
; AVX1: # %bb.0:		; AVX12: # %bb.0:
; AVX1-NEXT: vmovdqu (%rsi), %xmm0		; AVX12-NEXT: vmovdqu (%rsi), %xmm0
; AVX1-NEXT: vmovdqu (%rdx), %xmm1		; AVX12-NEXT: vmovdqu (%rdx), %xmm1
; AVX1-NEXT: vpor %xmm0, %xmm1, %xmm2		; AVX12-NEXT: vpor %xmm0, %xmm1, %xmm2
; AVX1-NEXT: vpand {{.*}}(%rip), %xmm1, %xmm3		; AVX12-NEXT: vpxor %xmm0, %xmm1, %xmm0
; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4		; AVX12-NEXT: vpslld $31, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqd %xmm4, %xmm3, %xmm3		; AVX12-NEXT: vblendvps %xmm1, %xmm0, %xmm2, %xmm0
; AVX1-NEXT: vpxor %xmm0, %xmm1, %xmm0		; AVX12-NEXT: vmovups %xmm0, (%rdi)
; AVX1-NEXT: vblendvps %xmm3, %xmm2, %xmm0, %xmm0		; AVX12-NEXT: retq
; AVX1-NEXT: vmovups %xmm0, (%rdi)
; AVX1-NEXT: retq
;
; AVX2-LABEL: PR46531:
; AVX2: # %bb.0:
; AVX2-NEXT: vmovdqu (%rsi), %xmm0
; AVX2-NEXT: vmovdqu (%rdx), %xmm1
; AVX2-NEXT: vpor %xmm0, %xmm1, %xmm2
; AVX2-NEXT: vpbroadcastd {{.*#+}} xmm3 = [1,1,1,1]
; AVX2-NEXT: vpand %xmm3, %xmm1, %xmm3
; AVX2-NEXT: vpxor %xmm4, %xmm4, %xmm4
; AVX2-NEXT: vpcmpeqd %xmm4, %xmm3, %xmm3
; AVX2-NEXT: vpxor %xmm0, %xmm1, %xmm0
; AVX2-NEXT: vblendvps %xmm3, %xmm2, %xmm0, %xmm0
; AVX2-NEXT: vmovups %xmm0, (%rdi)
; AVX2-NEXT: retq
;		;
; AVX512F-LABEL: PR46531:		; AVX512F-LABEL: PR46531:
; AVX512F: # %bb.0:		; AVX512F: # %bb.0:
; AVX512F-NEXT: vmovdqu (%rsi), %xmm0		; AVX512F-NEXT: vmovdqu (%rsi), %xmm0
; AVX512F-NEXT: vmovdqu (%rdx), %xmm1		; AVX512F-NEXT: vmovdqu (%rdx), %xmm1
; AVX512F-NEXT: vpor %xmm0, %xmm1, %xmm2		; AVX512F-NEXT: vpor %xmm0, %xmm1, %xmm2
; AVX512F-NEXT: vptestnmd {{.*}}(%rip){1to16}, %zmm1, %k1		; AVX512F-NEXT: vptestnmd {{.*}}(%rip){1to16}, %zmm1, %k1
; AVX512F-NEXT: vpxor %xmm0, %xmm1, %xmm0		; AVX512F-NEXT: vpxor %xmm0, %xmm1, %xmm0
Show All 29 Lines