Diff 116342

llvm/trunk/lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 34,485 Lines • ▼ Show 20 Lines	static SDValue getDivRem8(SDNode *N, SelectionDAG &DAG) {
auto DivRemOpcode = OpcodeN0 == ISD::SDIVREM ? X86ISD::SDIVREM8_SEXT_HREG		auto DivRemOpcode = OpcodeN0 == ISD::SDIVREM ? X86ISD::SDIVREM8_SEXT_HREG
: X86ISD::UDIVREM8_ZEXT_HREG;		: X86ISD::UDIVREM8_ZEXT_HREG;
SDValue R = DAG.getNode(DivRemOpcode, SDLoc(N), NodeTys, N0.getOperand(0),		SDValue R = DAG.getNode(DivRemOpcode, SDLoc(N), NodeTys, N0.getOperand(0),
N0.getOperand(1));		N0.getOperand(1));
DAG.ReplaceAllUsesOfValueWith(N0.getValue(0), R.getValue(0));		DAG.ReplaceAllUsesOfValueWith(N0.getValue(0), R.getValue(0));
return R.getValue(1);		return R.getValue(1);
}		}

		// If we face {ANY,SIGN,ZERO}_EXTEND that is applied to a CMOV with constant
		// operands and the result of CMOV is not used anywhere else - promote CMOV
		// itself instead of promoting its result. This could be beneficial, because:
		// 1) X86TargetLowering::EmitLoweredSelect later can do merging of two
		// (or more) pseudo-CMOVs only when they go one-after-another and
		// getting rid of result extension code after CMOV will help that.
		// 2) Promotion of constant CMOV arguments is free, hence the
		// {ANY,SIGN,ZERO}_EXTEND will just be deleted.
		// 3) 16-bit CMOV encoding is 4 bytes, 32-bit CMOV is 3-byte, so this
		// promotion is also good in terms of code-size.
		// (64-bit CMOV is 4-bytes, that's why we don't do 32-bit => 64-bit
		// promotion).
		static SDValue combineToExtendCMOV(SDNode *Extend, SelectionDAG &DAG) {
		SDValue CMovN = Extend->getOperand(0);
		if (CMovN.getOpcode() != X86ISD::CMOV)
		return SDValue();

		EVT TargetVT = Extend->getValueType(0);
		unsigned ExtendOpcode = Extend->getOpcode();
		SDLoc DL(Extend);

		EVT VT = CMovN.getValueType();
		SDValue CMovOp0 = CMovN.getOperand(0);
		SDValue CMovOp1 = CMovN.getOperand(1);

		bool DoPromoteCMOV =
		(VT == MVT::i16 && (TargetVT == MVT::i32 \|\| TargetVT == MVT::i64)) &&
		CMovN.hasOneUse() &&
		(isa<ConstantSDNode>(CMovOp0.getNode()) &&
		isa<ConstantSDNode>(CMovOp1.getNode()));

		if (!DoPromoteCMOV)
		return SDValue();

		CMovOp0 = DAG.getNode(ExtendOpcode, DL, TargetVT, CMovOp0);
		CMovOp1 = DAG.getNode(ExtendOpcode, DL, TargetVT, CMovOp1);

		return DAG.getNode(X86ISD::CMOV, DL, TargetVT, CMovOp0, CMovOp1,
		CMovN.getOperand(2), CMovN.getOperand(3));
		}

/// Convert a SEXT or ZEXT of a vector to a SIGN_EXTEND_VECTOR_INREG or		/// Convert a SEXT or ZEXT of a vector to a SIGN_EXTEND_VECTOR_INREG or
/// ZERO_EXTEND_VECTOR_INREG, this requires the splitting (or concatenating		/// ZERO_EXTEND_VECTOR_INREG, this requires the splitting (or concatenating
/// with UNDEFs) of the input to vectors of the same size as the target type		/// with UNDEFs) of the input to vectors of the same size as the target type
/// which then extends the lowest elements.		/// which then extends the lowest elements.
static SDValue combineToExtendVectorInReg(SDNode *N, SelectionDAG &DAG,		static SDValue combineToExtendVectorInReg(SDNode *N, SelectionDAG &DAG,
TargetLowering::DAGCombinerInfo &DCI,		TargetLowering::DAGCombinerInfo &DCI,
const X86Subtarget &Subtarget) {		const X86Subtarget &Subtarget) {
unsigned Opcode = N->getOpcode();		unsigned Opcode = N->getOpcode();
▲ Show 20 Lines • Show All 98 Lines • ▼ Show 20 Lines	static SDValue combineSext(SDNode *N, SelectionDAG &DAG,
SDValue N0 = N->getOperand(0);		SDValue N0 = N->getOperand(0);
EVT VT = N->getValueType(0);		EVT VT = N->getValueType(0);
EVT InVT = N0.getValueType();		EVT InVT = N0.getValueType();
SDLoc DL(N);		SDLoc DL(N);

if (SDValue DivRem8 = getDivRem8(N, DAG))		if (SDValue DivRem8 = getDivRem8(N, DAG))
return DivRem8;		return DivRem8;

		if (SDValue NewCMov = combineToExtendCMOV(N, DAG))
		return NewCMov;

if (!DCI.isBeforeLegalizeOps()) {		if (!DCI.isBeforeLegalizeOps()) {
if (InVT == MVT::i1) {		if (InVT == MVT::i1) {
SDValue Zero = DAG.getConstant(0, DL, VT);		SDValue Zero = DAG.getConstant(0, DL, VT);
SDValue AllOnes = DAG.getAllOnesConstant(DL, VT);		SDValue AllOnes = DAG.getAllOnesConstant(DL, VT);
return DAG.getSelect(DL, VT, N0, AllOnes, Zero);		return DAG.getSelect(DL, VT, N0, AllOnes, Zero);
}		}
return SDValue();		return SDValue();
}		}
▲ Show 20 Lines • Show All 136 Lines • ▼ Show 20 Lines	if (N0.getOpcode() == ISD::TRUNCATE &&
if (N00.getOpcode() == X86ISD::SETCC_CARRY) {		if (N00.getOpcode() == X86ISD::SETCC_CARRY) {
return DAG.getNode(ISD::AND, dl, VT,		return DAG.getNode(ISD::AND, dl, VT,
DAG.getNode(X86ISD::SETCC_CARRY, dl, VT,		DAG.getNode(X86ISD::SETCC_CARRY, dl, VT,
N00.getOperand(0), N00.getOperand(1)),		N00.getOperand(0), N00.getOperand(1)),
DAG.getConstant(1, dl, VT));		DAG.getConstant(1, dl, VT));
}		}
}		}

		if (SDValue NewCMov = combineToExtendCMOV(N, DAG))
		return NewCMov;

if (SDValue V = combineToExtendVectorInReg(N, DAG, DCI, Subtarget))		if (SDValue V = combineToExtendVectorInReg(N, DAG, DCI, Subtarget))
return V;		return V;

if (VT.is256BitVector())		if (VT.is256BitVector())
if (SDValue R = WidenMaskArithmetic(N, DAG, DCI, Subtarget))		if (SDValue R = WidenMaskArithmetic(N, DAG, DCI, Subtarget))
return R;		return R;

if (SDValue DivRem8 = getDivRem8(N, DAG))		if (SDValue DivRem8 = getDivRem8(N, DAG))
▲ Show 20 Lines • Show All 2,210 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/cmov-promotion.ll

Show First 20 Lines • Show All 84 Lines • ▼ Show 20 Lines	; NO_CMOV-NEXT: retl
%ret = zext i8 %t0 to i64		%ret = zext i8 %t0 to i64
ret i64 %ret		ret i64 %ret
}		}

define i32 @cmov_zpromotion_16_to_32(i1 %c) {		define i32 @cmov_zpromotion_16_to_32(i1 %c) {
; CMOV-LABEL: cmov_zpromotion_16_to_32:		; CMOV-LABEL: cmov_zpromotion_16_to_32:
; CMOV: # BB#0:		; CMOV: # BB#0:
; CMOV-NEXT: testb $1, %dil		; CMOV-NEXT: testb $1, %dil
; CMOV-NEXT: movw $12414, %ax # imm = 0x307E		; CMOV-NEXT: movl $12414, %ecx # imm = 0x307E
; CMOV-NEXT: movw $-1, %cx		; CMOV-NEXT: movl $65535, %eax # imm = 0xFFFF
; CMOV-NEXT: cmovnew %ax, %cx		; CMOV-NEXT: cmovnel %ecx, %eax
; CMOV-NEXT: movzwl %cx, %eax
; CMOV-NEXT: retq		; CMOV-NEXT: retq
;		;
; NO_CMOV-LABEL: cmov_zpromotion_16_to_32:		; NO_CMOV-LABEL: cmov_zpromotion_16_to_32:
; NO_CMOV: # BB#0:		; NO_CMOV: # BB#0:
; NO_CMOV-NEXT: testb $1, {{[0-9]+}}(%esp)		; NO_CMOV-NEXT: testb $1, {{[0-9]+}}(%esp)
; NO_CMOV-NEXT: movw $12414, %ax # imm = 0x307E		; NO_CMOV-NEXT: movl $12414, %eax # imm = 0x307E
; NO_CMOV-NEXT: jne .LBB3_2		; NO_CMOV-NEXT: jne .LBB3_2
; NO_CMOV-NEXT: # BB#1:		; NO_CMOV-NEXT: # BB#1:
; NO_CMOV-NEXT: movw $-1, %ax		; NO_CMOV-NEXT: movl $65535, %eax # imm = 0xFFFF
; NO_CMOV-NEXT: .LBB3_2:		; NO_CMOV-NEXT: .LBB3_2:
; NO_CMOV-NEXT: movzwl %ax, %eax
; NO_CMOV-NEXT: retl		; NO_CMOV-NEXT: retl
%t0 = select i1 %c, i16 12414, i16 -1		%t0 = select i1 %c, i16 12414, i16 -1
%ret = zext i16 %t0 to i32		%ret = zext i16 %t0 to i32
ret i32 %ret		ret i32 %ret
}		}

define i64 @cmov_zpromotion_16_to_64(i1 %c) {		define i64 @cmov_zpromotion_16_to_64(i1 %c) {
; CMOV-LABEL: cmov_zpromotion_16_to_64:		; CMOV-LABEL: cmov_zpromotion_16_to_64:
; CMOV: # BB#0:		; CMOV: # BB#0:
; CMOV-NEXT: testb $1, %dil		; CMOV-NEXT: testb $1, %dil
; CMOV-NEXT: movw $12414, %ax # imm = 0x307E		; CMOV-NEXT: movl $12414, %ecx # imm = 0x307E
; CMOV-NEXT: movw $-1, %cx		; CMOV-NEXT: movl $65535, %eax # imm = 0xFFFF
; CMOV-NEXT: cmovnew %ax, %cx		; CMOV-NEXT: cmovneq %rcx, %rax
; CMOV-NEXT: movzwl %cx, %eax
; CMOV-NEXT: retq		; CMOV-NEXT: retq
;		;
; NO_CMOV-LABEL: cmov_zpromotion_16_to_64:		; NO_CMOV-LABEL: cmov_zpromotion_16_to_64:
; NO_CMOV: # BB#0:		; NO_CMOV: # BB#0:
; NO_CMOV-NEXT: testb $1, {{[0-9]+}}(%esp)		; NO_CMOV-NEXT: testb $1, {{[0-9]+}}(%esp)
; NO_CMOV-NEXT: movw $12414, %ax # imm = 0x307E		; NO_CMOV-NEXT: movl $12414, %eax # imm = 0x307E
; NO_CMOV-NEXT: jne .LBB4_2		; NO_CMOV-NEXT: jne .LBB4_2
; NO_CMOV-NEXT: # BB#1:		; NO_CMOV-NEXT: # BB#1:
; NO_CMOV-NEXT: movw $-1, %ax		; NO_CMOV-NEXT: movl $65535, %eax # imm = 0xFFFF
; NO_CMOV-NEXT: .LBB4_2:		; NO_CMOV-NEXT: .LBB4_2:
; NO_CMOV-NEXT: movzwl %ax, %eax
; NO_CMOV-NEXT: xorl %edx, %edx		; NO_CMOV-NEXT: xorl %edx, %edx
; NO_CMOV-NEXT: retl		; NO_CMOV-NEXT: retl
%t0 = select i1 %c, i16 12414, i16 -1		%t0 = select i1 %c, i16 12414, i16 -1
%ret = zext i16 %t0 to i64		%ret = zext i16 %t0 to i64
ret i64 %ret		ret i64 %ret
}		}

define i64 @cmov_zpromotion_32_to_64(i1 %c) {		define i64 @cmov_zpromotion_32_to_64(i1 %c) {
▲ Show 20 Lines • Show All 104 Lines • ▼ Show 20 Lines	; NO_CMOV-NEXT: retl
%ret = sext i8 %t0 to i64		%ret = sext i8 %t0 to i64
ret i64 %ret		ret i64 %ret
}		}

define i32 @cmov_spromotion_16_to_32(i1 %c) {		define i32 @cmov_spromotion_16_to_32(i1 %c) {
; CMOV-LABEL: cmov_spromotion_16_to_32:		; CMOV-LABEL: cmov_spromotion_16_to_32:
; CMOV: # BB#0:		; CMOV: # BB#0:
; CMOV-NEXT: testb $1, %dil		; CMOV-NEXT: testb $1, %dil
; CMOV-NEXT: movw $12414, %ax # imm = 0x307E		; CMOV-NEXT: movl $12414, %ecx # imm = 0x307E
; CMOV-NEXT: movw $-1, %cx		; CMOV-NEXT: movl $-1, %eax
; CMOV-NEXT: cmovnew %ax, %cx		; CMOV-NEXT: cmovnel %ecx, %eax
; CMOV-NEXT: movswl %cx, %eax
; CMOV-NEXT: retq		; CMOV-NEXT: retq
;		;
; NO_CMOV-LABEL: cmov_spromotion_16_to_32:		; NO_CMOV-LABEL: cmov_spromotion_16_to_32:
; NO_CMOV: # BB#0:		; NO_CMOV: # BB#0:
; NO_CMOV-NEXT: testb $1, {{[0-9]+}}(%esp)		; NO_CMOV-NEXT: testb $1, {{[0-9]+}}(%esp)
; NO_CMOV-NEXT: movw $12414, %ax # imm = 0x307E		; NO_CMOV-NEXT: movl $12414, %eax # imm = 0x307E
; NO_CMOV-NEXT: jne .LBB9_2		; NO_CMOV-NEXT: jne .LBB9_2
; NO_CMOV-NEXT: # BB#1:		; NO_CMOV-NEXT: # BB#1:
; NO_CMOV-NEXT: movw $-1, %ax		; NO_CMOV-NEXT: movl $-1, %eax
; NO_CMOV-NEXT: .LBB9_2:		; NO_CMOV-NEXT: .LBB9_2:
; NO_CMOV-NEXT: cwtl
; NO_CMOV-NEXT: retl		; NO_CMOV-NEXT: retl
%t0 = select i1 %c, i16 12414, i16 -1		%t0 = select i1 %c, i16 12414, i16 -1
%ret = sext i16 %t0 to i32		%ret = sext i16 %t0 to i32
ret i32 %ret		ret i32 %ret
}		}

define i64 @cmov_spromotion_16_to_64(i1 %c) {		define i64 @cmov_spromotion_16_to_64(i1 %c) {
; CMOV-LABEL: cmov_spromotion_16_to_64:		; CMOV-LABEL: cmov_spromotion_16_to_64:
; CMOV: # BB#0:		; CMOV: # BB#0:
; CMOV-NEXT: testb $1, %dil		; CMOV-NEXT: testb $1, %dil
; CMOV-NEXT: movw $12414, %ax # imm = 0x307E		; CMOV-NEXT: movl $12414, %ecx # imm = 0x307E
; CMOV-NEXT: movw $-1, %cx		; CMOV-NEXT: movq $-1, %rax
; CMOV-NEXT: cmovnew %ax, %cx		; CMOV-NEXT: cmovneq %rcx, %rax
; CMOV-NEXT: movswq %cx, %rax
; CMOV-NEXT: retq		; CMOV-NEXT: retq
;		;
; NO_CMOV-LABEL: cmov_spromotion_16_to_64:		; NO_CMOV-LABEL: cmov_spromotion_16_to_64:
; NO_CMOV: # BB#0:		; NO_CMOV: # BB#0:
; NO_CMOV-NEXT: testb $1, {{[0-9]+}}(%esp)		; NO_CMOV-NEXT: testb $1, {{[0-9]+}}(%esp)
; NO_CMOV-NEXT: movw $12414, %ax # imm = 0x307E		; NO_CMOV-NEXT: movl $12414, %eax # imm = 0x307E
; NO_CMOV-NEXT: jne .LBB10_2		; NO_CMOV-NEXT: jne .LBB10_2
; NO_CMOV-NEXT: # BB#1:		; NO_CMOV-NEXT: # BB#1:
; NO_CMOV-NEXT: movw $-1, %ax		; NO_CMOV-NEXT: movl $-1, %eax
; NO_CMOV-NEXT: .LBB10_2:		; NO_CMOV-NEXT: .LBB10_2:
; NO_CMOV-NEXT: cwtl
; NO_CMOV-NEXT: movl %eax, %edx		; NO_CMOV-NEXT: movl %eax, %edx
; NO_CMOV-NEXT: sarl $31, %edx		; NO_CMOV-NEXT: sarl $31, %edx
; NO_CMOV-NEXT: retl		; NO_CMOV-NEXT: retl
%t0 = select i1 %c, i16 12414, i16 -1		%t0 = select i1 %c, i16 12414, i16 -1
%ret = sext i16 %t0 to i64		%ret = sext i16 %t0 to i64
ret i64 %ret		ret i64 %ret
}		}

Show All 25 Lines

llvm/trunk/test/CodeGen/X86/select.ll

Show All 33 Lines	; MCU-NEXT: retl
%t1 = load %0, %0* %q		%t1 = load %0, %0* %q
%t4 = select i1 %r, %0 %t0, %0 %t1		%t4 = select i1 %r, %0 %t0, %0 %t1
%t5 = extractvalue %0 %t4, 1		%t5 = extractvalue %0 %t4, 1
ret i32 %t5		ret i32 %t5
}		}

; PR2139		; PR2139
define i32 @test2() nounwind {		define i32 @test2() nounwind {
; CHECK-LABEL: test2:		; GENERIC-LABEL: test2:
; CHECK: ## BB#0: ## %entry		; GENERIC: ## BB#0: ## %entry
; CHECK-NEXT: pushq %rax		; GENERIC-NEXT: pushq %rax
; CHECK-NEXT: callq _return_false		; GENERIC-NEXT: callq _return_false
; CHECK-NEXT: xorl %ecx, %ecx		; GENERIC-NEXT: xorl %ecx, %ecx
; CHECK-NEXT: testb $1, %al		; GENERIC-NEXT: testb $1, %al
; CHECK-NEXT: movw $-480, %ax ## imm = 0xFE20		; GENERIC-NEXT: movl $-480, %eax
; CHECK-NEXT: cmovnew %cx, %ax		; GENERIC-NEXT: cmovnel %ecx, %eax
; CHECK-NEXT: cwtl		; GENERIC-NEXT: shll $3, %eax
; CHECK-NEXT: shll $3, %eax		; GENERIC-NEXT: cmpl $32768, %eax ## imm = 0x8000
; CHECK-NEXT: cmpl $32768, %eax ## imm = 0x8000		; GENERIC-NEXT: jge LBB1_1
; CHECK-NEXT: jge LBB1_1		; GENERIC-NEXT: ## BB#2: ## %bb91
; CHECK-NEXT: ## BB#2: ## %bb91		; GENERIC-NEXT: xorl %eax, %eax
; CHECK-NEXT: xorl %eax, %eax		; GENERIC-NEXT: popq %rcx
; CHECK-NEXT: popq %rcx		; GENERIC-NEXT: retq
; CHECK-NEXT: retq		; GENERIC-NEXT: LBB1_1: ## %bb90
; CHECK-NEXT: LBB1_1: ## %bb90		; GENERIC-NEXT: ## -- End function
; CHECK-NEXT: ## -- End function		;
		; ATOM-LABEL: test2:
		; ATOM: ## BB#0: ## %entry
		; ATOM-NEXT: pushq %rax
		; ATOM-NEXT: callq _return_false
		; ATOM-NEXT: xorl %ecx, %ecx
		; ATOM-NEXT: movl $-480, %edx
		; ATOM-NEXT: testb $1, %al
		; ATOM-NEXT: cmovnel %ecx, %edx
		; ATOM-NEXT: shll $3, %edx
		; ATOM-NEXT: cmpl $32768, %edx ## imm = 0x8000
		; ATOM-NEXT: jge LBB1_1
		; ATOM-NEXT: ## BB#2: ## %bb91
		; ATOM-NEXT: xorl %eax, %eax
		; ATOM-NEXT: popq %rcx
		; ATOM-NEXT: retq
		; ATOM-NEXT: LBB1_1: ## %bb90
		; ATOM-NEXT: ## -- End function
;		;
; MCU-LABEL: test2:		; MCU-LABEL: test2:
; MCU: # BB#0: # %entry		; MCU: # BB#0: # %entry
; MCU-NEXT: calll return_false		; MCU-NEXT: calll return_false
		; MCU-NEXT: xorl %ecx, %ecx
; MCU-NEXT: testb $1, %al		; MCU-NEXT: testb $1, %al
; MCU-NEXT: jne .LBB1_1		; MCU-NEXT: jne .LBB1_2
; MCU-NEXT: # BB#2: # %entry		; MCU-NEXT: # BB#1: # %entry
; MCU-NEXT: movw $-480, %ax # imm = 0xFE20		; MCU-NEXT: movl $-480, %ecx # imm = 0xFE20
; MCU-NEXT: jmp .LBB1_3		; MCU-NEXT: .LBB1_2:
; MCU-NEXT: .LBB1_1:		; MCU-NEXT: shll $3, %ecx
; MCU-NEXT: xorl %eax, %eax		; MCU-NEXT: cmpl $32768, %ecx # imm = 0x8000
; MCU-NEXT: .LBB1_3: # %entry		; MCU-NEXT: jge .LBB1_3
; MCU-NEXT: cwtl		; MCU-NEXT: # BB#4: # %bb91
; MCU-NEXT: shll $3, %eax
; MCU-NEXT: cmpl $32768, %eax # imm = 0x8000
; MCU-NEXT: jge .LBB1_4
; MCU-NEXT: # BB#5: # %bb91
; MCU-NEXT: xorl %eax, %eax		; MCU-NEXT: xorl %eax, %eax
; MCU-NEXT: retl		; MCU-NEXT: retl
; MCU-NEXT: .LBB1_4: # %bb90		; MCU-NEXT: .LBB1_3: # %bb90
entry:		entry:
%tmp73 = tail call i1 @return_false()		%tmp73 = tail call i1 @return_false()
%g.0 = select i1 %tmp73, i16 0, i16 -480		%g.0 = select i1 %tmp73, i16 0, i16 -480
%tmp7778 = sext i16 %g.0 to i32		%tmp7778 = sext i16 %g.0 to i32
%tmp80 = shl i32 %tmp7778, 3		%tmp80 = shl i32 %tmp7778, 3
%tmp87 = icmp sgt i32 %tmp80, 32767		%tmp87 = icmp sgt i32 %tmp80, 32767
br i1 %tmp87, label %bb90, label %bb91		br i1 %tmp87, label %bb90, label %bb91
bb90:		bb90:
▲ Show 20 Lines • Show All 1,085 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-compare-results.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 5,785 Lines • ▼ Show 20 Lines
	; AVX512BW-LABEL: test_cmp_v64i16:			; AVX512BW-LABEL: test_cmp_v64i16:
	; AVX512BW: # BB#0:			; AVX512BW: # BB#0:
	; AVX512BW-NEXT: vextracti32x4 $3, %zmm2, %xmm4			; AVX512BW-NEXT: vextracti32x4 $3, %zmm2, %xmm4
	; AVX512BW-NEXT: vpextrw $1, %xmm4, %ecx			; AVX512BW-NEXT: vpextrw $1, %xmm4, %ecx
	; AVX512BW-NEXT: vextracti32x4 $3, %zmm0, %xmm5			; AVX512BW-NEXT: vextracti32x4 $3, %zmm0, %xmm5
	; AVX512BW-NEXT: vpextrw $1, %xmm5, %edx			; AVX512BW-NEXT: vpextrw $1, %xmm5, %edx
	; AVX512BW-NEXT: xorl %eax, %eax			; AVX512BW-NEXT: xorl %eax, %eax
	; AVX512BW-NEXT: cmpw %cx, %dx			; AVX512BW-NEXT: cmpw %cx, %dx
	; AVX512BW-NEXT: movw $-1, %cx			; AVX512BW-NEXT: movl $65535, %ecx # imm = 0xFFFF
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vmovd %xmm4, %esi			; AVX512BW-NEXT: vmovd %xmm4, %esi
	; AVX512BW-NEXT: vmovd %xmm5, %edi			; AVX512BW-NEXT: vmovd %xmm5, %edi
	; AVX512BW-NEXT: cmpw %si, %di			; AVX512BW-NEXT: cmpw %si, %di
	; AVX512BW-NEXT: movl $0, %esi			; AVX512BW-NEXT: movl $0, %esi
	; AVX512BW-NEXT: cmovgw %cx, %si			; AVX512BW-NEXT: cmovgl %ecx, %esi
	; AVX512BW-NEXT: vmovd %esi, %xmm6			; AVX512BW-NEXT: vmovd %esi, %xmm6
	; AVX512BW-NEXT: vpinsrw $1, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $1, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $2, %xmm4, %edx			; AVX512BW-NEXT: vpextrw $2, %xmm4, %edx
	; AVX512BW-NEXT: vpextrw $2, %xmm5, %esi			; AVX512BW-NEXT: vpextrw $2, %xmm5, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $2, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $2, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $3, %xmm4, %edx			; AVX512BW-NEXT: vpextrw $3, %xmm4, %edx
	; AVX512BW-NEXT: vpextrw $3, %xmm5, %esi			; AVX512BW-NEXT: vpextrw $3, %xmm5, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $3, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $3, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $4, %xmm4, %edx			; AVX512BW-NEXT: vpextrw $4, %xmm4, %edx
	; AVX512BW-NEXT: vpextrw $4, %xmm5, %esi			; AVX512BW-NEXT: vpextrw $4, %xmm5, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $4, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $4, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $5, %xmm4, %edx			; AVX512BW-NEXT: vpextrw $5, %xmm4, %edx
	; AVX512BW-NEXT: vpextrw $5, %xmm5, %esi			; AVX512BW-NEXT: vpextrw $5, %xmm5, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $5, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $5, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $6, %xmm4, %edx			; AVX512BW-NEXT: vpextrw $6, %xmm4, %edx
	; AVX512BW-NEXT: vpextrw $6, %xmm5, %esi			; AVX512BW-NEXT: vpextrw $6, %xmm5, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $6, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $6, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $7, %xmm4, %edx			; AVX512BW-NEXT: vpextrw $7, %xmm4, %edx
	; AVX512BW-NEXT: vpextrw $7, %xmm5, %esi			; AVX512BW-NEXT: vpextrw $7, %xmm5, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $7, %edx, %xmm6, %xmm4			; AVX512BW-NEXT: vpinsrw $7, %edx, %xmm6, %xmm4
	; AVX512BW-NEXT: vextracti32x4 $2, %zmm2, %xmm5			; AVX512BW-NEXT: vextracti32x4 $2, %zmm2, %xmm5
	; AVX512BW-NEXT: vpextrw $1, %xmm5, %edx			; AVX512BW-NEXT: vpextrw $1, %xmm5, %edx
	; AVX512BW-NEXT: vextracti32x4 $2, %zmm0, %xmm6			; AVX512BW-NEXT: vextracti32x4 $2, %zmm0, %xmm6
	; AVX512BW-NEXT: vpextrw $1, %xmm6, %esi			; AVX512BW-NEXT: vpextrw $1, %xmm6, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vmovd %xmm5, %esi			; AVX512BW-NEXT: vmovd %xmm5, %esi
	; AVX512BW-NEXT: vmovd %xmm6, %edi			; AVX512BW-NEXT: vmovd %xmm6, %edi
	; AVX512BW-NEXT: cmpw %si, %di			; AVX512BW-NEXT: cmpw %si, %di
	; AVX512BW-NEXT: movl $0, %esi			; AVX512BW-NEXT: movl $0, %esi
	; AVX512BW-NEXT: cmovgw %cx, %si			; AVX512BW-NEXT: cmovgl %ecx, %esi
	; AVX512BW-NEXT: vmovd %esi, %xmm7			; AVX512BW-NEXT: vmovd %esi, %xmm7
	; AVX512BW-NEXT: vpinsrw $1, %edx, %xmm7, %xmm7			; AVX512BW-NEXT: vpinsrw $1, %edx, %xmm7, %xmm7
	; AVX512BW-NEXT: vpextrw $2, %xmm5, %edx			; AVX512BW-NEXT: vpextrw $2, %xmm5, %edx
	; AVX512BW-NEXT: vpextrw $2, %xmm6, %esi			; AVX512BW-NEXT: vpextrw $2, %xmm6, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $2, %edx, %xmm7, %xmm7			; AVX512BW-NEXT: vpinsrw $2, %edx, %xmm7, %xmm7
	; AVX512BW-NEXT: vpextrw $3, %xmm5, %edx			; AVX512BW-NEXT: vpextrw $3, %xmm5, %edx
	; AVX512BW-NEXT: vpextrw $3, %xmm6, %esi			; AVX512BW-NEXT: vpextrw $3, %xmm6, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $3, %edx, %xmm7, %xmm7			; AVX512BW-NEXT: vpinsrw $3, %edx, %xmm7, %xmm7
	; AVX512BW-NEXT: vpextrw $4, %xmm5, %edx			; AVX512BW-NEXT: vpextrw $4, %xmm5, %edx
	; AVX512BW-NEXT: vpextrw $4, %xmm6, %esi			; AVX512BW-NEXT: vpextrw $4, %xmm6, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $4, %edx, %xmm7, %xmm7			; AVX512BW-NEXT: vpinsrw $4, %edx, %xmm7, %xmm7
	; AVX512BW-NEXT: vpextrw $5, %xmm5, %edx			; AVX512BW-NEXT: vpextrw $5, %xmm5, %edx
	; AVX512BW-NEXT: vpextrw $5, %xmm6, %esi			; AVX512BW-NEXT: vpextrw $5, %xmm6, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $5, %edx, %xmm7, %xmm7			; AVX512BW-NEXT: vpinsrw $5, %edx, %xmm7, %xmm7
	; AVX512BW-NEXT: vpextrw $6, %xmm5, %edx			; AVX512BW-NEXT: vpextrw $6, %xmm5, %edx
	; AVX512BW-NEXT: vpextrw $6, %xmm6, %esi			; AVX512BW-NEXT: vpextrw $6, %xmm6, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $6, %edx, %xmm7, %xmm7			; AVX512BW-NEXT: vpinsrw $6, %edx, %xmm7, %xmm7
	; AVX512BW-NEXT: vpextrw $7, %xmm5, %edx			; AVX512BW-NEXT: vpextrw $7, %xmm5, %edx
	; AVX512BW-NEXT: vpextrw $7, %xmm6, %esi			; AVX512BW-NEXT: vpextrw $7, %xmm6, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $7, %edx, %xmm7, %xmm5			; AVX512BW-NEXT: vpinsrw $7, %edx, %xmm7, %xmm5
	; AVX512BW-NEXT: vinserti128 $1, %xmm4, %ymm5, %ymm4			; AVX512BW-NEXT: vinserti128 $1, %xmm4, %ymm5, %ymm4
	; AVX512BW-NEXT: vextracti128 $1, %ymm2, %xmm5			; AVX512BW-NEXT: vextracti128 $1, %ymm2, %xmm5
	; AVX512BW-NEXT: vpextrw $1, %xmm5, %edx			; AVX512BW-NEXT: vpextrw $1, %xmm5, %edx
	; AVX512BW-NEXT: vextracti128 $1, %ymm0, %xmm6			; AVX512BW-NEXT: vextracti128 $1, %ymm0, %xmm6
	; AVX512BW-NEXT: vpextrw $1, %xmm6, %esi			; AVX512BW-NEXT: vpextrw $1, %xmm6, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vmovd %xmm5, %esi			; AVX512BW-NEXT: vmovd %xmm5, %esi
	; AVX512BW-NEXT: vmovd %xmm6, %edi			; AVX512BW-NEXT: vmovd %xmm6, %edi
	; AVX512BW-NEXT: cmpw %si, %di			; AVX512BW-NEXT: cmpw %si, %di
	; AVX512BW-NEXT: movl $0, %esi			; AVX512BW-NEXT: movl $0, %esi
	; AVX512BW-NEXT: cmovgw %cx, %si			; AVX512BW-NEXT: cmovgl %ecx, %esi
	; AVX512BW-NEXT: vmovd %esi, %xmm7			; AVX512BW-NEXT: vmovd %esi, %xmm7
	; AVX512BW-NEXT: vpinsrw $1, %edx, %xmm7, %xmm7			; AVX512BW-NEXT: vpinsrw $1, %edx, %xmm7, %xmm7
	; AVX512BW-NEXT: vpextrw $2, %xmm5, %edx			; AVX512BW-NEXT: vpextrw $2, %xmm5, %edx
	; AVX512BW-NEXT: vpextrw $2, %xmm6, %esi			; AVX512BW-NEXT: vpextrw $2, %xmm6, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $2, %edx, %xmm7, %xmm7			; AVX512BW-NEXT: vpinsrw $2, %edx, %xmm7, %xmm7
	; AVX512BW-NEXT: vpextrw $3, %xmm5, %edx			; AVX512BW-NEXT: vpextrw $3, %xmm5, %edx
	; AVX512BW-NEXT: vpextrw $3, %xmm6, %esi			; AVX512BW-NEXT: vpextrw $3, %xmm6, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $3, %edx, %xmm7, %xmm7			; AVX512BW-NEXT: vpinsrw $3, %edx, %xmm7, %xmm7
	; AVX512BW-NEXT: vpextrw $4, %xmm5, %edx			; AVX512BW-NEXT: vpextrw $4, %xmm5, %edx
	; AVX512BW-NEXT: vpextrw $4, %xmm6, %esi			; AVX512BW-NEXT: vpextrw $4, %xmm6, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $4, %edx, %xmm7, %xmm7			; AVX512BW-NEXT: vpinsrw $4, %edx, %xmm7, %xmm7
	; AVX512BW-NEXT: vpextrw $5, %xmm5, %edx			; AVX512BW-NEXT: vpextrw $5, %xmm5, %edx
	; AVX512BW-NEXT: vpextrw $5, %xmm6, %esi			; AVX512BW-NEXT: vpextrw $5, %xmm6, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $5, %edx, %xmm7, %xmm7			; AVX512BW-NEXT: vpinsrw $5, %edx, %xmm7, %xmm7
	; AVX512BW-NEXT: vpextrw $6, %xmm5, %edx			; AVX512BW-NEXT: vpextrw $6, %xmm5, %edx
	; AVX512BW-NEXT: vpextrw $6, %xmm6, %esi			; AVX512BW-NEXT: vpextrw $6, %xmm6, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $6, %edx, %xmm7, %xmm7			; AVX512BW-NEXT: vpinsrw $6, %edx, %xmm7, %xmm7
	; AVX512BW-NEXT: vpextrw $7, %xmm5, %edx			; AVX512BW-NEXT: vpextrw $7, %xmm5, %edx
	; AVX512BW-NEXT: vpextrw $7, %xmm6, %esi			; AVX512BW-NEXT: vpextrw $7, %xmm6, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $7, %edx, %xmm7, %xmm5			; AVX512BW-NEXT: vpinsrw $7, %edx, %xmm7, %xmm5
	; AVX512BW-NEXT: vpextrw $1, %xmm2, %edx			; AVX512BW-NEXT: vpextrw $1, %xmm2, %edx
	; AVX512BW-NEXT: vpextrw $1, %xmm0, %esi			; AVX512BW-NEXT: vpextrw $1, %xmm0, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vmovd %xmm2, %esi			; AVX512BW-NEXT: vmovd %xmm2, %esi
	; AVX512BW-NEXT: vmovd %xmm0, %edi			; AVX512BW-NEXT: vmovd %xmm0, %edi
	; AVX512BW-NEXT: cmpw %si, %di			; AVX512BW-NEXT: cmpw %si, %di
	; AVX512BW-NEXT: movl $0, %esi			; AVX512BW-NEXT: movl $0, %esi
	; AVX512BW-NEXT: cmovgw %cx, %si			; AVX512BW-NEXT: cmovgl %ecx, %esi
	; AVX512BW-NEXT: vmovd %esi, %xmm6			; AVX512BW-NEXT: vmovd %esi, %xmm6
	; AVX512BW-NEXT: vpinsrw $1, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $1, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $2, %xmm2, %edx			; AVX512BW-NEXT: vpextrw $2, %xmm2, %edx
	; AVX512BW-NEXT: vpextrw $2, %xmm0, %esi			; AVX512BW-NEXT: vpextrw $2, %xmm0, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $2, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $2, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $3, %xmm2, %edx			; AVX512BW-NEXT: vpextrw $3, %xmm2, %edx
	; AVX512BW-NEXT: vpextrw $3, %xmm0, %esi			; AVX512BW-NEXT: vpextrw $3, %xmm0, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $3, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $3, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $4, %xmm2, %edx			; AVX512BW-NEXT: vpextrw $4, %xmm2, %edx
	; AVX512BW-NEXT: vpextrw $4, %xmm0, %esi			; AVX512BW-NEXT: vpextrw $4, %xmm0, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $4, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $4, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $5, %xmm2, %edx			; AVX512BW-NEXT: vpextrw $5, %xmm2, %edx
	; AVX512BW-NEXT: vpextrw $5, %xmm0, %esi			; AVX512BW-NEXT: vpextrw $5, %xmm0, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $5, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $5, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $6, %xmm2, %edx			; AVX512BW-NEXT: vpextrw $6, %xmm2, %edx
	; AVX512BW-NEXT: vpextrw $6, %xmm0, %esi			; AVX512BW-NEXT: vpextrw $6, %xmm0, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $6, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $6, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $7, %xmm2, %edx			; AVX512BW-NEXT: vpextrw $7, %xmm2, %edx
	; AVX512BW-NEXT: vpextrw $7, %xmm0, %esi			; AVX512BW-NEXT: vpextrw $7, %xmm0, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $7, %edx, %xmm6, %xmm0			; AVX512BW-NEXT: vpinsrw $7, %edx, %xmm6, %xmm0
	; AVX512BW-NEXT: vinserti128 $1, %xmm5, %ymm0, %ymm0			; AVX512BW-NEXT: vinserti128 $1, %xmm5, %ymm0, %ymm0
	; AVX512BW-NEXT: vinserti64x4 $1, %ymm4, %zmm0, %zmm0			; AVX512BW-NEXT: vinserti64x4 $1, %ymm4, %zmm0, %zmm0
	; AVX512BW-NEXT: vpmovwb %zmm0, %ymm0			; AVX512BW-NEXT: vpmovwb %zmm0, %ymm0
	; AVX512BW-NEXT: vextracti32x4 $3, %zmm3, %xmm2			; AVX512BW-NEXT: vextracti32x4 $3, %zmm3, %xmm2
	; AVX512BW-NEXT: vpextrw $1, %xmm2, %edx			; AVX512BW-NEXT: vpextrw $1, %xmm2, %edx
	; AVX512BW-NEXT: vextracti32x4 $3, %zmm1, %xmm4			; AVX512BW-NEXT: vextracti32x4 $3, %zmm1, %xmm4
	; AVX512BW-NEXT: vpextrw $1, %xmm4, %esi			; AVX512BW-NEXT: vpextrw $1, %xmm4, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vmovd %xmm2, %esi			; AVX512BW-NEXT: vmovd %xmm2, %esi
	; AVX512BW-NEXT: vmovd %xmm4, %edi			; AVX512BW-NEXT: vmovd %xmm4, %edi
	; AVX512BW-NEXT: cmpw %si, %di			; AVX512BW-NEXT: cmpw %si, %di
	; AVX512BW-NEXT: movl $0, %esi			; AVX512BW-NEXT: movl $0, %esi
	; AVX512BW-NEXT: cmovgw %cx, %si			; AVX512BW-NEXT: cmovgl %ecx, %esi
	; AVX512BW-NEXT: vmovd %esi, %xmm5			; AVX512BW-NEXT: vmovd %esi, %xmm5
	; AVX512BW-NEXT: vpinsrw $1, %edx, %xmm5, %xmm5			; AVX512BW-NEXT: vpinsrw $1, %edx, %xmm5, %xmm5
	; AVX512BW-NEXT: vpextrw $2, %xmm2, %edx			; AVX512BW-NEXT: vpextrw $2, %xmm2, %edx
	; AVX512BW-NEXT: vpextrw $2, %xmm4, %esi			; AVX512BW-NEXT: vpextrw $2, %xmm4, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $2, %edx, %xmm5, %xmm5			; AVX512BW-NEXT: vpinsrw $2, %edx, %xmm5, %xmm5
	; AVX512BW-NEXT: vpextrw $3, %xmm2, %edx			; AVX512BW-NEXT: vpextrw $3, %xmm2, %edx
	; AVX512BW-NEXT: vpextrw $3, %xmm4, %esi			; AVX512BW-NEXT: vpextrw $3, %xmm4, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $3, %edx, %xmm5, %xmm5			; AVX512BW-NEXT: vpinsrw $3, %edx, %xmm5, %xmm5
	; AVX512BW-NEXT: vpextrw $4, %xmm2, %edx			; AVX512BW-NEXT: vpextrw $4, %xmm2, %edx
	; AVX512BW-NEXT: vpextrw $4, %xmm4, %esi			; AVX512BW-NEXT: vpextrw $4, %xmm4, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $4, %edx, %xmm5, %xmm5			; AVX512BW-NEXT: vpinsrw $4, %edx, %xmm5, %xmm5
	; AVX512BW-NEXT: vpextrw $5, %xmm2, %edx			; AVX512BW-NEXT: vpextrw $5, %xmm2, %edx
	; AVX512BW-NEXT: vpextrw $5, %xmm4, %esi			; AVX512BW-NEXT: vpextrw $5, %xmm4, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $5, %edx, %xmm5, %xmm5			; AVX512BW-NEXT: vpinsrw $5, %edx, %xmm5, %xmm5
	; AVX512BW-NEXT: vpextrw $6, %xmm2, %edx			; AVX512BW-NEXT: vpextrw $6, %xmm2, %edx
	; AVX512BW-NEXT: vpextrw $6, %xmm4, %esi			; AVX512BW-NEXT: vpextrw $6, %xmm4, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $6, %edx, %xmm5, %xmm5			; AVX512BW-NEXT: vpinsrw $6, %edx, %xmm5, %xmm5
	; AVX512BW-NEXT: vpextrw $7, %xmm2, %edx			; AVX512BW-NEXT: vpextrw $7, %xmm2, %edx
	; AVX512BW-NEXT: vpextrw $7, %xmm4, %esi			; AVX512BW-NEXT: vpextrw $7, %xmm4, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $7, %edx, %xmm5, %xmm2			; AVX512BW-NEXT: vpinsrw $7, %edx, %xmm5, %xmm2
	; AVX512BW-NEXT: vextracti32x4 $2, %zmm3, %xmm4			; AVX512BW-NEXT: vextracti32x4 $2, %zmm3, %xmm4
	; AVX512BW-NEXT: vpextrw $1, %xmm4, %edx			; AVX512BW-NEXT: vpextrw $1, %xmm4, %edx
	; AVX512BW-NEXT: vextracti32x4 $2, %zmm1, %xmm5			; AVX512BW-NEXT: vextracti32x4 $2, %zmm1, %xmm5
	; AVX512BW-NEXT: vpextrw $1, %xmm5, %esi			; AVX512BW-NEXT: vpextrw $1, %xmm5, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vmovd %xmm4, %esi			; AVX512BW-NEXT: vmovd %xmm4, %esi
	; AVX512BW-NEXT: vmovd %xmm5, %edi			; AVX512BW-NEXT: vmovd %xmm5, %edi
	; AVX512BW-NEXT: cmpw %si, %di			; AVX512BW-NEXT: cmpw %si, %di
	; AVX512BW-NEXT: movl $0, %esi			; AVX512BW-NEXT: movl $0, %esi
	; AVX512BW-NEXT: cmovgw %cx, %si			; AVX512BW-NEXT: cmovgl %ecx, %esi
	; AVX512BW-NEXT: vmovd %esi, %xmm6			; AVX512BW-NEXT: vmovd %esi, %xmm6
	; AVX512BW-NEXT: vpinsrw $1, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $1, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $2, %xmm4, %edx			; AVX512BW-NEXT: vpextrw $2, %xmm4, %edx
	; AVX512BW-NEXT: vpextrw $2, %xmm5, %esi			; AVX512BW-NEXT: vpextrw $2, %xmm5, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $2, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $2, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $3, %xmm4, %edx			; AVX512BW-NEXT: vpextrw $3, %xmm4, %edx
	; AVX512BW-NEXT: vpextrw $3, %xmm5, %esi			; AVX512BW-NEXT: vpextrw $3, %xmm5, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $3, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $3, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $4, %xmm4, %edx			; AVX512BW-NEXT: vpextrw $4, %xmm4, %edx
	; AVX512BW-NEXT: vpextrw $4, %xmm5, %esi			; AVX512BW-NEXT: vpextrw $4, %xmm5, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $4, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $4, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $5, %xmm4, %edx			; AVX512BW-NEXT: vpextrw $5, %xmm4, %edx
	; AVX512BW-NEXT: vpextrw $5, %xmm5, %esi			; AVX512BW-NEXT: vpextrw $5, %xmm5, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $5, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $5, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $6, %xmm4, %edx			; AVX512BW-NEXT: vpextrw $6, %xmm4, %edx
	; AVX512BW-NEXT: vpextrw $6, %xmm5, %esi			; AVX512BW-NEXT: vpextrw $6, %xmm5, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $6, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $6, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $7, %xmm4, %edx			; AVX512BW-NEXT: vpextrw $7, %xmm4, %edx
	; AVX512BW-NEXT: vpextrw $7, %xmm5, %esi			; AVX512BW-NEXT: vpextrw $7, %xmm5, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $7, %edx, %xmm6, %xmm4			; AVX512BW-NEXT: vpinsrw $7, %edx, %xmm6, %xmm4
	; AVX512BW-NEXT: vinserti128 $1, %xmm2, %ymm4, %ymm2			; AVX512BW-NEXT: vinserti128 $1, %xmm2, %ymm4, %ymm2
	; AVX512BW-NEXT: vextracti128 $1, %ymm3, %xmm4			; AVX512BW-NEXT: vextracti128 $1, %ymm3, %xmm4
	; AVX512BW-NEXT: vpextrw $1, %xmm4, %edx			; AVX512BW-NEXT: vpextrw $1, %xmm4, %edx
	; AVX512BW-NEXT: vextracti128 $1, %ymm1, %xmm5			; AVX512BW-NEXT: vextracti128 $1, %ymm1, %xmm5
	; AVX512BW-NEXT: vpextrw $1, %xmm5, %esi			; AVX512BW-NEXT: vpextrw $1, %xmm5, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vmovd %xmm4, %esi			; AVX512BW-NEXT: vmovd %xmm4, %esi
	; AVX512BW-NEXT: vmovd %xmm5, %edi			; AVX512BW-NEXT: vmovd %xmm5, %edi
	; AVX512BW-NEXT: cmpw %si, %di			; AVX512BW-NEXT: cmpw %si, %di
	; AVX512BW-NEXT: movl $0, %esi			; AVX512BW-NEXT: movl $0, %esi
	; AVX512BW-NEXT: cmovgw %cx, %si			; AVX512BW-NEXT: cmovgl %ecx, %esi
	; AVX512BW-NEXT: vmovd %esi, %xmm6			; AVX512BW-NEXT: vmovd %esi, %xmm6
	; AVX512BW-NEXT: vpinsrw $1, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $1, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $2, %xmm4, %edx			; AVX512BW-NEXT: vpextrw $2, %xmm4, %edx
	; AVX512BW-NEXT: vpextrw $2, %xmm5, %esi			; AVX512BW-NEXT: vpextrw $2, %xmm5, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $2, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $2, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $3, %xmm4, %edx			; AVX512BW-NEXT: vpextrw $3, %xmm4, %edx
	; AVX512BW-NEXT: vpextrw $3, %xmm5, %esi			; AVX512BW-NEXT: vpextrw $3, %xmm5, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $3, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $3, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $4, %xmm4, %edx			; AVX512BW-NEXT: vpextrw $4, %xmm4, %edx
	; AVX512BW-NEXT: vpextrw $4, %xmm5, %esi			; AVX512BW-NEXT: vpextrw $4, %xmm5, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $4, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $4, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $5, %xmm4, %edx			; AVX512BW-NEXT: vpextrw $5, %xmm4, %edx
	; AVX512BW-NEXT: vpextrw $5, %xmm5, %esi			; AVX512BW-NEXT: vpextrw $5, %xmm5, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $5, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $5, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $6, %xmm4, %edx			; AVX512BW-NEXT: vpextrw $6, %xmm4, %edx
	; AVX512BW-NEXT: vpextrw $6, %xmm5, %esi			; AVX512BW-NEXT: vpextrw $6, %xmm5, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $6, %edx, %xmm6, %xmm6			; AVX512BW-NEXT: vpinsrw $6, %edx, %xmm6, %xmm6
	; AVX512BW-NEXT: vpextrw $7, %xmm4, %edx			; AVX512BW-NEXT: vpextrw $7, %xmm4, %edx
	; AVX512BW-NEXT: vpextrw $7, %xmm5, %esi			; AVX512BW-NEXT: vpextrw $7, %xmm5, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $7, %edx, %xmm6, %xmm4			; AVX512BW-NEXT: vpinsrw $7, %edx, %xmm6, %xmm4
	; AVX512BW-NEXT: vpextrw $1, %xmm3, %edx			; AVX512BW-NEXT: vpextrw $1, %xmm3, %edx
	; AVX512BW-NEXT: vpextrw $1, %xmm1, %esi			; AVX512BW-NEXT: vpextrw $1, %xmm1, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vmovd %xmm3, %esi			; AVX512BW-NEXT: vmovd %xmm3, %esi
	; AVX512BW-NEXT: vmovd %xmm1, %edi			; AVX512BW-NEXT: vmovd %xmm1, %edi
	; AVX512BW-NEXT: cmpw %si, %di			; AVX512BW-NEXT: cmpw %si, %di
	; AVX512BW-NEXT: movl $0, %esi			; AVX512BW-NEXT: movl $0, %esi
	; AVX512BW-NEXT: cmovgw %cx, %si			; AVX512BW-NEXT: cmovgl %ecx, %esi
	; AVX512BW-NEXT: vmovd %esi, %xmm5			; AVX512BW-NEXT: vmovd %esi, %xmm5
	; AVX512BW-NEXT: vpinsrw $1, %edx, %xmm5, %xmm5			; AVX512BW-NEXT: vpinsrw $1, %edx, %xmm5, %xmm5
	; AVX512BW-NEXT: vpextrw $2, %xmm3, %edx			; AVX512BW-NEXT: vpextrw $2, %xmm3, %edx
	; AVX512BW-NEXT: vpextrw $2, %xmm1, %esi			; AVX512BW-NEXT: vpextrw $2, %xmm1, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $2, %edx, %xmm5, %xmm5			; AVX512BW-NEXT: vpinsrw $2, %edx, %xmm5, %xmm5
	; AVX512BW-NEXT: vpextrw $3, %xmm3, %edx			; AVX512BW-NEXT: vpextrw $3, %xmm3, %edx
	; AVX512BW-NEXT: vpextrw $3, %xmm1, %esi			; AVX512BW-NEXT: vpextrw $3, %xmm1, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $3, %edx, %xmm5, %xmm5			; AVX512BW-NEXT: vpinsrw $3, %edx, %xmm5, %xmm5
	; AVX512BW-NEXT: vpextrw $4, %xmm3, %edx			; AVX512BW-NEXT: vpextrw $4, %xmm3, %edx
	; AVX512BW-NEXT: vpextrw $4, %xmm1, %esi			; AVX512BW-NEXT: vpextrw $4, %xmm1, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $4, %edx, %xmm5, %xmm5			; AVX512BW-NEXT: vpinsrw $4, %edx, %xmm5, %xmm5
	; AVX512BW-NEXT: vpextrw $5, %xmm3, %edx			; AVX512BW-NEXT: vpextrw $5, %xmm3, %edx
	; AVX512BW-NEXT: vpextrw $5, %xmm1, %esi			; AVX512BW-NEXT: vpextrw $5, %xmm1, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $5, %edx, %xmm5, %xmm5			; AVX512BW-NEXT: vpinsrw $5, %edx, %xmm5, %xmm5
	; AVX512BW-NEXT: vpextrw $6, %xmm3, %edx			; AVX512BW-NEXT: vpextrw $6, %xmm3, %edx
	; AVX512BW-NEXT: vpextrw $6, %xmm1, %esi			; AVX512BW-NEXT: vpextrw $6, %xmm1, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: movl $0, %edx			; AVX512BW-NEXT: movl $0, %edx
	; AVX512BW-NEXT: cmovgw %cx, %dx			; AVX512BW-NEXT: cmovgl %ecx, %edx
	; AVX512BW-NEXT: vpinsrw $6, %edx, %xmm5, %xmm5			; AVX512BW-NEXT: vpinsrw $6, %edx, %xmm5, %xmm5
	; AVX512BW-NEXT: vpextrw $7, %xmm3, %edx			; AVX512BW-NEXT: vpextrw $7, %xmm3, %edx
	; AVX512BW-NEXT: vpextrw $7, %xmm1, %esi			; AVX512BW-NEXT: vpextrw $7, %xmm1, %esi
	; AVX512BW-NEXT: cmpw %dx, %si			; AVX512BW-NEXT: cmpw %dx, %si
	; AVX512BW-NEXT: cmovgw %cx, %ax			; AVX512BW-NEXT: cmovgl %ecx, %eax
	; AVX512BW-NEXT: vpinsrw $7, %eax, %xmm5, %xmm1			; AVX512BW-NEXT: vpinsrw $7, %eax, %xmm5, %xmm1
	; AVX512BW-NEXT: vinserti128 $1, %xmm4, %ymm1, %ymm1			; AVX512BW-NEXT: vinserti128 $1, %xmm4, %ymm1, %ymm1
	; AVX512BW-NEXT: vinserti64x4 $1, %ymm2, %zmm1, %zmm1			; AVX512BW-NEXT: vinserti64x4 $1, %ymm2, %zmm1, %zmm1
	; AVX512BW-NEXT: vpmovwb %zmm1, %ymm1			; AVX512BW-NEXT: vpmovwb %zmm1, %ymm1
	; AVX512BW-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0			; AVX512BW-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	%1 = icmp sgt <64 x i16> %a0, %a1			%1 = icmp sgt <64 x i16> %a0, %a1
	ret <64 x i1> %1			ret <64 x i1> %1
	▲ Show 20 Lines • Show All 4,161 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Combining CMOVs with [ANY,SIGN,ZERO]_EXTEND for cases where CMOV has constant arguments
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 116342

llvm/trunk/lib/Target/X86/X86ISelLowering.cpp

llvm/trunk/test/CodeGen/X86/cmov-promotion.ll

llvm/trunk/test/CodeGen/X86/select.ll

llvm/trunk/test/CodeGen/X86/vector-compare-results.ll

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Combining CMOVs with [ANY,SIGN,ZERO]_EXTEND for cases where CMOV has constant argumentsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 116342

llvm/trunk/lib/Target/X86/X86ISelLowering.cpp

llvm/trunk/test/CodeGen/X86/cmov-promotion.ll

llvm/trunk/test/CodeGen/X86/select.ll

llvm/trunk/test/CodeGen/X86/vector-compare-results.ll

[X86] Combining CMOVs with [ANY,SIGN,ZERO]_EXTEND for cases where CMOV has constant arguments
ClosedPublic