Diff 110916

lib/Target/X86/X86SchedHaswell.td

Show All 17 Lines	def HaswellModel : SchedMachineModel {
let IssueWidth = 4;		let IssueWidth = 4;
let MicroOpBufferSize = 192; // Based on the reorder buffer.		let MicroOpBufferSize = 192; // Based on the reorder buffer.
let LoadLatency = 4;		let LoadLatency = 4;
let MispredictPenalty = 16;		let MispredictPenalty = 16;

// Based on the LSD (loop-stream detector) queue size and benchmarking data.		// Based on the LSD (loop-stream detector) queue size and benchmarking data.
let LoopMicroOpBufferSize = 50;		let LoopMicroOpBufferSize = 50;

// FIXME: SSE4 and AVX are unimplemented. This flag is set to allow		// This flag is set to allow the scheduler to assign a default model to
// the scheduler to assign a default model to unrecognized opcodes.		// unrecognized opcodes.
let CompleteModel = 0;		let CompleteModel = 0;
}		}

let SchedModel = HaswellModel in {		let SchedModel = HaswellModel in {

// Haswell can issue micro-ops to 8 different ports in one cycle.		// Haswell can issue micro-ops to 8 different ports in one cycle.

// Ports 0, 1, 5, and 6 handle all computation.		// Ports 0, 1, 5, and 6 handle all computation.
▲ Show 20 Lines • Show All 395 Lines • ▼ Show 20 Lines
// MOV.		// MOV.
// r16,m.		// r16,m.
def : InstRW<[WriteALULd], (instregex "MOV16rm")>;		def : InstRW<[WriteALULd], (instregex "MOV16rm")>;

// MOVSX, MOVZX.		// MOVSX, MOVZX.
// r,m.		// r,m.
def : InstRW<[WriteLoad], (instregex "MOV(S\|Z)X32rm(8\|16)")>;		def : InstRW<[WriteLoad], (instregex "MOV(S\|Z)X32rm(8\|16)")>;

// CMOVcc.
// r,r.
def : InstRW<[Write2P0156_Lat2],
(instregex "CMOV(O\|NO\|B\|AE\|E\|NE\|BE\|A\|S\|NS\|P\|NP\|L\|GE\|LE\|G)(16\|32\|64)rr")>;
// r,m.
def : InstRW<[Write2P0156_Lat2Ld, ReadAfterLd],
(instregex "CMOV(O\|NO\|B\|AE\|E\|NE\|BE\|A\|S\|NS\|P\|NP\|L\|GE\|LE\|G)(16\|32\|64)rm")>;

// XCHG.
// r,r.
def WriteXCHG : SchedWriteRes<[HWPort0156]> {
let Latency = 2;
let ResourceCycles = [3];
}

def : InstRW<[WriteXCHG], (instregex "XCHG(8\|16\|32\|64)rr", "XCHG(16\|32\|64)ar")>;

// r,m.
def WriteXCHGrm : SchedWriteRes<[]> {
let Latency = 21;
let NumMicroOps = 8;
}
def : InstRW<[WriteXCHGrm], (instregex "XCHG(8\|16\|32\|64)rm")>;

// XLAT.		// XLAT.
def WriteXLAT : SchedWriteRes<[]> {		def WriteXLAT : SchedWriteRes<[]> {
let Latency = 7;		let Latency = 7;
let NumMicroOps = 3;		let NumMicroOps = 3;
}		}
def : InstRW<[WriteXLAT], (instregex "XLAT")>;		def : InstRW<[WriteXLAT], (instregex "XLAT")>;

// PUSH.		// PUSH.
// m.		// m.
def : InstRW<[Write2P237_P4], (instregex "PUSH(16\|32)rmm")>;		def : InstRW<[Write2P237_P4], (instregex "PUSH(16\|32)rmm")>;

// PUSHF.
def WritePushF : SchedWriteRes<[HWPort1, HWPort4, HWPort237, HWPort06]> {
let NumMicroOps = 4;
}
def : InstRW<[WritePushF], (instregex "PUSHF(16\|32)")>;

// PUSHA.		// PUSHA.
def WritePushA : SchedWriteRes<[]> {		def WritePushA : SchedWriteRes<[]> {
let NumMicroOps = 19;		let NumMicroOps = 19;
}		}
def : InstRW<[WritePushA], (instregex "PUSHA(16\|32)")>;		def : InstRW<[WritePushA], (instregex "PUSHA(16\|32)")>;

// POP.		// POP.
// m.		// m.
def : InstRW<[Write2P237_P4], (instregex "POP(16\|32)rmm")>;		def : InstRW<[Write2P237_P4], (instregex "POP(16\|32)rmm")>;

// POPF.
def WritePopF : SchedWriteRes<[]> {
let NumMicroOps = 9;
}
def : InstRW<[WritePopF], (instregex "POPF(16\|32)")>;

// POPA.		// POPA.
def WritePopA : SchedWriteRes<[]> {		def WritePopA : SchedWriteRes<[]> {
let NumMicroOps = 18;		let NumMicroOps = 18;
}		}
def : InstRW<[WritePopA], (instregex "POPA(16\|32)")>;		def : InstRW<[WritePopA], (instregex "POPA(16\|32)")>;

// LAHF SAHF.
def : InstRW<[WriteP06], (instregex "(S\|L)AHF")>;

// BSWAP.
// r32.
def WriteBSwap32 : SchedWriteRes<[HWPort15]>;
def : InstRW<[WriteBSwap32], (instregex "BSWAP32r")>;

// r64.
def WriteBSwap64 : SchedWriteRes<[HWPort06, HWPort15]> {
let NumMicroOps = 2;
}
def : InstRW<[WriteBSwap64], (instregex "BSWAP64r")>;

// MOVBE.
// r16,m16 / r64,m64.
def : InstRW<[Write2P0156_Lat2Ld], (instregex "MOVBE(16\|64)rm")>;

// r32, m32.
def WriteMoveBE32rm : SchedWriteRes<[HWPort15, HWPort23]> {
let NumMicroOps = 2;
}
def : InstRW<[WriteMoveBE32rm], (instregex "MOVBE32rm")>;

// m16,r16.
def WriteMoveBE16mr : SchedWriteRes<[HWPort06, HWPort237, HWPort4]> {
let NumMicroOps = 3;
}
def : InstRW<[WriteMoveBE16mr], (instregex "MOVBE16mr")>;

// m32,r32.
def WriteMoveBE32mr : SchedWriteRes<[HWPort15, HWPort237, HWPort4]> {
let NumMicroOps = 3;
}
def : InstRW<[WriteMoveBE32mr], (instregex "MOVBE32mr")>;

// m64,r64.
def WriteMoveBE64mr : SchedWriteRes<[HWPort06, HWPort15, HWPort237, HWPort4]> {
let NumMicroOps = 4;
}
def : InstRW<[WriteMoveBE64mr], (instregex "MOVBE64mr")>;

//-- Arithmetic instructions --//		//-- Arithmetic instructions --//

// ADD SUB.
// m,r/i.
def : InstRW<[Write2P0156_2P237_P4],
(instregex "(ADD\|SUB)(8\|16\|32\|64)m(r\|i)",
"(ADD\|SUB)(8\|16\|32\|64)mi8", "(ADD\|SUB)64mi32")>;

// ADC SBB.
// r,r/i.
def : InstRW<[Write2P0156_Lat2], (instregex "(ADC\|SBB)(8\|16\|32\|64)r(r\|i)",
"(ADC\|SBB)(16\|32\|64)ri8",
"(ADC\|SBB)64ri32",
"(ADC\|SBB)(8\|16\|32\|64)rr_REV")>;

// r,m.
def : InstRW<[Write2P0156_Lat2Ld, ReadAfterLd], (instregex "(ADC\|SBB)(8\|16\|32\|64)rm")>;

// m,r/i.
def : InstRW<[Write3P0156_2P237_P4],
(instregex "(ADC\|SBB)(8\|16\|32\|64)m(r\|i)",
"(ADC\|SBB)(16\|32\|64)mi8",
"(ADC\|SBB)64mi32")>;

// INC DEC NOT NEG.
// m.
def : InstRW<[WriteP0156_2P237_P4],
(instregex "(INC\|DEC\|NOT\|NEG)(8\|16\|32\|64)m",
"(INC\|DEC)64(16\|32)m")>;

// MUL IMUL.		// MUL IMUL.
// r16.
def WriteMul16 : SchedWriteRes<[HWPort1, HWPort0156]> {
let Latency = 4;
let NumMicroOps = 4;
}
def : InstRW<[WriteMul16], (instregex "IMUL16r", "MUL16r")>;

// m16.
def WriteMul16Ld : SchedWriteRes<[HWPort1, HWPort0156, HWPort23]> {
let Latency = 8;
let NumMicroOps = 5;
}
def : InstRW<[WriteMul16Ld], (instregex "IMUL16m", "MUL16m")>;

// r32.
def WriteMul32 : SchedWriteRes<[HWPort1, HWPort0156]> {
let Latency = 4;
let NumMicroOps = 3;
}
def : InstRW<[WriteMul32], (instregex "IMUL32r", "MUL32r")>;

// m32.
def WriteMul32Ld : SchedWriteRes<[HWPort1, HWPort0156, HWPort23]> {
let Latency = 8;
let NumMicroOps = 4;
}
def : InstRW<[WriteMul32Ld], (instregex "IMUL32m", "MUL32m")>;

// r64.
def WriteMul64 : SchedWriteRes<[HWPort1, HWPort6]> {
let Latency = 3;
let NumMicroOps = 2;
}
def : InstRW<[WriteMul64], (instregex "IMUL64r", "MUL64r")>;

// m64.
def WriteMul64Ld : SchedWriteRes<[HWPort1, HWPort6, HWPort23]> {
let Latency = 7;
let NumMicroOps = 3;
}
def : InstRW<[WriteMul64Ld], (instregex "IMUL64m", "MUL64m")>;

// r16,r16.		// r16,r16.
def WriteMul16rri : SchedWriteRes<[HWPort1, HWPort0156]> {		def WriteMul16rri : SchedWriteRes<[HWPort1, HWPort0156]> {
let Latency = 4;		let Latency = 4;
let NumMicroOps = 2;		let NumMicroOps = 2;
}		}
def : InstRW<[WriteMul16rri], (instregex "IMUL16rri", "IMUL16rri8")>;		def : InstRW<[WriteMul16rri], (instregex "IMUL16rri", "IMUL16rri8")>;

// r16,m16.		// r16,m16.
def WriteMul16rmi : SchedWriteRes<[HWPort1, HWPort0156, HWPort23]> {		def WriteMul16rmi : SchedWriteRes<[HWPort1, HWPort0156, HWPort23]> {
let Latency = 8;		let Latency = 8;
let NumMicroOps = 3;		let NumMicroOps = 3;
}		}
def : InstRW<[WriteMul16rmi], (instregex "IMUL16rmi", "IMUL16rmi8")>;		def : InstRW<[WriteMul16rmi], (instregex "IMUL16rmi", "IMUL16rmi8")>;

// MULX.
// r32,r32,r32.
def WriteMulX32 : SchedWriteRes<[HWPort1, HWPort056]> {
let Latency = 4;
let NumMicroOps = 3;
let ResourceCycles = [1, 2];
}
def : InstRW<[WriteMulX32], (instregex "MULX32rr")>;

// r32,r32,m32.
def WriteMulX32Ld : SchedWriteRes<[HWPort1, HWPort056, HWPort23]> {
let Latency = 8;
let NumMicroOps = 4;
let ResourceCycles = [1, 2, 1];
}
def : InstRW<[WriteMulX32Ld], (instregex "MULX32rm")>;

// r64,r64,r64.
def WriteMulX64 : SchedWriteRes<[HWPort1, HWPort6]> {
let Latency = 4;
let NumMicroOps = 2;
}
def : InstRW<[WriteMulX64], (instregex "MULX64rr")>;

// r64,r64,m64.
def WriteMulX64Ld : SchedWriteRes<[HWPort1, HWPort6, HWPort23]> {
let Latency = 8;
let NumMicroOps = 3;
}
def : InstRW<[WriteMulX64Ld], (instregex "MULX64rm")>;

// DIV.		// DIV.
// r8.		// r8.
def WriteDiv8 : SchedWriteRes<[HWPort0, HWPort1, HWPort5, HWPort6]> {		def WriteDiv8 : SchedWriteRes<[HWPort0, HWPort1, HWPort5, HWPort6]> {
let Latency = 22;		let Latency = 22;
let NumMicroOps = 9;		let NumMicroOps = 9;
}		}
def : InstRW<[WriteDiv8], (instregex "DIV8r")>;		def : InstRW<[WriteDiv8], (instregex "DIV8r")>;

// r16.
def WriteDiv16 : SchedWriteRes<[HWPort0, HWPort1, HWPort5, HWPort6]> {
let Latency = 23;
let NumMicroOps = 10;
}
def : InstRW<[WriteDiv16], (instregex "DIV16r")>;

// r32.
def WriteDiv32 : SchedWriteRes<[HWPort0, HWPort1, HWPort5, HWPort6]> {
let Latency = 22;
let NumMicroOps = 10;
}
def : InstRW<[WriteDiv32], (instregex "DIV32r")>;

// r64.
def WriteDiv64 : SchedWriteRes<[HWPort0, HWPort1, HWPort5, HWPort6]> {
let Latency = 32;
let NumMicroOps = 36;
}
def : InstRW<[WriteDiv64], (instregex "DIV64r")>;

// IDIV.		// IDIV.
// r8.		// r8.
def WriteIDiv8 : SchedWriteRes<[HWPort0, HWPort1, HWPort5, HWPort6]> {		def WriteIDiv8 : SchedWriteRes<[HWPort0, HWPort1, HWPort5, HWPort6]> {
let Latency = 23;		let Latency = 23;
let NumMicroOps = 9;		let NumMicroOps = 9;
}		}
def : InstRW<[WriteIDiv8], (instregex "IDIV8r")>;		def : InstRW<[WriteIDiv8], (instregex "IDIV8r")>;

// r16.
def WriteIDiv16 : SchedWriteRes<[HWPort0, HWPort1, HWPort5, HWPort6]> {
let Latency = 23;
let NumMicroOps = 10;
}
def : InstRW<[WriteIDiv16], (instregex "IDIV16r")>;

// r32.
def WriteIDiv32 : SchedWriteRes<[HWPort0, HWPort1, HWPort5, HWPort6]> {
let Latency = 22;
let NumMicroOps = 9;
}
def : InstRW<[WriteIDiv32], (instregex "IDIV32r")>;

// r64.
def WriteIDiv64 : SchedWriteRes<[HWPort0, HWPort1, HWPort5, HWPort6]> {
let Latency = 39;
let NumMicroOps = 59;
}
def : InstRW<[WriteIDiv64], (instregex "IDIV64r")>;

//-- Logic instructions --//

// AND OR XOR.
// m,r/i.
def : InstRW<[Write2P0156_2P237_P4],
(instregex "(AND\|OR\|XOR)(8\|16\|32\|64)m(r\|i)",
"(AND\|OR\|XOR)(8\|16\|32\|64)mi8", "(AND\|OR\|XOR)64mi32")>;

// SHR SHL SAR.
// m,i.
def WriteShiftRMW : SchedWriteRes<[HWPort06, HWPort237, HWPort4]> {
let NumMicroOps = 4;
let ResourceCycles = [2, 1, 1];
}
def : InstRW<[WriteShiftRMW], (instregex "S(A\|H)(R\|L)(8\|16\|32\|64)m(i\|1)")>;

// r,cl.
def : InstRW<[Write3P06_Lat2], (instregex "S(A\|H)(R\|L)(8\|16\|32\|64)rCL")>;

// m,cl.
def WriteShiftClLdRMW : SchedWriteRes<[HWPort06, HWPort23, HWPort4]> {
let NumMicroOps = 6;
let ResourceCycles = [3, 2, 1];
}
def : InstRW<[WriteShiftClLdRMW], (instregex "S(A\|H)(R\|L)(8\|16\|32\|64)mCL")>;

// ROR ROL.
// r,1.
def : InstRW<[Write2P06], (instregex "RO(R\|L)(8\|16\|32\|64)r1")>;

// m,i.
def WriteRotateRMW : SchedWriteRes<[HWPort06, HWPort237, HWPort4]> {
let NumMicroOps = 5;
let ResourceCycles = [2, 2, 1];
}
def : InstRW<[WriteRotateRMW], (instregex "RO(R\|L)(8\|16\|32\|64)mi")>;

// r,cl.
def : InstRW<[Write3P06_Lat2], (instregex "RO(R\|L)(8\|16\|32\|64)rCL")>;

// m,cl.
def WriteRotateRMWCL : SchedWriteRes<[]> {
let NumMicroOps = 6;
}
def : InstRW<[WriteRotateRMWCL], (instregex "RO(R\|L)(8\|16\|32\|64)mCL")>;

// RCR RCL.
// r,1.
def WriteRCr1 : SchedWriteRes<[HWPort06, HWPort0156]> {
let Latency = 2;
let NumMicroOps = 3;
let ResourceCycles = [2, 1];
}
def : InstRW<[WriteRCr1], (instregex "RC(R\|L)(8\|16\|32\|64)r1")>;

// m,1.
def WriteRCm1 : SchedWriteRes<[]> {
let NumMicroOps = 6;
}
def : InstRW<[WriteRCm1], (instregex "RC(R\|L)(8\|16\|32\|64)m1")>;

// r,i.
def WriteRCri : SchedWriteRes<[HWPort0156]> {
let Latency = 6;
let NumMicroOps = 8;
}
def : InstRW<[WriteRCri], (instregex "RC(R\|L)(8\|16\|32\|64)r(i\|CL)")>;

// m,i.
def WriteRCmi : SchedWriteRes<[]> {
let NumMicroOps = 11;
}
def : InstRW<[WriteRCmi], (instregex "RC(R\|L)(8\|16\|32\|64)m(i\|CL)")>;

// SHRD SHLD.
// r,r,i.
def WriteShDrr : SchedWriteRes<[HWPort1]> {
let Latency = 3;
}
def : InstRW<[WriteShDrr], (instregex "SH(R\|L)D(16\|32\|64)rri8")>;

// m,r,i.
def WriteShDmr : SchedWriteRes<[]> {
let NumMicroOps = 5;
}
def : InstRW<[WriteShDmr], (instregex "SH(R\|L)D(16\|32\|64)mri8")>;

// r,r,cl.
def WriteShlDCL : SchedWriteRes<[HWPort0156]> {
let Latency = 3;
let NumMicroOps = 4;
}
def : InstRW<[WriteShlDCL], (instregex "SHLD(16\|32\|64)rrCL")>;

// r,r,cl.
def WriteShrDCL : SchedWriteRes<[HWPort0156]> {
let Latency = 4;
let NumMicroOps = 4;
}
def : InstRW<[WriteShrDCL], (instregex "SHRD(16\|32\|64)rrCL")>;

// m,r,cl.
def WriteShDmrCL : SchedWriteRes<[]> {
let NumMicroOps = 7;
}
def : InstRW<[WriteShDmrCL], (instregex "SH(R\|L)D(16\|32\|64)mrCL")>;

// BT.		// BT.
// r,r/i.
def : InstRW<[WriteShift], (instregex "BT(16\|32\|64)r(r\|i8)")>;

// m,r.		// m,r.
def WriteBTmr : SchedWriteRes<[]> {		def WriteBTmr : SchedWriteRes<[]> {
let NumMicroOps = 10;		let NumMicroOps = 10;
}		}
def : InstRW<[WriteBTmr], (instregex "BT(16\|32\|64)mr")>;		def : InstRW<[WriteBTmr], (instregex "BT(16\|32\|64)mr")>;

// m,i.		// m,i.
def : InstRW<[WriteShiftLd], (instregex "BT(16\|32\|64)mi8")>;		def : InstRW<[WriteShiftLd], (instregex "BT(16\|32\|64)mi8")>;

// BTR BTS BTC.		// BTR BTS BTC.
// r,r,i.
def : InstRW<[WriteShift], (instregex "BT(R\|S\|C)(16\|32\|64)r(r\|i8)")>;

// m,r.		// m,r.
def WriteBTRSCmr : SchedWriteRes<[]> {		def WriteBTRSCmr : SchedWriteRes<[]> {
let NumMicroOps = 11;		let NumMicroOps = 11;
}		}
def : InstRW<[WriteBTRSCmr], (instregex "BT(R\|S\|C)(16\|32\|64)mr")>;		def : InstRW<[WriteBTRSCmr], (instregex "BT(R\|S\|C)(16\|32\|64)mr")>;

// m,i.
def : InstRW<[WriteShiftLd], (instregex "BT(R\|S\|C)(16\|32\|64)mi8")>;

// BSF BSR.
// r,r.
def : InstRW<[WriteP1_Lat3], (instregex "BS(R\|F)(16\|32\|64)rr")>;
// r,m.
def : InstRW<[WriteP1_Lat3Ld], (instregex "BS(R\|F)(16\|32\|64)rm")>;

// SETcc.
// r.
def : InstRW<[WriteShift],
(instregex "SET(O\|NO\|B\|AE\|E\|NE\|BE\|A\|S\|NS\|P\|NP\|L\|GE\|LE\|G)r")>;
// m.
def WriteSetCCm : SchedWriteRes<[HWPort06, HWPort237, HWPort4]> {
let NumMicroOps = 3;
}
def : InstRW<[WriteSetCCm],
(instregex "SET(O\|NO\|B\|AE\|E\|NE\|BE\|A\|S\|NS\|P\|NP\|L\|GE\|LE\|G)m")>;

// CLD STD.
def WriteCldStd : SchedWriteRes<[HWPort15, HWPort6]> {
let NumMicroOps = 3;
}
def : InstRW<[WriteCldStd], (instregex "STD", "CLD")>;

// LZCNT TZCNT.
// r,r.
def : InstRW<[WriteP1_Lat3], (instregex "(L\|TZCNT)(16\|32\|64)rr")>;
// r,m.
def : InstRW<[WriteP1_Lat3Ld], (instregex "(L\|TZCNT)(16\|32\|64)rm")>;

// ANDN.
// r,r.
def : InstRW<[WriteP15], (instregex "ANDN(32\|64)rr")>;
// r,m.
def : InstRW<[WriteP15Ld], (instregex "ANDN(32\|64)rm")>;

// BLSI BLSMSK BLSR.
// r,r.
def : InstRW<[WriteP15], (instregex "BLS(I\|MSK\|R)(32\|64)rr")>;
// r,m.
def : InstRW<[WriteP15Ld], (instregex "BLS(I\|MSK\|R)(32\|64)rm")>;

// BEXTR.
// r,r,r.
def : InstRW<[Write2P0156_Lat2], (instregex "BEXTR(32\|64)rr")>;
// r,m,r.
def : InstRW<[Write2P0156_Lat2Ld], (instregex "BEXTR(32\|64)rm")>;

// BZHI.
// r,r,r.
def : InstRW<[WriteP15], (instregex "BZHI(32\|64)rr")>;
// r,m,r.
def : InstRW<[WriteP15Ld], (instregex "BZHI(32\|64)rm")>;

// PDEP PEXT.
// r,r,r.
def : InstRW<[WriteP1_Lat3], (instregex "PDEP(32\|64)rr", "PEXT(32\|64)rr")>;
// r,m,r.
def : InstRW<[WriteP1_Lat3Ld], (instregex "PDEP(32\|64)rm", "PEXT(32\|64)rm")>;

//-- Control transfer instructions --//		//-- Control transfer instructions --//

// J(E\|R)CXZ.
def WriteJCXZ : SchedWriteRes<[HWPort0156, HWPort6]> {
let NumMicroOps = 2;
}
def : InstRW<[WriteJCXZ], (instregex "JCXZ", "JECXZ_(32\|64)", "JRCXZ")>;

// LOOP.
def WriteLOOP : SchedWriteRes<[]> {
let NumMicroOps = 7;
}
def : InstRW<[WriteLOOP], (instregex "LOOP")>;

// LOOP(N)E
def WriteLOOPE : SchedWriteRes<[]> {
let NumMicroOps = 11;
}
def : InstRW<[WriteLOOPE], (instregex "LOOPE", "LOOPNE")>;

// CALL.		// CALL.
// r.
def WriteCALLr : SchedWriteRes<[HWPort237, HWPort4, HWPort6]> {
let NumMicroOps = 3;
}
def : InstRW<[WriteCALLr], (instregex "CALL(16\|32)r")>;

// m.
def WriteCALLm : SchedWriteRes<[HWPort237, HWPort4, HWPort6]> {
let NumMicroOps = 4;
let ResourceCycles = [2, 1, 1];
}
def : InstRW<[WriteCALLm], (instregex "CALL(16\|32)m")>;

// RET.
def WriteRET : SchedWriteRes<[HWPort237, HWPort6]> {
let NumMicroOps = 2;
}
def : InstRW<[WriteRET], (instregex "RET(L\|Q\|W)", "LRET(L\|Q\|W)")>;

// i.		// i.
def WriteRETI : SchedWriteRes<[HWPort23, HWPort6, HWPort015]> {		def WriteRETI : SchedWriteRes<[HWPort23, HWPort6, HWPort015]> {
let NumMicroOps = 4;		let NumMicroOps = 4;
let ResourceCycles = [1, 2, 1];		let ResourceCycles = [1, 2, 1];
}		}
def : InstRW<[WriteRETI], (instregex "RETI(L\|Q\|W)", "LRETI(L\|Q\|W)")>;		def : InstRW<[WriteRETI], (instregex "RETI(L\|Q\|W)", "LRETI(L\|Q\|W)")>;

// BOUND.		// BOUND.
Show All 12 Lines
//-- String instructions --//		//-- String instructions --//

// LODSB/W.		// LODSB/W.
def : InstRW<[Write2P0156_P23], (instregex "LODS(B\|W)")>;		def : InstRW<[Write2P0156_P23], (instregex "LODS(B\|W)")>;

// LODSD/Q.		// LODSD/Q.
def : InstRW<[WriteP0156_P23], (instregex "LODS(L\|Q)")>;		def : InstRW<[WriteP0156_P23], (instregex "LODS(L\|Q)")>;

// STOS.
def WriteSTOS : SchedWriteRes<[HWPort23, HWPort0156, HWPort4]> {
let NumMicroOps = 3;
}
def : InstRW<[WriteSTOS], (instregex "STOS(B\|L\|Q\|W)")>;

// MOVS.		// MOVS.
def WriteMOVS : SchedWriteRes<[HWPort23, HWPort4, HWPort0156]> {		def WriteMOVS : SchedWriteRes<[HWPort23, HWPort4, HWPort0156]> {
let Latency = 4;		let Latency = 4;
let NumMicroOps = 5;		let NumMicroOps = 5;
let ResourceCycles = [2, 1, 2];		let ResourceCycles = [2, 1, 2];
}		}
def : InstRW<[WriteMOVS], (instregex "MOVS(B\|L\|Q\|W)")>;		def : InstRW<[WriteMOVS], (instregex "MOVS(B\|L\|Q\|W)")>;

// SCAS.		// SCAS.
def : InstRW<[Write2P0156_P23], (instregex "SCAS(B\|W\|L\|Q)")>;		def : InstRW<[Write2P0156_P23], (instregex "SCAS(B\|W\|L\|Q)")>;

// CMPS.		// CMPS.
def WriteCMPS : SchedWriteRes<[HWPort23, HWPort0156]> {		def WriteCMPS : SchedWriteRes<[HWPort23, HWPort0156]> {
let Latency = 4;		let Latency = 4;
let NumMicroOps = 5;		let NumMicroOps = 5;
let ResourceCycles = [2, 3];		let ResourceCycles = [2, 3];
}		}
def : InstRW<[WriteCMPS], (instregex "CMPS(B\|L\|Q\|W)")>;		def : InstRW<[WriteCMPS], (instregex "CMPS(B\|L\|Q\|W)")>;

//-- Synchronization instructions --//

// XADD.
def WriteXADD : SchedWriteRes<[]> {
let NumMicroOps = 5;
}
def : InstRW<[WriteXADD], (instregex "XADD(8\|16\|32\|64)rm")>;

// CMPXCHG.
def WriteCMPXCHG : SchedWriteRes<[]> {
let NumMicroOps = 6;
}
def : InstRW<[WriteCMPXCHG], (instregex "CMPXCHG(8\|16\|32\|64)rm")>;

// CMPXCHG8B.
def WriteCMPXCHG8B : SchedWriteRes<[]> {
let NumMicroOps = 15;
}
def : InstRW<[WriteCMPXCHG8B], (instregex "CMPXCHG8B")>;

// CMPXCHG16B.
def WriteCMPXCHG16B : SchedWriteRes<[]> {
let NumMicroOps = 22;
}
def : InstRW<[WriteCMPXCHG16B], (instregex "CMPXCHG16B")>;

//-- Other --//		//-- Other --//

// PAUSE.		// RDPMC.f
def WritePAUSE : SchedWriteRes<[HWPort05, HWPort6]> {
let NumMicroOps = 5;
let ResourceCycles = [1, 3];
}
def : InstRW<[WritePAUSE], (instregex "PAUSE")>;

// LEAVE.
def : InstRW<[Write2P0156_P23], (instregex "LEAVE")>;

// XGETBV.
def WriteXGETBV : SchedWriteRes<[]> {
let NumMicroOps = 8;
}
def : InstRW<[WriteXGETBV], (instregex "XGETBV")>;

// RDTSC.
def WriteRDTSC : SchedWriteRes<[]> {
let NumMicroOps = 15;
}
def : InstRW<[WriteRDTSC], (instregex "RDTSC")>;

// RDPMC.
def WriteRDPMC : SchedWriteRes<[]> {		def WriteRDPMC : SchedWriteRes<[]> {
let NumMicroOps = 34;		let NumMicroOps = 34;
}		}
def : InstRW<[WriteRDPMC], (instregex "RDPMC")>;		def : InstRW<[WriteRDPMC], (instregex "RDPMC")>;

// RDRAND.		// RDRAND.
def WriteRDRAND : SchedWriteRes<[HWPort23, HWPort015]> {		def WriteRDRAND : SchedWriteRes<[HWPort23, HWPort015]> {
let NumMicroOps = 17;		let NumMicroOps = 17;
let ResourceCycles = [1, 16];		let ResourceCycles = [1, 16];
}		}
def : InstRW<[WriteRDRAND], (instregex "RDRAND(16\|32\|64)r")>;		def : InstRW<[WriteRDRAND], (instregex "RDRAND(16\|32\|64)r")>;

//=== Floating Point x87 Instructions ===//		//=== Floating Point x87 Instructions ===//
//-- Move instructions --//		//-- Move instructions --//

// FLD.		// FLD.
// m80.		// m80.
def : InstRW<[WriteP01], (instregex "LD_Frr")>;		def : InstRW<[WriteP01], (instregex "LD_Frr")>;

def WriteLD_F80m : SchedWriteRes<[HWPort01, HWPort23]> {
let Latency = 4;
let NumMicroOps = 4;
let ResourceCycles = [2, 2];
}
def : InstRW<[WriteLD_F80m], (instregex "LD_F80m")>;

// FBLD.		// FBLD.
// m80.		// m80.
def WriteFBLD : SchedWriteRes<[]> {		def WriteFBLD : SchedWriteRes<[]> {
let Latency = 47;		let Latency = 47;
let NumMicroOps = 43;		let NumMicroOps = 43;
}		}
def : InstRW<[WriteFBLD], (instregex "FBLDm")>;		def : InstRW<[WriteFBLD], (instregex "FBLDm")>;

// FST(P).		// FST(P).
// r.		// r.
def : InstRW<[WriteP01], (instregex "ST_(F\|FP)rr")>;		def : InstRW<[WriteP01], (instregex "ST_(F\|FP)rr")>;

// m80.		// FLDZ.
def WriteST_FP80m : SchedWriteRes<[HWPort0156, HWPort23, HWPort4]> {
let NumMicroOps = 7;
let ResourceCycles = [3, 2, 2];
}
def : InstRW<[WriteST_FP80m], (instregex "ST_FP80m")>;

// FBSTP.
// m80.
def WriteFBSTP : SchedWriteRes<[]> {
let NumMicroOps = 226;
}
def : InstRW<[WriteFBSTP], (instregex "FBSTPm")>;

// FXCHG.
def : InstRW<[WriteNop], (instregex "XCH_F")>;

// FILD.
def WriteFILD : SchedWriteRes<[HWPort01, HWPort23]> {
let Latency = 6;
let NumMicroOps = 2;
}
def : InstRW<[WriteFILD], (instregex "ILD_F(16\|32\|64)m")>;

// FIST(P) FISTTP.
def WriteFIST : SchedWriteRes<[HWPort1, HWPort23, HWPort4]> {
let Latency = 7;
let NumMicroOps = 3;
}
def : InstRW<[WriteFIST], (instregex "IST_(F\|FP)(16\|32)m")>;

// FLDZ.
def : InstRW<[WriteP01], (instregex "LD_F0")>;		def : InstRW<[WriteP01], (instregex "LD_F0")>;

// FLD1.
def : InstRW<[Write2P01], (instregex "LD_F1")>;

// FLDPI FLDL2E etc.		// FLDPI FLDL2E etc.
def : InstRW<[Write2P01], (instregex "FLDPI", "FLDL2(T\|E)" "FLDL(G\|N)2")>;		def : InstRW<[Write2P01], (instregex "FLDPI", "FLDL2(T\|E)" "FLDL(G\|N)2")>;

// FCMOVcc.
def WriteFCMOVcc : SchedWriteRes<[HWPort0, HWPort5]> {
let Latency = 2;
let NumMicroOps = 3;
let ResourceCycles = [2, 1];
}
def : InstRW<[WriteFCMOVcc], (instregex "CMOV(B\|BE\|P\|NB\|NBE\|NE\|NP)_F")>;

// FNSTSW.
// AX.
def WriteFNSTSW : SchedWriteRes<[HWPort0, HWPort0156]> {
let NumMicroOps = 2;
}
def : InstRW<[WriteFNSTSW], (instregex "FNSTSW16r")>;

// m16.
def WriteFNSTSWm : SchedWriteRes<[HWPort0, HWPort4, HWPort237]> {
let Latency = 6;
let NumMicroOps = 3;
}
def : InstRW<[WriteFNSTSWm], (instregex "FNSTSWm")>;

// FLDCW.
def WriteFLDCW : SchedWriteRes<[HWPort01, HWPort23, HWPort6]> {
let Latency = 7;
let NumMicroOps = 3;
}
def : InstRW<[WriteFLDCW], (instregex "FLDCW16m")>;

// FNSTCW.
def WriteFNSTCW : SchedWriteRes<[HWPort237, HWPort4, HWPort6]> {
let NumMicroOps = 3;
}
def : InstRW<[WriteFNSTCW], (instregex "FNSTCW16m")>;

// FINCSTP FDECSTP.
def : InstRW<[WriteP01], (instregex "FINCSTP", "FDECSTP")>;

// FFREE.		// FFREE.
def : InstRW<[WriteP01], (instregex "FFREE")>;		def : InstRW<[WriteP01], (instregex "FFREE")>;

// FNSAVE.		// FNSAVE.
def WriteFNSAVE : SchedWriteRes<[]> {		def WriteFNSAVE : SchedWriteRes<[]> {
let NumMicroOps = 147;		let NumMicroOps = 147;
}		}
def : InstRW<[WriteFNSAVE], (instregex "FSAVEm")>;		def : InstRW<[WriteFNSAVE], (instregex "FSAVEm")>;

// FRSTOR.		// FRSTOR.
def WriteFRSTOR : SchedWriteRes<[]> {		def WriteFRSTOR : SchedWriteRes<[]> {
let NumMicroOps = 90;		let NumMicroOps = 90;
}		}
def : InstRW<[WriteFRSTOR], (instregex "FRSTORm")>;		def : InstRW<[WriteFRSTOR], (instregex "FRSTORm")>;

//-- Arithmetic instructions --//		//-- Arithmetic instructions --//

// FABS.		// FABS.
def : InstRW<[WriteP0], (instregex "ABS_F")>;		def : InstRW<[WriteP0], (instregex "ABS_F")>;

// FCHS.		// FCHS.
def : InstRW<[WriteP0], (instregex "CHS_F")>;		def : InstRW<[WriteP0], (instregex "CHS_F")>;

// FCOM(P) FUCOM(P).
// r.
def : InstRW<[WriteP1], (instregex "COM_FST0r", "COMP_FST0r", "UCOM_Fr",
"UCOM_FPr")>;
// m.
def : InstRW<[WriteP1_P23], (instregex "FCOM(32\|64)m", "FCOMP(32\|64)m")>;

// FCOMPP FUCOMPP.		// FCOMPP FUCOMPP.
// r.		// r.
def : InstRW<[Write2P01], (instregex "FCOMPP", "UCOM_FPPr")>;		def : InstRW<[Write2P01], (instregex "FCOMPP", "UCOM_FPPr")>;

// FCOMI(P) FUCOMI(P).		// FCOMI(P) FUCOMI(P).
// m.		// m.
def : InstRW<[Write3P01], (instregex "COM_FIr", "COM_FIPr", "UCOM_FIr",		def : InstRW<[Write3P01], (instregex "COM_FIr", "COM_FIPr", "UCOM_FIr",
"UCOM_FIPr")>;		"UCOM_FIPr")>;

// FICOM(P).
def : InstRW<[Write2P1_P23], (instregex "FICOM(16\|32)m", "FICOMP(16\|32)m")>;

// FTST.		// FTST.
def : InstRW<[WriteP1], (instregex "TST_F")>;		def : InstRW<[WriteP1], (instregex "TST_F")>;

// FXAM.		// FXAM.
def : InstRW<[Write2P1], (instregex "FXAM")>;		def : InstRW<[Write2P1], (instregex "FXAM")>;

// FPREM.		// FPREM.
def WriteFPREM : SchedWriteRes<[]> {		def WriteFPREM : SchedWriteRes<[]> {
▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines

// FNINIT.		// FNINIT.
def WriteFNINIT : SchedWriteRes<[]> {		def WriteFNINIT : SchedWriteRes<[]> {
let NumMicroOps = 26;		let NumMicroOps = 26;
}		}
def : InstRW<[WriteFNINIT], (instregex "FNINIT")>;		def : InstRW<[WriteFNINIT], (instregex "FNINIT")>;

//=== Integer MMX and XMM Instructions ===//		//=== Integer MMX and XMM Instructions ===//
//-- Move instructions --//

// MOVD.
// r32/64 <- (x)mm.
def : InstRW<[WriteP0], (instregex "MMX_MOVD64grr", "MMX_MOVD64from64rr",
"VMOVPDI2DIrr", "MOVPDI2DIrr")>;

// (x)mm <- r32/64.
def : InstRW<[WriteP5], (instregex "MMX_MOVD64rr", "MMX_MOVD64to64rr",
"VMOVDI2PDIrr", "MOVDI2PDIrr")>;

// MOVQ.
// r64 <- (x)mm.
def : InstRW<[WriteP0], (instregex "VMOVPQIto64rr")>;

// (x)mm <- r64.
def : InstRW<[WriteP5], (instregex "VMOV64toPQIrr", "VMOVZQI2PQIrr")>;

// (x)mm <- (x)mm.
def : InstRW<[WriteP015], (instregex "MMX_MOVQ64rr")>;

// (V)MOVDQA/U.
// x <- x.
def : InstRW<[WriteP015], (instregex "MOVDQ(A\|U)rr", "VMOVDQ(A\|U)rr",
"MOVDQ(A\|U)rr_REV", "VMOVDQ(A\|U)rr_REV",
"VMOVDQ(A\|U)Yrr", "VMOVDQ(A\|U)Yrr_REV")>;

// MOVDQ2Q.
def : InstRW<[WriteP01_P5], (instregex "MMX_MOVDQ2Qrr")>;

// MOVQ2DQ.
def : InstRW<[WriteP015], (instregex "MMX_MOVQ2DQrr")>;


// PACKSSWB/DW.
// mm <- mm.
def WriteMMXPACKSSrr : SchedWriteRes<[HWPort5]> {
let Latency = 2;
let NumMicroOps = 3;
let ResourceCycles = [3];
}
def : InstRW<[WriteMMXPACKSSrr], (instregex "MMX_PACKSSDWirr",
"MMX_PACKSSWBirr", "MMX_PACKUSWBirr")>;

// mm <- m64.
def WriteMMXPACKSSrm : SchedWriteRes<[HWPort23, HWPort5]> {
let Latency = 4;
let NumMicroOps = 3;
let ResourceCycles = [1, 3];
}
def : InstRW<[WriteMMXPACKSSrm], (instregex "MMX_PACKSSDWirm",
"MMX_PACKSSWBirm", "MMX_PACKUSWBirm")>;

// VPMOVSX/ZX BW BD BQ DW DQ.
// y <- x.
def WriteVPMOVSX : SchedWriteRes<[HWPort5]> {
let Latency = 3;
let NumMicroOps = 1;
}
def : InstRW<[WriteVPMOVSX], (instregex "VPMOV(SX\|ZX)(BW\|BQ\|DW\|DQ)Yrr")>;

// PBLENDW.		// PBLENDW.
// x,x,i / v,v,v,i		// x,x,i / v,v,v,i
def WritePBLENDWr : SchedWriteRes<[HWPort5]>;		def WritePBLENDWr : SchedWriteRes<[HWPort5]>;
def : InstRW<[WritePBLENDWr], (instregex "(V?)PBLENDW(Y?)rri")>;		def : InstRW<[WritePBLENDWr], (instregex "(V?)PBLENDW(Y?)rri")>;

// x,m,i / v,v,m,i		// x,m,i / v,v,m,i
def WritePBLENDWm : SchedWriteRes<[HWPort5, HWPort23]> {		def WritePBLENDWm : SchedWriteRes<[HWPort5, HWPort23]> {
let NumMicroOps = 2;		let NumMicroOps = 2;
let Latency = 4;		let Latency = 4;
let ResourceCycles = [1, 1];		let ResourceCycles = [1, 1];
}		}
def : InstRW<[WritePBLENDWm, ReadAfterLd], (instregex "(V?)PBLENDW(Y?)rmi")>;		def : InstRW<[WritePBLENDWm, ReadAfterLd], (instregex "(V?)PBLENDW(Y?)rmi")>;

// VPBLENDD.
// v,v,v,i.
def WriteVPBLENDDr : SchedWriteRes<[HWPort015]>;
def : InstRW<[WriteVPBLENDDr], (instregex "VPBLENDD(Y?)rri")>;

// v,v,m,i
def WriteVPBLENDDm : SchedWriteRes<[HWPort015, HWPort23]> {
let NumMicroOps = 2;
let Latency = 4;
let ResourceCycles = [1, 1];
}
def : InstRW<[WriteVPBLENDDm, ReadAfterLd], (instregex "VPBLENDD(Y?)rmi")>;

// MASKMOVQ.
def WriteMASKMOVQ : SchedWriteRes<[HWPort0, HWPort4, HWPort23]> {
let Latency = 13;
let NumMicroOps = 4;
let ResourceCycles = [1, 1, 2];
}
def : InstRW<[WriteMASKMOVQ], (instregex "MMX_MASKMOVQ(64)?")>;

// MASKMOVDQU.
def WriteMASKMOVDQU : SchedWriteRes<[HWPort04, HWPort56, HWPort23]> {
let Latency = 14;
let NumMicroOps = 10;
let ResourceCycles = [4, 2, 4];
}
def : InstRW<[WriteMASKMOVDQU], (instregex "(V?)MASKMOVDQU(64)?")>;

// VPMASKMOV D/Q.
// v,v,m.
def WriteVPMASKMOVr : SchedWriteRes<[HWPort5, HWPort23]> {
let Latency = 4;
let NumMicroOps = 3;
let ResourceCycles = [2, 1];
}
def : InstRW<[WriteVPMASKMOVr, ReadAfterLd],
(instregex "VPMASKMOV(D\|Q)(Y?)rm")>;

// m, v,v.
def WriteVPMASKMOVm : SchedWriteRes<[HWPort0, HWPort1, HWPort4, HWPort23]> {
let Latency = 13;
let NumMicroOps = 4;
let ResourceCycles = [1, 1, 1, 1];
}
def : InstRW<[WriteVPMASKMOVm], (instregex "VPMASKMOV(D\|Q)(Y?)mr")>;

// PMOVMSKB.		// PMOVMSKB.
def WritePMOVMSKB : SchedWriteRes<[HWPort0]> {		def WritePMOVMSKB : SchedWriteRes<[HWPort0]> {
let Latency = 3;		let Latency = 3;
}		}
def : InstRW<[WritePMOVMSKB], (instregex "(V\|MMX_)?PMOVMSKB(Y?)rr")>;		def : InstRW<[WritePMOVMSKB], (instregex "(V\|MMX_)?PMOVMSKB(Y?)rr")>;

// PEXTR B/W/D/Q.
// r32,x,i.
def WritePEXTRr : SchedWriteRes<[HWPort0, HWPort5]> {
let Latency = 2;
let NumMicroOps = 2;
let ResourceCycles = [1, 1];
}
def : InstRW<[WritePEXTRr], (instregex "PEXTR(B\|W\|D\|Q)rr", "MMX_PEXTRWirri")>;

// m8,x,i.
def WritePEXTRm : SchedWriteRes<[HWPort23, HWPort4, HWPort5]> {
let NumMicroOps = 3;
let ResourceCycles = [1, 1, 1];
}
def : InstRW<[WritePEXTRm], (instregex "PEXTR(B\|W\|D\|Q)mr")>;

// VPBROADCAST B/W.
// x, m8/16.
def WriteVPBROADCAST128Ld : SchedWriteRes<[HWPort01, HWPort23, HWPort5]> {
let Latency = 5;
let NumMicroOps = 3;
let ResourceCycles = [1, 1, 1];
}
def : InstRW<[WriteVPBROADCAST128Ld, ReadAfterLd],
(instregex "VPBROADCAST(B\|W)rm")>;

// y, m8/16
def WriteVPBROADCAST256Ld : SchedWriteRes<[HWPort01, HWPort23, HWPort5]> {
let Latency = 7;
let NumMicroOps = 3;
let ResourceCycles = [1, 1, 1];
}
def : InstRW<[WriteVPBROADCAST256Ld, ReadAfterLd],
(instregex "VPBROADCAST(B\|W)Yrm")>;

// VPGATHERDD.		// VPGATHERDD.
// x.		// x.
def WriteVPGATHERDD128 : SchedWriteRes<[]> {		def WriteVPGATHERDD128 : SchedWriteRes<[]> {
let NumMicroOps = 20;		let NumMicroOps = 20;
}		}
def : InstRW<[WriteVPGATHERDD128, ReadAfterLd], (instregex "VPGATHERDDrm")>;		def : InstRW<[WriteVPGATHERDD128, ReadAfterLd], (instregex "VPGATHERDDrm")>;

// y.		// y.
▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
}		}
// v <- v,m.		// v <- v,m.
def : WriteRes<WritePHAddLd, [HWPort1, HWPort5, HWPort23]> {		def : WriteRes<WritePHAddLd, [HWPort1, HWPort5, HWPort23]> {
let Latency = 6;		let Latency = 6;
let NumMicroOps = 3;		let NumMicroOps = 3;
let ResourceCycles = [1, 2, 1];		let ResourceCycles = [1, 2, 1];
}		}

// PHADD\|PHSUB (S) W/D.		//=== Floating Point XMM and YMM Instructions ===//
// v <- v,v.
def WritePHADDSUBr : SchedWriteRes<[HWPort1, HWPort5]> {		// VGATHERDPS.
let Latency = 3;		// x.
let NumMicroOps = 3;		def WriteVGATHERDPS128 : SchedWriteRes<[]> {
let ResourceCycles = [1, 2];		let NumMicroOps = 20;
}		}
def : InstRW<[WritePHADDSUBr], (instregex "MMX_PHADD(W?)rr64",		def : InstRW<[WriteVGATHERDPS128, ReadAfterLd], (instregex "VGATHERDPSrm")>;
"MMX_PHADDSWrr64",
"MMX_PHSUB(W\|D)rr64",
"MMX_PHSUBSWrr64",
"(V?)PH(ADD\|SUB)(W\|D)(Y?)rr",
"(V?)PH(ADD\|SUB)SWrr(256)?")>;

// v <- v,m.		// y.
def WritePHADDSUBm : SchedWriteRes<[HWPort1, HWPort5, HWPort23]> {		def WriteVGATHERDPS256 : SchedWriteRes<[]> {
let Latency = 6;		let NumMicroOps = 34;
let NumMicroOps = 3;
let ResourceCycles = [1, 2, 1];
}		}
def : InstRW<[WritePHADDSUBm, ReadAfterLd],		def : InstRW<[WriteVGATHERDPS256, ReadAfterLd], (instregex "VGATHERDPSYrm")>;
(instregex "MMX_PHADD(W?)rm64",
"MMX_PHADDSWrm64",
"MMX_PHSUB(W\|D)rm64",
"MMX_PHSUBSWrm64",
"(V?)PH(ADD\|SUB)(W\|D)(Y?)rm",
"(V?)PH(ADD\|SUB)SWrm(128\|256)?")>;

// PCMPGTQ.		// VGATHERQPS.
// v <- v,v.		// x.
def WritePCMPGTQr : SchedWriteRes<[HWPort0]> {		def WriteVGATHERQPS128 : SchedWriteRes<[]> {
let Latency = 5;		let NumMicroOps = 15;
		}
		def : InstRW<[WriteVGATHERQPS128, ReadAfterLd], (instregex "VGATHERQPSrm")>;

		// y.
		def WriteVGATHERQPS256 : SchedWriteRes<[]> {
		let NumMicroOps = 22;
		}
		def : InstRW<[WriteVGATHERQPS256, ReadAfterLd], (instregex "VGATHERQPSYrm")>;

		// VGATHERDPD.
		// x.
		def WriteVGATHERDPD128 : SchedWriteRes<[]> {
		let NumMicroOps = 12;
		}
		def : InstRW<[WriteVGATHERDPD128, ReadAfterLd], (instregex "VGATHERDPDrm")>;

		// y.
		def WriteVGATHERDPD256 : SchedWriteRes<[]> {
		let NumMicroOps = 20;
		}
		def : InstRW<[WriteVGATHERDPD256, ReadAfterLd], (instregex "VGATHERDPDYrm")>;

		// VGATHERQPD.
		// x.
		def WriteVGATHERQPD128 : SchedWriteRes<[]> {
		let NumMicroOps = 14;
		}
		def : InstRW<[WriteVGATHERQPD128, ReadAfterLd], (instregex "VGATHERQPDrm")>;

		// y.
		def WriteVGATHERQPD256 : SchedWriteRes<[]> {
		let NumMicroOps = 22;
		}
		def : InstRW<[WriteVGATHERQPD256, ReadAfterLd], (instregex "VGATHERQPDYrm")>;

		// Remaining instrs.

		def HWWriteResGroup0 : SchedWriteRes<[HWPort23]> {
		let Latency = 1;
let NumMicroOps = 1;		let NumMicroOps = 1;
		let ResourceCycles = [1];
}		}
def : InstRW<[WritePCMPGTQr], (instregex "(V?)PCMPGTQ(Y?)rr")>;		def: InstRW<[HWWriteResGroup0], (instregex "LDDQUrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "LD_F32m")>;
		def: InstRW<[HWWriteResGroup0], (instregex "LD_F64m")>;
		def: InstRW<[HWWriteResGroup0], (instregex "LD_F80m")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MMX_MOVD64from64rm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MMX_MOVD64rm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MMX_MOVD64to64rm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MMX_MOVQ64rm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MOV(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MOV64toPQIrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MOV8rm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MOVAPDrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MOVAPSrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MOVDDUPrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MOVDI2PDIrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MOVDQArm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MOVDQUrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MOVNTDQArm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MOVSHDUPrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MOVSLDUPrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MOVSSrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MOVSX(16\|32\|64)rm16")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MOVSX(16\|32\|64)rm32")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MOVSX(16\|32\|64)rm8")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MOVUPDrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MOVUPSrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MOVZX(16\|32\|64)rm16")>;
		def: InstRW<[HWWriteResGroup0], (instregex "MOVZX(16\|32\|64)rm8")>;
		def: InstRW<[HWWriteResGroup0], (instregex "PREFETCHNTA")>;
		def: InstRW<[HWWriteResGroup0], (instregex "PREFETCHT0")>;
		def: InstRW<[HWWriteResGroup0], (instregex "PREFETCHT1")>;
		def: InstRW<[HWWriteResGroup0], (instregex "PREFETCHT2")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VBROADCASTF128")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VBROADCASTI128")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VBROADCASTSDYrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VBROADCASTSSYrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VBROADCASTSSrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VLDDQUYrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VLDDQUrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOV64toPQIrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVAPDYrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVAPDrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVAPSYrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVAPSrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVDDUPYrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVDDUPrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVDI2PDIrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVDQAYrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVDQArm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVDQUYrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVDQUrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVNTDQAYrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVNTDQArm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVQI2PQIrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVSDrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVSHDUPYrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVSHDUPrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVSLDUPYrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVSLDUPrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVSSrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVUPDYrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVUPDrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVUPSYrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VMOVUPSrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VPBROADCASTDYrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VPBROADCASTDrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VPBROADCASTQYrm")>;
		def: InstRW<[HWWriteResGroup0], (instregex "VPBROADCASTQrm")>;

// v <- v,m.		def HWWriteResGroup1 : SchedWriteRes<[HWPort4,HWPort237]> {
def WritePCMPGTQm : SchedWriteRes<[HWPort0, HWPort23]> {		let Latency = 1;
let Latency = 5;
let NumMicroOps = 2;		let NumMicroOps = 2;
let ResourceCycles = [1, 1];		let ResourceCycles = [1,1];
}		}
def : InstRW<[WritePCMPGTQm, ReadAfterLd], (instregex "(V?)PCMPGTQ(Y?)rm")>;		def: InstRW<[HWWriteResGroup1], (instregex "FBSTPm")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MMX_MOVD64from64rm")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MMX_MOVD64mr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MMX_MOVNTQmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MMX_MOVQ64mr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOV(16\|32\|64)mr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOV8mi")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOV8mr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOVAPDmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOVAPSmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOVDQAmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOVDQUmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOVHPDmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOVHPSmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOVLPDmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOVLPSmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOVNTDQmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOVNTI_64mr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOVNTImr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOVNTPDmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOVNTPSmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOVPDI2DImr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOVPQI2QImr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOVPQIto64mr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOVSSmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOVUPDmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "MOVUPSmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "ST_FP32m")>;
		def: InstRW<[HWWriteResGroup1], (instregex "ST_FP64m")>;
		def: InstRW<[HWWriteResGroup1], (instregex "ST_FP80m")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VEXTRACTF128mr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VEXTRACTI128mr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVAPDYmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVAPDmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVAPSYmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVAPSmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVDQAYmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVDQAmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVDQUYmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVDQUmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVHPDmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVHPSmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVLPDmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVLPSmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVNTDQYmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVNTDQmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVNTPDYmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVNTPDmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVNTPSYmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVNTPSmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVPDI2DImr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVPQI2QImr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVPQIto64mr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVSDmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVSSmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVUPDYmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVUPDmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVUPSYmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMOVUPSmr")>;
		def: InstRW<[HWWriteResGroup1], (instregex "VMPTRSTm")>;

// PMULLD.		def HWWriteResGroup2 : SchedWriteRes<[HWPort0]> {
// x,x / y,y,y.		let Latency = 1;
def WritePMULLDr : SchedWriteRes<[HWPort0]> {		let NumMicroOps = 1;
let Latency = 10;		let ResourceCycles = [1];
		}
		def: InstRW<[HWWriteResGroup2], (instregex "MMX_MOVD64from64rr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "MMX_MOVD64grr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "MMX_PMOVMSKBrr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "MMX_PSLLDri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "MMX_PSLLDrr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "MMX_PSLLQri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "MMX_PSLLQrr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "MMX_PSLLWri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "MMX_PSLLWrr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "MMX_PSRADri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "MMX_PSRADrr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "MMX_PSRAWri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "MMX_PSRAWrr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "MMX_PSRLDri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "MMX_PSRLDrr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "MMX_PSRLQri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "MMX_PSRLQrr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "MMX_PSRLWri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "MMX_PSRLWrr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "MOVPDI2DIrr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "MOVPQIto64rr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "PSLLDri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "PSLLQri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "PSLLWri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "PSRADri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "PSRAWri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "PSRLDri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "PSRLQri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "PSRLWri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VMOVPDI2DIrr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VMOVPQIto64rr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VPSLLDYri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VPSLLDri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VPSLLQYri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VPSLLQri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VPSLLVQYrr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VPSLLVQrr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VPSLLWYri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VPSLLWri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VPSRADYri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VPSRADri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VPSRAWYri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VPSRAWri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VPSRLDYri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VPSRLDri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VPSRLQYri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VPSRLQri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VPSRLVQYrr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VPSRLVQrr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VPSRLWYri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VPSRLWri")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VTESTPDYrr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VTESTPDrr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VTESTPSYrr")>;
		def: InstRW<[HWWriteResGroup2], (instregex "VTESTPSrr")>;

		def HWWriteResGroup3 : SchedWriteRes<[HWPort1]> {
		let Latency = 1;
		let NumMicroOps = 1;
		let ResourceCycles = [1];
		}
		def: InstRW<[HWWriteResGroup3], (instregex "COMP_FST0r")>;
		def: InstRW<[HWWriteResGroup3], (instregex "COM_FST0r")>;
		def: InstRW<[HWWriteResGroup3], (instregex "MMX_MASKMOVQ64")>;
		def: InstRW<[HWWriteResGroup3], (instregex "MMX_MASKMOVQ64")>;
		def: InstRW<[HWWriteResGroup3], (instregex "UCOM_FPr")>;
		def: InstRW<[HWWriteResGroup3], (instregex "UCOM_Fr")>;
		def: InstRW<[HWWriteResGroup3], (instregex "VMASKMOVDQU")>;

		def HWWriteResGroup4 : SchedWriteRes<[HWPort5]> {
		let Latency = 1;
		let NumMicroOps = 1;
		let ResourceCycles = [1];
		}
		def: InstRW<[HWWriteResGroup4], (instregex "ANDNPDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "ANDNPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "ANDPDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "ANDPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "INSERTPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MMX_MOVD64rr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MMX_MOVD64to64rr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MMX_MOVQ2DQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MMX_PALIGNR64irr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MMX_PSHUFBrr64")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MMX_PSHUFWri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MMX_PUNPCKHBWirr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MMX_PUNPCKHDQirr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MMX_PUNPCKHWDirr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MMX_PUNPCKLBWirr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MMX_PUNPCKLDQirr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MMX_PUNPCKLWDirr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MOV64toPQIrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MOVAPDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MOVAPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MOVDDUPrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MOVDI2PDIrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MOVHLPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MOVLHPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MOVSDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MOVSHDUPrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MOVSLDUPrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MOVSSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MOVUPDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "MOVUPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "ORPDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "ORPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PACKSSDWrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PACKSSWBrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PACKUSDWrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PACKUSWBrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PALIGNRrri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PBLENDWrri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PMOVSXBDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PMOVSXBQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PMOVSXBWrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PMOVSXDQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PMOVSXWDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PMOVSXWQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PMOVZXBDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PMOVZXBQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PMOVZXBWrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PMOVZXDQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PMOVZXWDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PMOVZXWQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PSHUFBrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PSHUFDri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PSHUFHWri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PSHUFLWri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PSLLDQri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PSRLDQri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PUNPCKHBWrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PUNPCKHDQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PUNPCKHQDQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PUNPCKHWDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PUNPCKLBWrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PUNPCKLDQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PUNPCKLQDQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "PUNPCKLWDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "SHUFPDrri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "SHUFPSrri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "UNPCKHPDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "UNPCKHPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "UNPCKLPDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "UNPCKLPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VANDNPDYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VANDNPDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VANDNPSYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VANDNPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VANDPDYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VANDPDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VANDPSYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VANDPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VBROADCASTSSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VINSERTPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VMOV64toPQIrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VMOVAPDYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VMOVAPDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VMOVAPSYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VMOVAPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VMOVDDUPYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VMOVDDUPrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VMOVDI2PDIrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VMOVHLPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VMOVLHPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VMOVSDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VMOVSHDUPYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VMOVSHDUPrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VMOVSLDUPYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VMOVSLDUPrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VMOVSSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VMOVUPDYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VMOVUPDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VMOVUPSYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VMOVUPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VORPDYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VORPDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VORPSYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VORPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPACKSSDWYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPACKSSDWrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPACKSSWBYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPACKSSWBrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPACKUSDWYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPACKUSDWrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPACKUSWBYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPACKUSWBrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPALIGNRYrri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPALIGNRrri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPBLENDWYrri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPBLENDWrri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPBROADCASTDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPBROADCASTQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPERMILPDYri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPERMILPDYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPERMILPDri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPERMILPDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPERMILPSYri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPERMILPSYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPERMILPSri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPERMILPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPMOVSXBDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPMOVSXBQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPMOVSXBWrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPMOVSXDQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPMOVSXWDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPMOVSXWQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPMOVZXBDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPMOVZXBQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPMOVZXBWrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPMOVZXDQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPMOVZXWDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPMOVZXWQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPSHUFBYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPSHUFBrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPSHUFDYri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPSHUFDri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPSHUFHWYri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPSHUFHWri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPSHUFLWYri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPSHUFLWri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPSLLDQYri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPSLLDQri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPSRLDQYri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPSRLDQri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPUNPCKHBWYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPUNPCKHBWrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPUNPCKHDQYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPUNPCKHDQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPUNPCKHQDQYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPUNPCKHQDQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPUNPCKHWDYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPUNPCKHWDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPUNPCKLBWYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPUNPCKLBWrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPUNPCKLDQYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPUNPCKLDQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPUNPCKLQDQYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPUNPCKLQDQrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPUNPCKLWDYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VPUNPCKLWDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VSHUFPDYrri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VSHUFPDrri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VSHUFPSYrri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VSHUFPSrri")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VUNPCKHPDYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VUNPCKHPDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VUNPCKHPSYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VUNPCKHPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VUNPCKLPDYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VUNPCKLPDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VUNPCKLPSYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VUNPCKLPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VXORPDYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VXORPDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VXORPSYrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "VXORPSrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "XORPDrr")>;
		def: InstRW<[HWWriteResGroup4], (instregex "XORPSrr")>;

		def HWWriteResGroup5 : SchedWriteRes<[HWPort6]> {
		let Latency = 1;
		let NumMicroOps = 1;
		let ResourceCycles = [1];
		}
		def: InstRW<[HWWriteResGroup5], (instregex "JMP(16\|32\|64)r")>;

		def HWWriteResGroup6 : SchedWriteRes<[HWPort01]> {
		let Latency = 1;
		let NumMicroOps = 1;
		let ResourceCycles = [1];
		}
		def: InstRW<[HWWriteResGroup6], (instregex "FINCSTP")>;
		def: InstRW<[HWWriteResGroup6], (instregex "FNOP")>;

		def HWWriteResGroup7 : SchedWriteRes<[HWPort06]> {
		let Latency = 1;
		let NumMicroOps = 1;
		let ResourceCycles = [1];
		}
		def: InstRW<[HWWriteResGroup7], (instregex "BT(16\|32\|64)ri8")>;
		def: InstRW<[HWWriteResGroup7], (instregex "BT(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "BTC(16\|32\|64)ri8")>;
		def: InstRW<[HWWriteResGroup7], (instregex "BTC(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "BTR(16\|32\|64)ri8")>;
		def: InstRW<[HWWriteResGroup7], (instregex "BTR(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "BTS(16\|32\|64)ri8")>;
		def: InstRW<[HWWriteResGroup7], (instregex "BTS(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "CDQ")>;
		def: InstRW<[HWWriteResGroup7], (instregex "CQO")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JAE_1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JAE_4")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JA_1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JA_4")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JBE_1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JBE_4")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JB_1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JB_4")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JE_1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JE_4")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JGE_1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JGE_4")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JG_1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JG_4")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JLE_1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JLE_4")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JL_1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JL_4")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JMP_1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JMP_4")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JNE_1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JNE_4")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JNO_1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JNO_4")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JNP_1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JNP_4")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JNS_1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JNS_4")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JO_1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JO_4")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JP_1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JP_4")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JS_1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "JS_4")>;
		def: InstRW<[HWWriteResGroup7], (instregex "RORX32ri")>;
		def: InstRW<[HWWriteResGroup7], (instregex "RORX64ri")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SAR(16\|32\|64)r1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SAR(16\|32\|64)ri")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SAR8r1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SAR8ri")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SARX32rr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SARX64rr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SETAEr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SETBr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SETEr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SETGEr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SETGr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SETLEr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SETLr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SETNEr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SETNOr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SETNPr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SETNSr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SETOr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SETPr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SETSr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SHL(16\|32\|64)r1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SHL(16\|32\|64)ri")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SHL8r1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SHL8ri")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SHLX32rr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SHLX64rr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SHR(16\|32\|64)r1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SHR(16\|32\|64)ri")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SHR8r1")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SHR8ri")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SHRX32rr")>;
		def: InstRW<[HWWriteResGroup7], (instregex "SHRX64rr")>;

		def HWWriteResGroup8 : SchedWriteRes<[HWPort15]> {
		let Latency = 1;
		let NumMicroOps = 1;
		let ResourceCycles = [1];
		}
		def: InstRW<[HWWriteResGroup8], (instregex "ANDN32rr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "ANDN64rr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "BLSI32rr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "BLSI64rr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "BLSMSK32rr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "BLSMSK64rr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "BLSR32rr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "BLSR64rr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "BZHI32rr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "BZHI64rr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "LEA(16\|32\|64)r")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PABSBrr64")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PABSDrr64")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PABSWrr64")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PADDBirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PADDDirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PADDQirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PADDSBirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PADDSWirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PADDUSBirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PADDUSWirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PADDWirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PAVGBirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PAVGWirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PCMPEQBirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PCMPEQDirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PCMPEQWirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PCMPGTBirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PCMPGTDirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PCMPGTWirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PMAXSWirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PMAXUBirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PMINSWirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PMINUBirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PSIGNBrr64")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PSIGNDrr64")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PSIGNWrr64")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PSUBBirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PSUBDirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PSUBQirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PSUBSBirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PSUBSWirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PSUBUSBirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PSUBUSWirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "MMX_PSUBWirr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PABSBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PABSDrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PABSWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PADDBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PADDDrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PADDQrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PADDSBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PADDSWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PADDUSBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PADDUSWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PADDWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PAVGBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PAVGWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PCMPEQBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PCMPEQDrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PCMPEQQrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PCMPEQWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PCMPGTBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PCMPGTDrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PCMPGTWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PMAXSBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PMAXSDrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PMAXSWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PMAXUBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PMAXUDrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PMAXUWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PMINSBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PMINSDrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PMINSWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PMINUBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PMINUDrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PMINUWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PSIGNBrr128")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PSIGNDrr128")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PSIGNWrr128")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PSUBBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PSUBDrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PSUBQrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PSUBSBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PSUBSWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PSUBUSBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PSUBUSWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "PSUBWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPABSBYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPABSBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPABSDYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPABSDrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPABSWYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPABSWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPADDBYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPADDBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPADDDYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPADDDrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPADDQYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPADDQrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPADDSBYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPADDSBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPADDSWYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPADDSWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPADDUSBYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPADDUSBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPADDUSWYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPADDUSWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPADDWYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPADDWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPAVGBYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPAVGBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPAVGWYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPAVGWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPCMPEQBYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPCMPEQBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPCMPEQDYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPCMPEQDrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPCMPEQQYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPCMPEQQrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPCMPEQWYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPCMPEQWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPCMPGTBYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPCMPGTBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPCMPGTDYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPCMPGTDrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPCMPGTWYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPCMPGTWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMAXSBYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMAXSBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMAXSDYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMAXSDrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMAXSWYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMAXSWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMAXUBYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMAXUBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMAXUDYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMAXUDrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMAXUWYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMAXUWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMINSBYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMINSBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMINSDYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMINSDrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMINSWYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMINSWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMINUBYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMINUBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMINUDYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMINUDrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMINUWYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPMINUWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSIGNBYrr256")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSIGNBrr128")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSIGNDYrr256")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSIGNDrr128")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSIGNWYrr256")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSIGNWrr128")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSUBBYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSUBBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSUBDYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSUBDrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSUBQYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSUBQrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSUBSBYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSUBSBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSUBSWYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSUBSWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSUBUSBYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSUBUSBrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSUBUSWYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSUBUSWrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSUBWYrr")>;
		def: InstRW<[HWWriteResGroup8], (instregex "VPSUBWrr")>;

		def HWWriteResGroup9 : SchedWriteRes<[HWPort015]> {
		let Latency = 1;
		let NumMicroOps = 1;
		let ResourceCycles = [1];
		}
		def: InstRW<[HWWriteResGroup9], (instregex "BLENDPDrri")>;
		def: InstRW<[HWWriteResGroup9], (instregex "BLENDPSrri")>;
		def: InstRW<[HWWriteResGroup9], (instregex "MMX_MOVD64from64rr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "MMX_MOVQ64rr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "MMX_PANDNirr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "MMX_PANDirr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "MMX_PORirr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "MMX_PXORirr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "MOVDQArr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "MOVDQUrr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "MOVPQI2QIrr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "PANDNrr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "PANDrr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "PORrr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "PXORrr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "VBLENDPDYrri")>;
		def: InstRW<[HWWriteResGroup9], (instregex "VBLENDPDrri")>;
		def: InstRW<[HWWriteResGroup9], (instregex "VBLENDPSYrri")>;
		def: InstRW<[HWWriteResGroup9], (instregex "VBLENDPSrri")>;
		def: InstRW<[HWWriteResGroup9], (instregex "VMOVDQAYrr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "VMOVDQArr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "VMOVDQUYrr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "VMOVDQUrr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "VMOVPQI2QIrr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "VMOVZPQILo2PQIrr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "VPANDNYrr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "VPANDNrr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "VPANDYrr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "VPANDrr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "VPBLENDDYrri")>;
		def: InstRW<[HWWriteResGroup9], (instregex "VPBLENDDrri")>;
		def: InstRW<[HWWriteResGroup9], (instregex "VPORYrr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "VPORrr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "VPXORYrr")>;
		def: InstRW<[HWWriteResGroup9], (instregex "VPXORrr")>;

		def HWWriteResGroup10 : SchedWriteRes<[HWPort0156]> {
		let Latency = 1;
		let NumMicroOps = 1;
		let ResourceCycles = [1];
		}
		def: InstRW<[HWWriteResGroup10], (instregex "ADD(16\|32\|64)ri8")>;
		def: InstRW<[HWWriteResGroup10], (instregex "ADD(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup10], (instregex "ADD8i8")>;
		def: InstRW<[HWWriteResGroup10], (instregex "ADD8ri")>;
		def: InstRW<[HWWriteResGroup10], (instregex "ADD8rr")>;
		def: InstRW<[HWWriteResGroup10], (instregex "AND(16\|32\|64)ri8")>;
		def: InstRW<[HWWriteResGroup10], (instregex "AND(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup10], (instregex "AND8i8")>;
		def: InstRW<[HWWriteResGroup10], (instregex "AND8ri")>;
		def: InstRW<[HWWriteResGroup10], (instregex "AND8rr")>;
		def: InstRW<[HWWriteResGroup10], (instregex "CBW")>;
		def: InstRW<[HWWriteResGroup10], (instregex "CLC")>;
		def: InstRW<[HWWriteResGroup10], (instregex "CMC")>;
		def: InstRW<[HWWriteResGroup10], (instregex "CMP(16\|32\|64)ri8")>;
		def: InstRW<[HWWriteResGroup10], (instregex "CMP(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup10], (instregex "CMP8i8")>;
		def: InstRW<[HWWriteResGroup10], (instregex "CMP8ri")>;
		def: InstRW<[HWWriteResGroup10], (instregex "CMP8rr")>;
		def: InstRW<[HWWriteResGroup10], (instregex "CWDE")>;
		def: InstRW<[HWWriteResGroup10], (instregex "DEC(16\|32\|64)r")>;
		def: InstRW<[HWWriteResGroup10], (instregex "DEC8r")>;
		def: InstRW<[HWWriteResGroup10], (instregex "INC(16\|32\|64)r")>;
		def: InstRW<[HWWriteResGroup10], (instregex "INC8r")>;
		def: InstRW<[HWWriteResGroup10], (instregex "LAHF")>;
		def: InstRW<[HWWriteResGroup10], (instregex "MOV(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup10], (instregex "MOV8ri")>;
		def: InstRW<[HWWriteResGroup10], (instregex "MOV8rr")>;
		def: InstRW<[HWWriteResGroup10], (instregex "MOVSX(16\|32\|64)rr16")>;
		def: InstRW<[HWWriteResGroup10], (instregex "MOVSX(16\|32\|64)rr32")>;
		def: InstRW<[HWWriteResGroup10], (instregex "MOVSX(16\|32\|64)rr8")>;
		def: InstRW<[HWWriteResGroup10], (instregex "MOVZX(16\|32\|64)rr16")>;
		def: InstRW<[HWWriteResGroup10], (instregex "MOVZX(16\|32\|64)rr8")>;
		def: InstRW<[HWWriteResGroup10], (instregex "NEG(16\|32\|64)r")>;
		def: InstRW<[HWWriteResGroup10], (instregex "NEG8r")>;
		def: InstRW<[HWWriteResGroup10], (instregex "NOOP")>;
		def: InstRW<[HWWriteResGroup10], (instregex "NOT(16\|32\|64)r")>;
		def: InstRW<[HWWriteResGroup10], (instregex "NOT8r")>;
		def: InstRW<[HWWriteResGroup10], (instregex "OR(16\|32\|64)ri8")>;
		def: InstRW<[HWWriteResGroup10], (instregex "OR(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup10], (instregex "OR8i8")>;
		def: InstRW<[HWWriteResGroup10], (instregex "OR8ri")>;
		def: InstRW<[HWWriteResGroup10], (instregex "OR8rr")>;
		def: InstRW<[HWWriteResGroup10], (instregex "SAHF")>;
		def: InstRW<[HWWriteResGroup10], (instregex "SGDT64m")>;
		def: InstRW<[HWWriteResGroup10], (instregex "SIDT64m")>;
		def: InstRW<[HWWriteResGroup10], (instregex "SLDT64m")>;
		def: InstRW<[HWWriteResGroup10], (instregex "SMSW16m")>;
		def: InstRW<[HWWriteResGroup10], (instregex "STC")>;
		def: InstRW<[HWWriteResGroup10], (instregex "STRm")>;
		def: InstRW<[HWWriteResGroup10], (instregex "SUB(16\|32\|64)ri8")>;
		def: InstRW<[HWWriteResGroup10], (instregex "SUB(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup10], (instregex "SUB8i8")>;
		def: InstRW<[HWWriteResGroup10], (instregex "SUB8ri")>;
		def: InstRW<[HWWriteResGroup10], (instregex "SUB8rr")>;
		def: InstRW<[HWWriteResGroup10], (instregex "SYSCALL")>;
		def: InstRW<[HWWriteResGroup10], (instregex "TEST(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup10], (instregex "TEST8i8")>;
		def: InstRW<[HWWriteResGroup10], (instregex "TEST8ri")>;
		def: InstRW<[HWWriteResGroup10], (instregex "TEST8rr")>;
		def: InstRW<[HWWriteResGroup10], (instregex "XCHG(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup10], (instregex "XOR(16\|32\|64)ri8")>;
		def: InstRW<[HWWriteResGroup10], (instregex "XOR(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup10], (instregex "XOR8i8")>;
		def: InstRW<[HWWriteResGroup10], (instregex "XOR8ri")>;
		def: InstRW<[HWWriteResGroup10], (instregex "XOR8rr")>;

		def HWWriteResGroup11 : SchedWriteRes<[HWPort0,HWPort23]> {
		let Latency = 1;
let NumMicroOps = 2;		let NumMicroOps = 2;
let ResourceCycles = [2];		let ResourceCycles = [1,1];
}		}
def : InstRW<[WritePMULLDr], (instregex "(V?)PMULLD(Y?)rr")>;		def: InstRW<[HWWriteResGroup11], (instregex "CVTPS2PDrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "CVTSS2SDrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "MMX_PSLLDrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "MMX_PSLLQrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "MMX_PSLLWrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "MMX_PSRADrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "MMX_PSRAWrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "MMX_PSRLDrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "MMX_PSRLQrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "MMX_PSRLWrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "VCVTPH2PSYrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "VCVTPH2PSrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "VCVTPS2PDrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "VCVTSS2SDrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "VPSLLDYrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "VPSLLQYrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "VPSLLVQYrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "VPSLLVQrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "VPSLLWYrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "VPSRADYrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "VPSRAWYrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "VPSRLDYrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "VPSRLQYrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "VPSRLVQYrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "VPSRLVQrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "VPSRLWYrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "VTESTPDYrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "VTESTPDrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "VTESTPSYrm")>;
		def: InstRW<[HWWriteResGroup11], (instregex "VTESTPSrm")>;

// x,m / y,y,m.		def HWWriteResGroup12 : SchedWriteRes<[HWPort1,HWPort23]> {
def WritePMULLDm : SchedWriteRes<[HWPort0, HWPort23]> {		let Latency = 1;
let Latency = 10;		let NumMicroOps = 2;
let NumMicroOps = 3;		let ResourceCycles = [1,1];
let ResourceCycles = [2, 1];
}		}
def : InstRW<[WritePMULLDm, ReadAfterLd], (instregex "(V?)PMULLD(Y?)rm")>;		def: InstRW<[HWWriteResGroup12], (instregex "FCOM32m")>;
		def: InstRW<[HWWriteResGroup12], (instregex "FCOM64m")>;
		def: InstRW<[HWWriteResGroup12], (instregex "FCOMP32m")>;
		def: InstRW<[HWWriteResGroup12], (instregex "FCOMP64m")>;

//-- Logic instructions --//		def HWWriteResGroup13 : SchedWriteRes<[HWPort5,HWPort23]> {
		let Latency = 1;
		let NumMicroOps = 2;
		let ResourceCycles = [1,1];
		}
		def: InstRW<[HWWriteResGroup13], (instregex "ANDNPDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "ANDNPSrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "ANDPDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "ANDPSrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "INSERTPSrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "MMX_PALIGNR64irm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "MMX_PINSRWirmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "MMX_PSHUFBrm64")>;
		def: InstRW<[HWWriteResGroup13], (instregex "MMX_PSHUFWmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "MMX_PUNPCKHBWirm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "MMX_PUNPCKHDQirm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "MMX_PUNPCKHWDirm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "MMX_PUNPCKLBWirm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "MMX_PUNPCKLDQirm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "MMX_PUNPCKLWDirm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "MOVHPDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "MOVHPSrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "MOVLPDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "MOVLPSrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "ORPDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "ORPSrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PACKSSDWrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PACKSSWBrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PACKUSDWrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PACKUSWBrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PALIGNRrmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PBLENDWrmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PINSRBrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PINSRDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PINSRQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PINSRWrmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PMOVSXBDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PMOVSXBQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PMOVSXBWrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PMOVSXDQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PMOVSXWDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PMOVSXWQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PMOVZXBDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PMOVZXBQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PMOVZXBWrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PMOVZXDQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PMOVZXWDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PMOVZXWQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PSHUFBrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PSHUFDmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PSHUFHWmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PSHUFLWmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PUNPCKHBWrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PUNPCKHDQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PUNPCKHQDQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PUNPCKHWDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PUNPCKLBWrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PUNPCKLDQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PUNPCKLQDQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "PUNPCKLWDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "SHUFPDrmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "SHUFPSrmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "UNPCKHPDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "UNPCKHPSrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "UNPCKLPDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "UNPCKLPSrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VANDNPDYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VANDNPDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VANDNPSYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VANDNPSrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VANDPDYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VANDPDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VANDPSYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VANDPSrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VINSERTPSrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VMOVHPDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VMOVHPSrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VMOVLPDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VMOVLPSrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VORPDYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VORPDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VORPSYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VORPSrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPACKSSDWYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPACKSSDWrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPACKSSWBYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPACKSSWBrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPACKUSDWYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPACKUSDWrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPACKUSWBYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPACKUSWBrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPALIGNRYrmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPALIGNRrmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPBLENDWYrmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPBLENDWrmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPERMILPDYmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPERMILPDYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPERMILPDmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPERMILPDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPERMILPSYmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPERMILPSYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPERMILPSmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPERMILPSrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPINSRBrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPINSRDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPINSRQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPINSRWrmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPMOVSXBDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPMOVSXBQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPMOVSXBWrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPMOVSXDQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPMOVSXWDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPMOVSXWQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPMOVZXBDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPMOVZXBQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPMOVZXBWrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPMOVZXDQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPMOVZXWDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPMOVZXWQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPSHUFBYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPSHUFBrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPSHUFDYmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPSHUFDmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPSHUFHWYmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPSHUFHWmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPSHUFLWYmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPSHUFLWmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPUNPCKHBWYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPUNPCKHBWrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPUNPCKHDQYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPUNPCKHDQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPUNPCKHQDQYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPUNPCKHQDQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPUNPCKHWDYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPUNPCKHWDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPUNPCKLBWYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPUNPCKLBWrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPUNPCKLDQYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPUNPCKLDQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPUNPCKLQDQYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPUNPCKLQDQrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPUNPCKLWDYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VPUNPCKLWDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VSHUFPDYrmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VSHUFPDrmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VSHUFPSYrmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VSHUFPSrmi")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VUNPCKHPDYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VUNPCKHPDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VUNPCKHPSYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VUNPCKHPSrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VUNPCKLPDYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VUNPCKLPDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VUNPCKLPSYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VUNPCKLPSrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VXORPDYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VXORPDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VXORPSYrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "VXORPSrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "XORPDrm")>;
		def: InstRW<[HWWriteResGroup13], (instregex "XORPSrm")>;

// PTEST.		def HWWriteResGroup14 : SchedWriteRes<[HWPort6,HWPort23]> {
// v,v.		let Latency = 1;
def WritePTESTr : SchedWriteRes<[HWPort0, HWPort5]> {
let Latency = 2;
let NumMicroOps = 2;		let NumMicroOps = 2;
let ResourceCycles = [1, 1];		let ResourceCycles = [1,1];
}		}
def : InstRW<[WritePTESTr], (instregex "(V?)PTEST(Y?)rr")>;		def: InstRW<[HWWriteResGroup14], (instregex "FARJMP64")>;
		def: InstRW<[HWWriteResGroup14], (instregex "JMP(16\|32\|64)m")>;

// v,m.		def HWWriteResGroup15 : SchedWriteRes<[HWPort23,HWPort06]> {
def WritePTESTm : SchedWriteRes<[HWPort0, HWPort5, HWPort23]> {		let Latency = 1;
let Latency = 6;		let NumMicroOps = 2;
let NumMicroOps = 3;		let ResourceCycles = [1,1];
let ResourceCycles = [1, 1, 1];
}		}
def : InstRW<[WritePTESTr], (instregex "(V?)PTEST(Y?)rm")>;		def: InstRW<[HWWriteResGroup15], (instregex "BT(16\|32\|64)mi8")>;
		def: InstRW<[HWWriteResGroup15], (instregex "RORX32mi")>;
		def: InstRW<[HWWriteResGroup15], (instregex "RORX64mi")>;
		def: InstRW<[HWWriteResGroup15], (instregex "SARX32rm")>;
		def: InstRW<[HWWriteResGroup15], (instregex "SARX64rm")>;
		def: InstRW<[HWWriteResGroup15], (instregex "SHLX32rm")>;
		def: InstRW<[HWWriteResGroup15], (instregex "SHLX64rm")>;
		def: InstRW<[HWWriteResGroup15], (instregex "SHRX32rm")>;
		def: InstRW<[HWWriteResGroup15], (instregex "SHRX64rm")>;

// PSLL,PSRL,PSRA W/D/Q.		def HWWriteResGroup16 : SchedWriteRes<[HWPort23,HWPort15]> {
// x,x / v,v,x.		let Latency = 1;
def WritePShift : SchedWriteRes<[HWPort0, HWPort5]> {
let Latency = 2;
let NumMicroOps = 2;		let NumMicroOps = 2;
let ResourceCycles = [1, 1];		let ResourceCycles = [1,1];
}		}
def : InstRW<[WritePShift], (instregex "(V?)PS(LL\|RL\|RA)(W\|D\|Q)(Y?)rr")>;		def: InstRW<[HWWriteResGroup16], (instregex "ANDN32rm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "ANDN64rm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "BLSI32rm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "BLSI64rm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "BLSMSK32rm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "BLSMSK64rm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "BLSR32rm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "BLSR64rm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "BZHI32rm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "BZHI64rm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PABSBrm64")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PABSDrm64")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PABSWrm64")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PADDBirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PADDDirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PADDQirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PADDSBirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PADDSWirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PADDUSBirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PADDUSWirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PADDWirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PAVGBirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PAVGWirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PCMPEQBirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PCMPEQDirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PCMPEQWirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PCMPGTBirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PCMPGTDirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PCMPGTWirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PMAXSWirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PMAXUBirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PMINSWirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PMINUBirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PSIGNBrm64")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PSIGNDrm64")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PSIGNWrm64")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PSUBBirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PSUBDirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PSUBQirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PSUBSBirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PSUBSWirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PSUBUSBirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PSUBUSWirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MMX_PSUBWirm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "MOVBE(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PABSBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PABSDrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PABSWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PADDBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PADDDrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PADDQrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PADDSBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PADDSWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PADDUSBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PADDUSWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PADDWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PAVGBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PAVGWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PCMPEQBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PCMPEQDrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PCMPEQQrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PCMPEQWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PCMPGTBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PCMPGTDrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PCMPGTWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PMAXSBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PMAXSDrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PMAXSWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PMAXUBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PMAXUDrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PMAXUWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PMINSBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PMINSDrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PMINSWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PMINUBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PMINUDrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PMINUWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PSIGNBrm128")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PSIGNDrm128")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PSIGNWrm128")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PSUBBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PSUBDrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PSUBQrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PSUBSBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PSUBSWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PSUBUSBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PSUBUSWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "PSUBWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPABSBYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPABSBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPABSDYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPABSDrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPABSWYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPABSWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPADDBYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPADDBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPADDDYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPADDDrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPADDQYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPADDQrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPADDSBYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPADDSBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPADDSWYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPADDSWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPADDUSBYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPADDUSBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPADDUSWYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPADDUSWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPADDWYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPADDWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPAVGBYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPAVGBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPAVGWYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPAVGWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPCMPEQBYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPCMPEQBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPCMPEQDYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPCMPEQDrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPCMPEQQYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPCMPEQQrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPCMPEQWYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPCMPEQWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPCMPGTBYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPCMPGTBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPCMPGTDYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPCMPGTDrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPCMPGTWYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPCMPGTWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMAXSBYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMAXSBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMAXSDYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMAXSDrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMAXSWYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMAXSWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMAXUBYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMAXUBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMAXUDYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMAXUDrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMAXUWYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMAXUWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMINSBYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMINSBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMINSDYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMINSDrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMINSWYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMINSWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMINUBYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMINUBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMINUDYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMINUDrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMINUWYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPMINUWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSIGNBYrm256")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSIGNBrm128")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSIGNDYrm256")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSIGNDrm128")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSIGNWYrm256")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSIGNWrm128")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSUBBYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSUBBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSUBDYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSUBDrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSUBQYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSUBQrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSUBSBYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSUBSBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSUBSWYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSUBSWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSUBUSBYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSUBUSBrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSUBUSWYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSUBUSWrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSUBWYrm")>;
		def: InstRW<[HWWriteResGroup16], (instregex "VPSUBWrm")>;

// PSLL,PSRL DQ.		def HWWriteResGroup17 : SchedWriteRes<[HWPort23,HWPort015]> {
def : InstRW<[WriteP5], (instregex "(V?)PS(R\|L)LDQ(Y?)ri")>;		let Latency = 1;
		let NumMicroOps = 2;
		let ResourceCycles = [1,1];
		}
		def: InstRW<[HWWriteResGroup17], (instregex "BLENDPDrmi")>;
		def: InstRW<[HWWriteResGroup17], (instregex "BLENDPSrmi")>;
		def: InstRW<[HWWriteResGroup17], (instregex "MMX_PANDNirm")>;
		def: InstRW<[HWWriteResGroup17], (instregex "MMX_PANDirm")>;
		def: InstRW<[HWWriteResGroup17], (instregex "MMX_PORirm")>;
		def: InstRW<[HWWriteResGroup17], (instregex "MMX_PXORirm")>;
		def: InstRW<[HWWriteResGroup17], (instregex "PANDNrm")>;
		def: InstRW<[HWWriteResGroup17], (instregex "PANDrm")>;
		def: InstRW<[HWWriteResGroup17], (instregex "PORrm")>;
		def: InstRW<[HWWriteResGroup17], (instregex "PXORrm")>;
		def: InstRW<[HWWriteResGroup17], (instregex "VBLENDPDYrmi")>;
		def: InstRW<[HWWriteResGroup17], (instregex "VBLENDPDrmi")>;
		def: InstRW<[HWWriteResGroup17], (instregex "VBLENDPSYrmi")>;
		def: InstRW<[HWWriteResGroup17], (instregex "VBLENDPSrmi")>;
		def: InstRW<[HWWriteResGroup17], (instregex "VINSERTF128rm")>;
		def: InstRW<[HWWriteResGroup17], (instregex "VINSERTI128rm")>;
		def: InstRW<[HWWriteResGroup17], (instregex "VPANDNYrm")>;
		def: InstRW<[HWWriteResGroup17], (instregex "VPANDNrm")>;
		def: InstRW<[HWWriteResGroup17], (instregex "VPANDYrm")>;
		def: InstRW<[HWWriteResGroup17], (instregex "VPANDrm")>;
		def: InstRW<[HWWriteResGroup17], (instregex "VPBLENDDYrmi")>;
		def: InstRW<[HWWriteResGroup17], (instregex "VPBLENDDrmi")>;
		def: InstRW<[HWWriteResGroup17], (instregex "VPORYrm")>;
		def: InstRW<[HWWriteResGroup17], (instregex "VPORrm")>;
		def: InstRW<[HWWriteResGroup17], (instregex "VPXORYrm")>;
		def: InstRW<[HWWriteResGroup17], (instregex "VPXORrm")>;

//-- Other --//		def HWWriteResGroup18 : SchedWriteRes<[HWPort23,HWPort0156]> {
		let Latency = 1;
		let NumMicroOps = 2;
		let ResourceCycles = [1,1];
		}
		def: InstRW<[HWWriteResGroup18], (instregex "ADD(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup18], (instregex "ADD8rm")>;
		def: InstRW<[HWWriteResGroup18], (instregex "AND(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup18], (instregex "AND8rm")>;
		def: InstRW<[HWWriteResGroup18], (instregex "CMP(16\|32\|64)mi8")>;
		def: InstRW<[HWWriteResGroup18], (instregex "CMP(16\|32\|64)mr")>;
		def: InstRW<[HWWriteResGroup18], (instregex "CMP(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup18], (instregex "CMP8mi")>;
		def: InstRW<[HWWriteResGroup18], (instregex "CMP8mr")>;
		def: InstRW<[HWWriteResGroup18], (instregex "CMP8rm")>;
		def: InstRW<[HWWriteResGroup18], (instregex "OR(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup18], (instregex "OR8rm")>;
		def: InstRW<[HWWriteResGroup18], (instregex "POP(16\|32\|64)r")>;
		def: InstRW<[HWWriteResGroup18], (instregex "SUB(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup18], (instregex "SUB8rm")>;
		def: InstRW<[HWWriteResGroup18], (instregex "TEST(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup18], (instregex "TEST8mi")>;
		def: InstRW<[HWWriteResGroup18], (instregex "TEST8rm")>;
		def: InstRW<[HWWriteResGroup18], (instregex "XOR(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup18], (instregex "XOR8rm")>;

// EMMS.		def HWWriteResGroup19 : SchedWriteRes<[HWPort237,HWPort0156]> {
def WriteEMMS : SchedWriteRes<[]> {		let Latency = 1;
let Latency = 13;		let NumMicroOps = 2;
let NumMicroOps = 31;		let ResourceCycles = [1,1];
}		}
def : InstRW<[WriteEMMS], (instregex "MMX_EMMS")>;		def: InstRW<[HWWriteResGroup19], (instregex "SFENCE")>;

//=== Floating Point XMM and YMM Instructions ===//		def HWWriteResGroup20 : SchedWriteRes<[HWPort4,HWPort5,HWPort237]> {
//-- Move instructions --//		let Latency = 1;
		let NumMicroOps = 3;
		let ResourceCycles = [1,1,1];
		}
		def: InstRW<[HWWriteResGroup20], (instregex "EXTRACTPSmr")>;
		def: InstRW<[HWWriteResGroup20], (instregex "PEXTRBmr")>;
		def: InstRW<[HWWriteResGroup20], (instregex "PEXTRDmr")>;
		def: InstRW<[HWWriteResGroup20], (instregex "PEXTRQmr")>;
		def: InstRW<[HWWriteResGroup20], (instregex "PEXTRWmr")>;
		def: InstRW<[HWWriteResGroup20], (instregex "STMXCSR")>;
		def: InstRW<[HWWriteResGroup20], (instregex "VEXTRACTPSmr")>;
		def: InstRW<[HWWriteResGroup20], (instregex "VPEXTRBmr")>;
		def: InstRW<[HWWriteResGroup20], (instregex "VPEXTRDmr")>;
		def: InstRW<[HWWriteResGroup20], (instregex "VPEXTRQmr")>;
		def: InstRW<[HWWriteResGroup20], (instregex "VPEXTRWmr")>;
		def: InstRW<[HWWriteResGroup20], (instregex "VSTMXCSR")>;

// MOVMSKP S/D.		def HWWriteResGroup21 : SchedWriteRes<[HWPort4,HWPort6,HWPort237]> {
// r32 <- x.		let Latency = 1;
def WriteMOVMSKPr : SchedWriteRes<[HWPort0]> {		let NumMicroOps = 3;
let Latency = 3;		let ResourceCycles = [1,1,1];
		}
		def: InstRW<[HWWriteResGroup21], (instregex "FNSTCW16m")>;

		def HWWriteResGroup22 : SchedWriteRes<[HWPort4,HWPort237,HWPort06]> {
		let Latency = 1;
		let NumMicroOps = 3;
		let ResourceCycles = [1,1,1];
}		}
def : InstRW<[WriteMOVMSKPr], (instregex "(V?)MOVMSKP(S\|D)rr")>;		def: InstRW<[HWWriteResGroup22], (instregex "SETAEm")>;
		def: InstRW<[HWWriteResGroup22], (instregex "SETBm")>;
		def: InstRW<[HWWriteResGroup22], (instregex "SETEm")>;
		def: InstRW<[HWWriteResGroup22], (instregex "SETGEm")>;
		def: InstRW<[HWWriteResGroup22], (instregex "SETGm")>;
		def: InstRW<[HWWriteResGroup22], (instregex "SETLEm")>;
		def: InstRW<[HWWriteResGroup22], (instregex "SETLm")>;
		def: InstRW<[HWWriteResGroup22], (instregex "SETNEm")>;
		def: InstRW<[HWWriteResGroup22], (instregex "SETNOm")>;
		def: InstRW<[HWWriteResGroup22], (instregex "SETNPm")>;
		def: InstRW<[HWWriteResGroup22], (instregex "SETNSm")>;
		def: InstRW<[HWWriteResGroup22], (instregex "SETOm")>;
		def: InstRW<[HWWriteResGroup22], (instregex "SETPm")>;
		def: InstRW<[HWWriteResGroup22], (instregex "SETSm")>;

// r32 <- y.		def HWWriteResGroup23 : SchedWriteRes<[HWPort4,HWPort237,HWPort15]> {
def WriteVMOVMSKPYr : SchedWriteRes<[HWPort0]> {		let Latency = 1;
		let NumMicroOps = 3;
		let ResourceCycles = [1,1,1];
		}
		def: InstRW<[HWWriteResGroup23], (instregex "MOVBE(16\|32\|64)mr")>;

		def HWWriteResGroup24 : SchedWriteRes<[HWPort4,HWPort237,HWPort0156]> {
		let Latency = 1;
		let NumMicroOps = 3;
		let ResourceCycles = [1,1,1];
		}
		def: InstRW<[HWWriteResGroup24], (instregex "PUSH(16\|32\|64)r")>;
		def: InstRW<[HWWriteResGroup24], (instregex "PUSH64i8")>;
		def: InstRW<[HWWriteResGroup24], (instregex "STOSB")>;
		def: InstRW<[HWWriteResGroup24], (instregex "STOSL")>;
		def: InstRW<[HWWriteResGroup24], (instregex "STOSQ")>;
		def: InstRW<[HWWriteResGroup24], (instregex "STOSW")>;

		def HWWriteResGroup25 : SchedWriteRes<[HWPort4,HWPort23,HWPort237,HWPort06]> {
		let Latency = 1;
		let NumMicroOps = 4;
		let ResourceCycles = [1,1,1,1];
		}
		def: InstRW<[HWWriteResGroup25], (instregex "BTC(16\|32\|64)mi8")>;
		def: InstRW<[HWWriteResGroup25], (instregex "BTR(16\|32\|64)mi8")>;
		def: InstRW<[HWWriteResGroup25], (instregex "BTS(16\|32\|64)mi8")>;
		def: InstRW<[HWWriteResGroup25], (instregex "SAR(16\|32\|64)m1")>;
		def: InstRW<[HWWriteResGroup25], (instregex "SAR(16\|32\|64)mi")>;
		def: InstRW<[HWWriteResGroup25], (instregex "SAR8m1")>;
		def: InstRW<[HWWriteResGroup25], (instregex "SAR8mi")>;
		def: InstRW<[HWWriteResGroup25], (instregex "SHL(16\|32\|64)m1")>;
		def: InstRW<[HWWriteResGroup25], (instregex "SHL(16\|32\|64)mi")>;
		def: InstRW<[HWWriteResGroup25], (instregex "SHL8m1")>;
		def: InstRW<[HWWriteResGroup25], (instregex "SHL8mi")>;
		def: InstRW<[HWWriteResGroup25], (instregex "SHR(16\|32\|64)m1")>;
		def: InstRW<[HWWriteResGroup25], (instregex "SHR(16\|32\|64)mi")>;
		def: InstRW<[HWWriteResGroup25], (instregex "SHR8m1")>;
		def: InstRW<[HWWriteResGroup25], (instregex "SHR8mi")>;

		def HWWriteResGroup26 : SchedWriteRes<[HWPort4,HWPort23,HWPort237,HWPort0156]> {
		let Latency = 1;
		let NumMicroOps = 4;
		let ResourceCycles = [1,1,1,1];
		}
		def: InstRW<[HWWriteResGroup26], (instregex "ADD(16\|32\|64)mi8")>;
		def: InstRW<[HWWriteResGroup26], (instregex "ADD(16\|32\|64)mr")>;
		def: InstRW<[HWWriteResGroup26], (instregex "ADD8mi")>;
		def: InstRW<[HWWriteResGroup26], (instregex "ADD8mr")>;
		def: InstRW<[HWWriteResGroup26], (instregex "AND(16\|32\|64)mi8")>;
		def: InstRW<[HWWriteResGroup26], (instregex "AND(16\|32\|64)mr")>;
		def: InstRW<[HWWriteResGroup26], (instregex "AND8mi")>;
		def: InstRW<[HWWriteResGroup26], (instregex "AND8mr")>;
		def: InstRW<[HWWriteResGroup26], (instregex "DEC(16\|32\|64)m")>;
		def: InstRW<[HWWriteResGroup26], (instregex "DEC8m")>;
		def: InstRW<[HWWriteResGroup26], (instregex "INC(16\|32\|64)m")>;
		def: InstRW<[HWWriteResGroup26], (instregex "INC8m")>;
		def: InstRW<[HWWriteResGroup26], (instregex "NEG(16\|32\|64)m")>;
		def: InstRW<[HWWriteResGroup26], (instregex "NEG8m")>;
		def: InstRW<[HWWriteResGroup26], (instregex "NOT(16\|32\|64)m")>;
		def: InstRW<[HWWriteResGroup26], (instregex "NOT8m")>;
		def: InstRW<[HWWriteResGroup26], (instregex "OR(16\|32\|64)mi8")>;
		def: InstRW<[HWWriteResGroup26], (instregex "OR(16\|32\|64)mr")>;
		def: InstRW<[HWWriteResGroup26], (instregex "OR8mi")>;
		def: InstRW<[HWWriteResGroup26], (instregex "OR8mr")>;
		def: InstRW<[HWWriteResGroup26], (instregex "SUB(16\|32\|64)mi8")>;
		def: InstRW<[HWWriteResGroup26], (instregex "SUB(16\|32\|64)mr")>;
		def: InstRW<[HWWriteResGroup26], (instregex "SUB8mi")>;
		def: InstRW<[HWWriteResGroup26], (instregex "SUB8mr")>;
		def: InstRW<[HWWriteResGroup26], (instregex "XOR(16\|32\|64)mi8")>;
		def: InstRW<[HWWriteResGroup26], (instregex "XOR(16\|32\|64)mr")>;
		def: InstRW<[HWWriteResGroup26], (instregex "XOR8mi")>;
		def: InstRW<[HWWriteResGroup26], (instregex "XOR8mr")>;

		def HWWriteResGroup27 : SchedWriteRes<[HWPort5]> {
let Latency = 2;		let Latency = 2;
		let NumMicroOps = 2;
		let ResourceCycles = [2];
}		}
def : InstRW<[WriteVMOVMSKPYr], (instregex "VMOVMSKP(S\|D)Yrr")>;		def: InstRW<[HWWriteResGroup27], (instregex "BLENDVPDrr0")>;
		def: InstRW<[HWWriteResGroup27], (instregex "BLENDVPSrr0")>;
		def: InstRW<[HWWriteResGroup27], (instregex "MMX_PINSRWirri")>;
		def: InstRW<[HWWriteResGroup27], (instregex "PBLENDVBrr0")>;
		def: InstRW<[HWWriteResGroup27], (instregex "PINSRBrr")>;
		def: InstRW<[HWWriteResGroup27], (instregex "PINSRDrr")>;
		def: InstRW<[HWWriteResGroup27], (instregex "PINSRQrr")>;
		def: InstRW<[HWWriteResGroup27], (instregex "PINSRWrri")>;
		def: InstRW<[HWWriteResGroup27], (instregex "VBLENDVPDYrr")>;
		def: InstRW<[HWWriteResGroup27], (instregex "VBLENDVPDrr")>;
		def: InstRW<[HWWriteResGroup27], (instregex "VBLENDVPSYrr")>;
		def: InstRW<[HWWriteResGroup27], (instregex "VBLENDVPSrr")>;
		def: InstRW<[HWWriteResGroup27], (instregex "VPBLENDVBYrr")>;
		def: InstRW<[HWWriteResGroup27], (instregex "VPBLENDVBrr")>;
		def: InstRW<[HWWriteResGroup27], (instregex "VPINSRBrr")>;
		def: InstRW<[HWWriteResGroup27], (instregex "VPINSRDrr")>;
		def: InstRW<[HWWriteResGroup27], (instregex "VPINSRQrr")>;
		def: InstRW<[HWWriteResGroup27], (instregex "VPINSRWrri")>;

// VPERM2F128.		def HWWriteResGroup28 : SchedWriteRes<[HWPort01]> {
def : InstRW<[WriteFShuffle256], (instregex "VPERM2F128rr")>;		let Latency = 2;
def : InstRW<[WriteFShuffle256Ld, ReadAfterLd], (instregex "VPERM2F128rm")>;		let NumMicroOps = 2;
		let ResourceCycles = [2];
		}
		def: InstRW<[HWWriteResGroup28], (instregex "FDECSTP")>;

// BLENDVP S/D.		def HWWriteResGroup29 : SchedWriteRes<[HWPort06]> {
def : InstRW<[WriteFVarBlend], (instregex "BLENDVP(S\|D)rr0")>;		let Latency = 2;
def : InstRW<[WriteFVarBlendLd, ReadAfterLd], (instregex "BLENDVP(S\|D)rm0")>;		let NumMicroOps = 2;
		let ResourceCycles = [2];
		}
		def: InstRW<[HWWriteResGroup29], (instregex "ROL(16\|32\|64)r1")>;
		def: InstRW<[HWWriteResGroup29], (instregex "ROL(16\|32\|64)ri")>;
		def: InstRW<[HWWriteResGroup29], (instregex "ROL8r1")>;
		def: InstRW<[HWWriteResGroup29], (instregex "ROL8ri")>;
		def: InstRW<[HWWriteResGroup29], (instregex "ROR(16\|32\|64)r1")>;
		craig.topperUnsubmitted Not Done Reply Inline Actions BSWAP16r seems to no longer be present. craig.topper: BSWAP16r seems to no longer be present.
		gadi.haberAuthorUnsubmitted Not Done Reply Inline Actions Yes. Removed it temporarily for performance evaluation. Brought it back. gadi.haber: Yes. Removed it temporarily for performance evaluation. Brought it back.
		def: InstRW<[HWWriteResGroup29], (instregex "ROR(16\|32\|64)ri")>;
		def: InstRW<[HWWriteResGroup29], (instregex "ROR8r1")>;
		def: InstRW<[HWWriteResGroup29], (instregex "ROR8ri")>;

// VBROADCASTF128.		def HWWriteResGroup30 : SchedWriteRes<[HWPort0156]> {
def : InstRW<[WriteLoad], (instregex "VBROADCASTF128")>;		let Latency = 2;
		let NumMicroOps = 2;
		let ResourceCycles = [2];
		}
		def: InstRW<[HWWriteResGroup30], (instregex "LFENCE")>;
		def: InstRW<[HWWriteResGroup30], (instregex "MFENCE")>;
		def: InstRW<[HWWriteResGroup30], (instregex "WAIT")>;
		def: InstRW<[HWWriteResGroup30], (instregex "XGETBV")>;

// EXTRACTPS.		def HWWriteResGroup31 : SchedWriteRes<[HWPort0,HWPort5]> {
// r32,x,i.		let Latency = 2;
def WriteEXTRACTPSr : SchedWriteRes<[HWPort0, HWPort5]> {
let NumMicroOps = 2;		let NumMicroOps = 2;
let ResourceCycles = [1, 1];		let ResourceCycles = [1,1];
}		}
def : InstRW<[WriteEXTRACTPSr], (instregex "(V?)EXTRACTPSrr")>;		def: InstRW<[HWWriteResGroup31], (instregex "CVTPS2PDrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "CVTSS2SDrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "EXTRACTPSrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "MMX_PEXTRWirri")>;
		def: InstRW<[HWWriteResGroup31], (instregex "PEXTRBrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "PEXTRDrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "PEXTRQrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "PEXTRWri")>;
		def: InstRW<[HWWriteResGroup31], (instregex "PSLLDrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "PSLLQrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "PSLLWrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "PSRADrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "PSRAWrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "PSRLDrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "PSRLQrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "PSRLWrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "PTESTrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "VCVTPH2PSYrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "VCVTPH2PSrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "VCVTPS2PDrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "VCVTSS2SDrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "VEXTRACTPSrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "VPEXTRBrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "VPEXTRDrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "VPEXTRQrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "VPEXTRWri")>;
		def: InstRW<[HWWriteResGroup31], (instregex "VPSLLDrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "VPSLLQrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "VPSLLWrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "VPSRADrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "VPSRAWrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "VPSRLDrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "VPSRLQrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "VPSRLWrr")>;
		def: InstRW<[HWWriteResGroup31], (instregex "VPTESTrr")>;

// m32,x,i.		def HWWriteResGroup32 : SchedWriteRes<[HWPort6,HWPort0156]> {
def WriteEXTRACTPSm : SchedWriteRes<[HWPort0, HWPort5, HWPort23]> {		let Latency = 2;
let Latency = 4;		let NumMicroOps = 2;
let NumMicroOps = 3;		let ResourceCycles = [1,1];
let ResourceCycles = [1, 1, 1];
}		}
def : InstRW<[WriteEXTRACTPSm], (instregex "(V?)EXTRACTPSmr")>;		def: InstRW<[HWWriteResGroup32], (instregex "CLFLUSH")>;

// VEXTRACTF128.
// x,y,i.
def : InstRW<[WriteFShuffle256], (instregex "VEXTRACTF128rr")>;

// m128,y,i.		def HWWriteResGroup33 : SchedWriteRes<[HWPort01,HWPort015]> {
def WriteVEXTRACTF128m : SchedWriteRes<[HWPort23, HWPort4]> {		let Latency = 2;
let Latency = 4;
let NumMicroOps = 2;		let NumMicroOps = 2;
let ResourceCycles = [1, 1];		let ResourceCycles = [1,1];
}		}
def : InstRW<[WriteVEXTRACTF128m], (instregex "VEXTRACTF128mr")>;		def: InstRW<[HWWriteResGroup33], (instregex "MMX_MOVDQ2Qrr")>;

// VINSERTF128.		def HWWriteResGroup34 : SchedWriteRes<[HWPort06,HWPort15]> {
// y,y,x,i.		let Latency = 2;
def : InstRW<[WriteFShuffle256], (instregex "VINSERTF128rr")>;		let NumMicroOps = 2;
		let ResourceCycles = [1,1];
		}
		def: InstRW<[HWWriteResGroup34], (instregex "BEXTR32rr")>;
		def: InstRW<[HWWriteResGroup34], (instregex "BEXTR64rr")>;
		def: InstRW<[HWWriteResGroup34], (instregex "BSWAP(16\|32\|64)r")>;

// y,y,m128,i.		def HWWriteResGroup35 : SchedWriteRes<[HWPort06,HWPort0156]> {
def WriteVINSERTF128m : SchedWriteRes<[HWPort015, HWPort23]> {		let Latency = 2;
let Latency = 4;
let NumMicroOps = 2;		let NumMicroOps = 2;
let ResourceCycles = [1, 1];		let ResourceCycles = [1,1];
}		}
def : InstRW<[WriteFShuffle256, ReadAfterLd], (instregex "VINSERTF128rm")>;		def: InstRW<[HWWriteResGroup35], (instregex "ADC(16\|32\|64)ri8")>;
		def: InstRW<[HWWriteResGroup35], (instregex "ADC(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup35], (instregex "ADC8i8")>;
		def: InstRW<[HWWriteResGroup35], (instregex "ADC8ri")>;
		def: InstRW<[HWWriteResGroup35], (instregex "ADC8rr")>;
		def: InstRW<[HWWriteResGroup35], (instregex "CMOVAE(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup35], (instregex "CMOVB(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup35], (instregex "CMOVE(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup35], (instregex "CMOVG(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup35], (instregex "CMOVGE(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup35], (instregex "CMOVL(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup35], (instregex "CMOVLE(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup35], (instregex "CMOVNE(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup35], (instregex "CMOVNO(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup35], (instregex "CMOVNP(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup35], (instregex "CMOVNS(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup35], (instregex "CMOVO(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup35], (instregex "CMOVP(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup35], (instregex "CMOVS(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup35], (instregex "CWD")>;
		def: InstRW<[HWWriteResGroup35], (instregex "JRCXZ")>;
		def: InstRW<[HWWriteResGroup35], (instregex "SBB(16\|32\|64)ri8")>;
		def: InstRW<[HWWriteResGroup35], (instregex "SBB(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup35], (instregex "SBB8i8")>;
		def: InstRW<[HWWriteResGroup35], (instregex "SBB8ri")>;
		def: InstRW<[HWWriteResGroup35], (instregex "SBB8rr")>;
		def: InstRW<[HWWriteResGroup35], (instregex "SETAr")>;
		def: InstRW<[HWWriteResGroup35], (instregex "SETBEr")>;

// VMASKMOVP S/D.		def HWWriteResGroup36 : SchedWriteRes<[HWPort5,HWPort23]> {
// v,v,m.		let Latency = 2;
def WriteVMASKMOVPrm : SchedWriteRes<[HWPort5, HWPort23]> {
let Latency = 4;
let NumMicroOps = 3;		let NumMicroOps = 3;
let ResourceCycles = [2, 1];		let ResourceCycles = [2,1];
}		}
def : InstRW<[WriteVMASKMOVPrm], (instregex "VMASKMOVP(S\|D)(Y?)rm")>;		def: InstRW<[HWWriteResGroup36], (instregex "BLENDVPDrm0")>;
		def: InstRW<[HWWriteResGroup36], (instregex "BLENDVPSrm0")>;
		def: InstRW<[HWWriteResGroup36], (instregex "MMX_PACKSSDWirm")>;
		def: InstRW<[HWWriteResGroup36], (instregex "MMX_PACKSSWBirm")>;
		def: InstRW<[HWWriteResGroup36], (instregex "MMX_PACKUSWBirm")>;
		def: InstRW<[HWWriteResGroup36], (instregex "PBLENDVBrm0")>;
		def: InstRW<[HWWriteResGroup36], (instregex "VBLENDVPDYrm")>;
		def: InstRW<[HWWriteResGroup36], (instregex "VBLENDVPDrm")>;
		def: InstRW<[HWWriteResGroup36], (instregex "VBLENDVPSYrm")>;
		def: InstRW<[HWWriteResGroup36], (instregex "VBLENDVPSrm")>;
		def: InstRW<[HWWriteResGroup36], (instregex "VMASKMOVPDYrm")>;
		def: InstRW<[HWWriteResGroup36], (instregex "VMASKMOVPDrm")>;
		def: InstRW<[HWWriteResGroup36], (instregex "VMASKMOVPSYrm")>;
		def: InstRW<[HWWriteResGroup36], (instregex "VMASKMOVPSrm")>;
		def: InstRW<[HWWriteResGroup36], (instregex "VPBLENDVBYrm")>;
		def: InstRW<[HWWriteResGroup36], (instregex "VPBLENDVBrm")>;
		def: InstRW<[HWWriteResGroup36], (instregex "VPMASKMOVDYrm")>;
		def: InstRW<[HWWriteResGroup36], (instregex "VPMASKMOVDrm")>;
		def: InstRW<[HWWriteResGroup36], (instregex "VPMASKMOVQYrm")>;
		def: InstRW<[HWWriteResGroup36], (instregex "VPMASKMOVQrm")>;

// m128,x,x.		def HWWriteResGroup37 : SchedWriteRes<[HWPort23,HWPort0156]> {
def WriteVMASKMOVPmr : SchedWriteRes<[HWPort0, HWPort1, HWPort4, HWPort23]> {		let Latency = 2;
let Latency = 13;		let NumMicroOps = 3;
		let ResourceCycles = [1,2];
		}
		def: InstRW<[HWWriteResGroup37], (instregex "LEAVE64")>;
		def: InstRW<[HWWriteResGroup37], (instregex "SCASB")>;
		def: InstRW<[HWWriteResGroup37], (instregex "SCASL")>;
		def: InstRW<[HWWriteResGroup37], (instregex "SCASQ")>;
		def: InstRW<[HWWriteResGroup37], (instregex "SCASW")>;

		def HWWriteResGroup38 : SchedWriteRes<[HWPort0,HWPort5,HWPort23]> {
		let Latency = 2;
		let NumMicroOps = 3;
		let ResourceCycles = [1,1,1];
		}
		def: InstRW<[HWWriteResGroup38], (instregex "PSLLDrm")>;
		def: InstRW<[HWWriteResGroup38], (instregex "PSLLQrm")>;
		def: InstRW<[HWWriteResGroup38], (instregex "PSLLWrm")>;
		def: InstRW<[HWWriteResGroup38], (instregex "PSRADrm")>;
		def: InstRW<[HWWriteResGroup38], (instregex "PSRAWrm")>;
		def: InstRW<[HWWriteResGroup38], (instregex "PSRLDrm")>;
		def: InstRW<[HWWriteResGroup38], (instregex "PSRLQrm")>;
		def: InstRW<[HWWriteResGroup38], (instregex "PSRLWrm")>;
		def: InstRW<[HWWriteResGroup38], (instregex "PTESTrm")>;
		def: InstRW<[HWWriteResGroup38], (instregex "VPSLLDrm")>;
		def: InstRW<[HWWriteResGroup38], (instregex "VPSLLQrm")>;
		def: InstRW<[HWWriteResGroup38], (instregex "VPSLLWrm")>;
		def: InstRW<[HWWriteResGroup38], (instregex "VPSRADrm")>;
		def: InstRW<[HWWriteResGroup38], (instregex "VPSRAWrm")>;
		def: InstRW<[HWWriteResGroup38], (instregex "VPSRLDrm")>;
		def: InstRW<[HWWriteResGroup38], (instregex "VPSRLQrm")>;
		def: InstRW<[HWWriteResGroup38], (instregex "VPSRLWrm")>;
		def: InstRW<[HWWriteResGroup38], (instregex "VPTESTrm")>;

		def HWWriteResGroup39 : SchedWriteRes<[HWPort0,HWPort01,HWPort23]> {
		let Latency = 2;
		let NumMicroOps = 3;
		let ResourceCycles = [1,1,1];
		}
		def: InstRW<[HWWriteResGroup39], (instregex "FLDCW16m")>;

		def HWWriteResGroup40 : SchedWriteRes<[HWPort0,HWPort23,HWPort0156]> {
		let Latency = 2;
		let NumMicroOps = 3;
		let ResourceCycles = [1,1,1];
		}
		def: InstRW<[HWWriteResGroup40], (instregex "LDMXCSR")>;
		def: InstRW<[HWWriteResGroup40], (instregex "VLDMXCSR")>;

		def HWWriteResGroup41 : SchedWriteRes<[HWPort6,HWPort23,HWPort0156]> {
		let Latency = 2;
		let NumMicroOps = 3;
		let ResourceCycles = [1,1,1];
		}
		def: InstRW<[HWWriteResGroup41], (instregex "LRETQ")>;
		def: InstRW<[HWWriteResGroup41], (instregex "RETQ")>;

		def HWWriteResGroup42 : SchedWriteRes<[HWPort23,HWPort06,HWPort15]> {
		let Latency = 2;
		let NumMicroOps = 3;
		let ResourceCycles = [1,1,1];
		}
		def: InstRW<[HWWriteResGroup42], (instregex "BEXTR32rm")>;
		def: InstRW<[HWWriteResGroup42], (instregex "BEXTR64rm")>;

		def HWWriteResGroup43 : SchedWriteRes<[HWPort23,HWPort06,HWPort0156]> {
		let Latency = 2;
		let NumMicroOps = 3;
		let ResourceCycles = [1,1,1];
		}
		def: InstRW<[HWWriteResGroup43], (instregex "ADC(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup43], (instregex "ADC8rm")>;
		def: InstRW<[HWWriteResGroup43], (instregex "CMOVAE(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup43], (instregex "CMOVB(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup43], (instregex "CMOVE(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup43], (instregex "CMOVG(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup43], (instregex "CMOVGE(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup43], (instregex "CMOVL(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup43], (instregex "CMOVLE(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup43], (instregex "CMOVNE(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup43], (instregex "CMOVNO(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup43], (instregex "CMOVNP(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup43], (instregex "CMOVNS(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup43], (instregex "CMOVO(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup43], (instregex "CMOVP(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup43], (instregex "CMOVS(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup43], (instregex "SBB(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup43], (instregex "SBB8rm")>;

		def HWWriteResGroup44 : SchedWriteRes<[HWPort4,HWPort6,HWPort237,HWPort0156]> {
		let Latency = 2;
let NumMicroOps = 4;		let NumMicroOps = 4;
let ResourceCycles = [1, 1, 1, 1];		let ResourceCycles = [1,1,1,1];
}		}
def : InstRW<[WriteVMASKMOVPmr], (instregex "VMASKMOVP(S\|D)mr")>;		def: InstRW<[HWWriteResGroup44], (instregex "CALL(16\|32\|64)r")>;

// m256,y,y.		def HWWriteResGroup45 : SchedWriteRes<[HWPort4,HWPort237,HWPort06,HWPort0156]> {
def WriteVMASKMOVPYmr : SchedWriteRes<[HWPort0, HWPort1, HWPort4, HWPort23]> {		let Latency = 2;
let Latency = 14;
let NumMicroOps = 4;		let NumMicroOps = 4;
let ResourceCycles = [1, 1, 1, 1];		let ResourceCycles = [1,1,1,1];
}		}
def : InstRW<[WriteVMASKMOVPYmr], (instregex "VMASKMOVP(S\|D)Ymr")>;		def: InstRW<[HWWriteResGroup45], (instregex "CALL64pcrel32")>;
		def: InstRW<[HWWriteResGroup45], (instregex "SETAm")>;
		def: InstRW<[HWWriteResGroup45], (instregex "SETBEm")>;

// VGATHERDPS.		def HWWriteResGroup46 : SchedWriteRes<[HWPort4,HWPort23,HWPort237,HWPort06]> {
// x.		let Latency = 2;
def WriteVGATHERDPS128 : SchedWriteRes<[]> {		let NumMicroOps = 5;
let NumMicroOps = 20;		let ResourceCycles = [1,1,1,2];
}		}
def : InstRW<[WriteVGATHERDPS128, ReadAfterLd], (instregex "VGATHERDPSrm")>;		def: InstRW<[HWWriteResGroup46], (instregex "ROL(16\|32\|64)m1")>;
		def: InstRW<[HWWriteResGroup46], (instregex "ROL(16\|32\|64)mi")>;
		def: InstRW<[HWWriteResGroup46], (instregex "ROL8m1")>;
		def: InstRW<[HWWriteResGroup46], (instregex "ROL8mi")>;
		def: InstRW<[HWWriteResGroup46], (instregex "ROR(16\|32\|64)m1")>;
		def: InstRW<[HWWriteResGroup46], (instregex "ROR(16\|32\|64)mi")>;
		def: InstRW<[HWWriteResGroup46], (instregex "ROR8m1")>;
		def: InstRW<[HWWriteResGroup46], (instregex "ROR8mi")>;

// y.		def HWWriteResGroup47 : SchedWriteRes<[HWPort4,HWPort23,HWPort237,HWPort0156]> {
def WriteVGATHERDPS256 : SchedWriteRes<[]> {		let Latency = 2;
let NumMicroOps = 34;		let NumMicroOps = 5;
		let ResourceCycles = [1,1,1,2];
}		}
def : InstRW<[WriteVGATHERDPS256, ReadAfterLd], (instregex "VGATHERDPSYrm")>;		def: InstRW<[HWWriteResGroup47], (instregex "XADD(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup47], (instregex "XADD8rm")>;

// VGATHERQPS.		def HWWriteResGroup48 : SchedWriteRes<[HWPort4,HWPort6,HWPort23,HWPort237,HWPort0156]> {
// x.		let Latency = 2;
def WriteVGATHERQPS128 : SchedWriteRes<[]> {		let NumMicroOps = 5;
let NumMicroOps = 15;		let ResourceCycles = [1,1,1,1,1];
}		}
def : InstRW<[WriteVGATHERQPS128, ReadAfterLd], (instregex "VGATHERQPSrm")>;		def: InstRW<[HWWriteResGroup48], (instregex "CALL(16\|32\|64)m")>;
		def: InstRW<[HWWriteResGroup48], (instregex "FARCALL64")>;

// y.		def HWWriteResGroup49 : SchedWriteRes<[HWPort0]> {
def WriteVGATHERQPS256 : SchedWriteRes<[]> {		let Latency = 3;
let NumMicroOps = 22;		let NumMicroOps = 1;
		let ResourceCycles = [1];
}		}
def : InstRW<[WriteVGATHERQPS256, ReadAfterLd], (instregex "VGATHERQPSYrm")>;		def: InstRW<[HWWriteResGroup49], (instregex "MOVMSKPDrr")>;
		def: InstRW<[HWWriteResGroup49], (instregex "MOVMSKPSrr")>;
		def: InstRW<[HWWriteResGroup49], (instregex "PMOVMSKBrr")>;
		def: InstRW<[HWWriteResGroup49], (instregex "VMOVMSKPDYrr")>;
		def: InstRW<[HWWriteResGroup49], (instregex "VMOVMSKPDrr")>;
		def: InstRW<[HWWriteResGroup49], (instregex "VMOVMSKPSYrr")>;
		def: InstRW<[HWWriteResGroup49], (instregex "VMOVMSKPSrr")>;
		def: InstRW<[HWWriteResGroup49], (instregex "VPMOVMSKBYrr")>;
		def: InstRW<[HWWriteResGroup49], (instregex "VPMOVMSKBrr")>;

// VGATHERDPD.		def HWWriteResGroup50 : SchedWriteRes<[HWPort1]> {
// x.		let Latency = 3;
def WriteVGATHERDPD128 : SchedWriteRes<[]> {		let NumMicroOps = 1;
let NumMicroOps = 12;		let ResourceCycles = [1];
}		}
def : InstRW<[WriteVGATHERDPD128, ReadAfterLd], (instregex "VGATHERDPDrm")>;		def: InstRW<[HWWriteResGroup50], (instregex "ADDPDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "ADDPSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "ADDSDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "ADDSSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "ADDSUBPDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "ADDSUBPSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "ADD_FPrST0")>;
		def: InstRW<[HWWriteResGroup50], (instregex "ADD_FST0r")>;
		def: InstRW<[HWWriteResGroup50], (instregex "ADD_FrST0")>;
		def: InstRW<[HWWriteResGroup50], (instregex "BSF(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "BSR(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "CMPPDrri")>;
		def: InstRW<[HWWriteResGroup50], (instregex "CMPPSrri")>;
		def: InstRW<[HWWriteResGroup50], (instregex "CMPSSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "COMISDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "COMISSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "CVTDQ2PSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "CVTPS2DQrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "CVTTPS2DQrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "IMUL(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "IMUL8r")>;
		def: InstRW<[HWWriteResGroup50], (instregex "LZCNT(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "MAXPDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "MAXPSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "MAXSDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "MAXSSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "MINPDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "MINPSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "MINSDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "MINSSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "MMX_CVTPI2PSirr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "MUL8r")>;
		def: InstRW<[HWWriteResGroup50], (instregex "PDEP32rr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "PDEP64rr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "PEXT32rr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "PEXT64rr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "POPCNT(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "SHLD(16\|32\|64)rri8")>;
		def: InstRW<[HWWriteResGroup50], (instregex "SHRD(16\|32\|64)rri8")>;
		def: InstRW<[HWWriteResGroup50], (instregex "SUBPDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "SUBPSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "SUBR_FPrST0")>;
		def: InstRW<[HWWriteResGroup50], (instregex "SUBR_FST0r")>;
		def: InstRW<[HWWriteResGroup50], (instregex "SUBR_FrST0")>;
		def: InstRW<[HWWriteResGroup50], (instregex "SUBSDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "SUBSSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "SUB_FPrST0")>;
		def: InstRW<[HWWriteResGroup50], (instregex "SUB_FST0r")>;
		def: InstRW<[HWWriteResGroup50], (instregex "SUB_FrST0")>;
		def: InstRW<[HWWriteResGroup50], (instregex "TZCNT(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "UCOMISDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "UCOMISSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VADDPDYrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VADDPDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VADDPSYrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VADDPSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VADDSDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VADDSSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VADDSUBPDYrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VADDSUBPDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VADDSUBPSYrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VADDSUBPSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VCMPPDYrri")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VCMPPDrri")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VCMPPSYrri")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VCMPPSrri")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VCMPSDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VCMPSSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VCOMISDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VCOMISSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VCVTDQ2PSYrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VCVTDQ2PSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VCVTPS2DQYrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VCVTPS2DQrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VCVTTPS2DQYrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VCVTTPS2DQrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VMAXPDYrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VMAXPDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VMAXPSYrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VMAXPSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VMAXSDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VMAXSSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VMINPDYrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VMINPDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VMINPSYrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VMINPSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VMINSDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VMINSSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VSUBPDYrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VSUBPDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VSUBPSYrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VSUBPSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VSUBSDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VSUBSSrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VUCOMISDrr")>;
		def: InstRW<[HWWriteResGroup50], (instregex "VUCOMISSrr")>;

// y.		def HWWriteResGroup51 : SchedWriteRes<[HWPort5]> {
def WriteVGATHERDPD256 : SchedWriteRes<[]> {		let Latency = 3;
let NumMicroOps = 20;		let NumMicroOps = 1;
		let ResourceCycles = [1];
}		}
def : InstRW<[WriteVGATHERDPD256, ReadAfterLd], (instregex "VGATHERDPDYrm")>;		def: InstRW<[HWWriteResGroup51], (instregex "VBROADCASTSDYrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VBROADCASTSSYrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VEXTRACTF128rr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VEXTRACTI128rr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VINSERTF128rr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VINSERTI128rr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPBROADCASTBYrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPBROADCASTBrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPBROADCASTDYrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPBROADCASTQYrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPBROADCASTWYrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPBROADCASTWrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPERM2F128rr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPERM2I128rr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPERMDYrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPERMPDYri")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPERMPSYrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPERMQYri")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPMOVSXBDYrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPMOVSXBQYrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPMOVSXBWYrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPMOVSXDQYrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPMOVSXWDYrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPMOVSXWQYrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPMOVZXBDYrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPMOVZXBQYrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPMOVZXBWYrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPMOVZXDQYrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPMOVZXWDYrr")>;
		def: InstRW<[HWWriteResGroup51], (instregex "VPMOVZXWQYrr")>;

// VGATHERQPD.		def HWWriteResGroup52 : SchedWriteRes<[HWPort1,HWPort23]> {
// x.		let Latency = 3;
		craig.topperUnsubmitted Not Done Reply Inline Actions Should this account for load latency? craig.topper: Should this account for load latency?
		gadi.haberAuthorUnsubmitted Not Done Reply Inline Actions yes, according to the SNB architects. gadi.haber: yes, according to the SNB architects.
		craig.topperUnsubmitted Not Done Reply Inline Actions If it shoudl include load latency shouldn't it have a latency of more than 3? ADDPDrr is in a group with latency 3. So shoudln't ADDPrm be more than 3? craig.topper: If it shoudl include load latency shouldn't it have a latency of more than 3? ADDPDrr is in a…
		gadi.haberAuthorUnsubmitted Not Done Reply Inline Actions The scheduling model is based on the fact that there are no memory latencies effects, i.e., no cache misses and everything is in the 1st level cache. This is the model successfully used and constantly verified by the architects. The performance measurements we ran support this model. gadi.haber: The scheduling model is based on the fact that there are no memory latencies effects, i.e., no…
		craig.topperUnsubmitted Not Done Reply Inline Actions I understand assuming everyting is in L1. But in the SandyBridge model you have ADDPDrr as 3 cycles and ADDPDrm as 9 cycles. So it seems you're accounting for the load as being 6 cycles. But in Haswell you have both as 3 cycles. So loads from the L1 are free on Haswell? craig.topper: I understand assuming everyting is in L1. But in the SandyBridge model you have ADDPDrr as 3…
		gadi.haberAuthorUnsubmitted Not Done Reply Inline Actions What I understood from the architects who explained it to me is that the memory access in SNB required additional cycles even when everything is in L1. The exact additional cycles depends on the instruction's ucode. As a result there are memory instructions that require less additional cycles than others. For example: MOV(16\|32\|64)rr requires 1 cycle whereas MOV(16\|32\|64)rm requires 5 cycles. In here he difference is 4 cycles (not additional 6 as in ADDPD). gadi.haber: What I understood from the architects who explained it to me is that the memory access in SNB…
def WriteVGATHERQPD128 : SchedWriteRes<[]> {		let NumMicroOps = 2;
let NumMicroOps = 14;		let ResourceCycles = [1,1];
}		}
def : InstRW<[WriteVGATHERQPD128, ReadAfterLd], (instregex "VGATHERQPDrm")>;		def: InstRW<[HWWriteResGroup52], (instregex "ADDPDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "ADDPSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "ADDSDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "ADDSSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "ADDSUBPDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "ADDSUBPSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "ADD_F32m")>;
		def: InstRW<[HWWriteResGroup52], (instregex "ADD_F64m")>;
		def: InstRW<[HWWriteResGroup52], (instregex "BSF(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "BSR(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "CMPPDrmi")>;
		def: InstRW<[HWWriteResGroup52], (instregex "CMPPSrmi")>;
		def: InstRW<[HWWriteResGroup52], (instregex "CMPSSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "COMISDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "COMISSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "CVTDQ2PSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "CVTPS2DQrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "CVTTPS2DQrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "ILD_F16m")>;
		def: InstRW<[HWWriteResGroup52], (instregex "ILD_F32m")>;
		def: InstRW<[HWWriteResGroup52], (instregex "ILD_F64m")>;
		def: InstRW<[HWWriteResGroup52], (instregex "IMUL(16\|32\|64)m")>;
		def: InstRW<[HWWriteResGroup52], (instregex "IMUL(16\|32\|64)rm")>;
		craig.topperUnsubmitted Not Done Reply Inline Actions I believe believe this IMUL8m - 2 uops IMUL16m - 5 uops IMUL32m - 4 uops IMUL64m - 3 uops craig.topper: I believe believe this IMUL8m - 2 uops IMUL16m - 5 uops IMUL32m - 4 uops IMUL64m - 3 uops
		def: InstRW<[HWWriteResGroup52], (instregex "IMUL8m")>;
		def: InstRW<[HWWriteResGroup52], (instregex "LZCNT(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "MAXPDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "MAXPSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "MAXSDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "MAXSSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "MINPDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "MINPSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "MINSDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "MINSSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "MMX_CVTPI2PSirm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "MMX_CVTPS2PIirm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "MMX_CVTTPS2PIirm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "MUL(16\|32\|64)m")>;
		craig.topperUnsubmitted Not Done Reply Inline Actions I believe this MUL8m - 2 uops MUL16m - 5 uops MUL32m - 4 uops MUL64m - 3 uops craig.topper: I believe this MUL8m - 2 uops MUL16m - 5 uops MUL32m - 4 uops MUL64m - 3 uops
		def: InstRW<[HWWriteResGroup52], (instregex "MUL8m")>;
		def: InstRW<[HWWriteResGroup52], (instregex "PDEP32rm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "PDEP64rm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "PEXT32rm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "PEXT64rm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "POPCNT(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "SUBPDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "SUBPSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "SUBR_F32m")>;
		def: InstRW<[HWWriteResGroup52], (instregex "SUBR_F64m")>;
		def: InstRW<[HWWriteResGroup52], (instregex "SUBSDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "SUBSSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "SUB_F32m")>;
		def: InstRW<[HWWriteResGroup52], (instregex "SUB_F64m")>;
		def: InstRW<[HWWriteResGroup52], (instregex "TZCNT(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "UCOMISDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "UCOMISSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VADDPDYrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VADDPDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VADDPSYrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VADDPSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VADDSDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VADDSSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VADDSUBPDYrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VADDSUBPDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VADDSUBPSYrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VADDSUBPSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VCMPPDYrmi")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VCMPPDrmi")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VCMPPSYrmi")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VCMPPSrmi")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VCMPSDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VCMPSSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VCOMISDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VCOMISSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VCVTDQ2PSYrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VCVTDQ2PSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VCVTPS2DQYrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VCVTPS2DQrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VCVTTPS2DQYrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VCVTTPS2DQrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VMAXPDYrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VMAXPDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VMAXPSYrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VMAXPSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VMAXSDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VMAXSSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VMINPDYrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VMINPDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VMINPSYrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VMINPSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VMINSDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VMINSSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VSUBPDYrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VSUBPDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VSUBPSYrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VSUBPSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VSUBSDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VSUBSSrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VUCOMISDrm")>;
		def: InstRW<[HWWriteResGroup52], (instregex "VUCOMISSrm")>;

// y.		def HWWriteResGroup53 : SchedWriteRes<[HWPort5,HWPort23]> {
def WriteVGATHERQPD256 : SchedWriteRes<[]> {		let Latency = 3;
let NumMicroOps = 22;		let NumMicroOps = 2;
		let ResourceCycles = [1,1];
}		}
def : InstRW<[WriteVGATHERQPD256, ReadAfterLd], (instregex "VGATHERQPDYrm")>;		def: InstRW<[HWWriteResGroup53], (instregex "VPERM2F128rm")>;
		def: InstRW<[HWWriteResGroup53], (instregex "VPERM2I128rm")>;
		def: InstRW<[HWWriteResGroup53], (instregex "VPERMDYrm")>;
		def: InstRW<[HWWriteResGroup53], (instregex "VPERMPDYmi")>;
		def: InstRW<[HWWriteResGroup53], (instregex "VPERMPSYrm")>;
		def: InstRW<[HWWriteResGroup53], (instregex "VPERMQYmi")>;
		def: InstRW<[HWWriteResGroup53], (instregex "VPMOVSXBDYrm")>;
		def: InstRW<[HWWriteResGroup53], (instregex "VPMOVSXBQYrm")>;
		def: InstRW<[HWWriteResGroup53], (instregex "VPMOVSXBWYrm")>;
		def: InstRW<[HWWriteResGroup53], (instregex "VPMOVSXDQYrm")>;
		def: InstRW<[HWWriteResGroup53], (instregex "VPMOVSXWDYrm")>;
		def: InstRW<[HWWriteResGroup53], (instregex "VPMOVSXWQYrm")>;
		def: InstRW<[HWWriteResGroup53], (instregex "VPMOVZXBDYrm")>;
		def: InstRW<[HWWriteResGroup53], (instregex "VPMOVZXBQYrm")>;
		def: InstRW<[HWWriteResGroup53], (instregex "VPMOVZXBWYrm")>;
		def: InstRW<[HWWriteResGroup53], (instregex "VPMOVZXDQYrm")>;
		def: InstRW<[HWWriteResGroup53], (instregex "VPMOVZXWDYrm")>;
		def: InstRW<[HWWriteResGroup53], (instregex "VPMOVZXWQYrm")>;

//-- Conversion instructions --//		def HWWriteResGroup54 : SchedWriteRes<[HWPort0156]> {
		let Latency = 3;
		let NumMicroOps = 3;
		let ResourceCycles = [3];
		}
		def: InstRW<[HWWriteResGroup54], (instregex "XADD(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup54], (instregex "XADD8rr")>;
		def: InstRW<[HWWriteResGroup54], (instregex "XCHG8rr")>;

// CVTPD2PS.		def HWWriteResGroup55 : SchedWriteRes<[HWPort0,HWPort5]> {
// x,x.		let Latency = 3;
def : InstRW<[WriteP1_P5_Lat4], (instregex "(V?)CVTPD2PSrr")>;		let NumMicroOps = 3;
		let ResourceCycles = [2,1];
		}
		def: InstRW<[HWWriteResGroup55], (instregex "VPSLLVDYrr")>;
		def: InstRW<[HWWriteResGroup55], (instregex "VPSLLVDrr")>;
		def: InstRW<[HWWriteResGroup55], (instregex "VPSRAVDYrr")>;
		def: InstRW<[HWWriteResGroup55], (instregex "VPSRAVDrr")>;
		def: InstRW<[HWWriteResGroup55], (instregex "VPSRLVDYrr")>;
		def: InstRW<[HWWriteResGroup55], (instregex "VPSRLVDrr")>;

// x,m128.		def HWWriteResGroup56 : SchedWriteRes<[HWPort5,HWPort15]> {
def : InstRW<[WriteP1_P5_Lat4Ld], (instregex "(V?)CVTPD2PS(X?)rm")>;		let Latency = 3;
		let NumMicroOps = 3;
		let ResourceCycles = [2,1];
		}
		def: InstRW<[HWWriteResGroup56], (instregex "MMX_PHADDSWrr64")>;
		def: InstRW<[HWWriteResGroup56], (instregex "MMX_PHADDWrr64")>;
		def: InstRW<[HWWriteResGroup56], (instregex "MMX_PHADDrr64")>;
		def: InstRW<[HWWriteResGroup56], (instregex "MMX_PHSUBDrr64")>;
		def: InstRW<[HWWriteResGroup56], (instregex "MMX_PHSUBSWrr64")>;
		def: InstRW<[HWWriteResGroup56], (instregex "MMX_PHSUBWrr64")>;
		def: InstRW<[HWWriteResGroup56], (instregex "PHADDDrr")>;
		def: InstRW<[HWWriteResGroup56], (instregex "PHADDSWrr128")>;
		def: InstRW<[HWWriteResGroup56], (instregex "PHADDWrr")>;
		def: InstRW<[HWWriteResGroup56], (instregex "PHSUBDrr")>;
		def: InstRW<[HWWriteResGroup56], (instregex "PHSUBSWrr128")>;
		def: InstRW<[HWWriteResGroup56], (instregex "PHSUBWrr")>;
		def: InstRW<[HWWriteResGroup56], (instregex "VPHADDDYrr")>;
		def: InstRW<[HWWriteResGroup56], (instregex "VPHADDDrr")>;
		def: InstRW<[HWWriteResGroup56], (instregex "VPHADDSWrr128")>;
		def: InstRW<[HWWriteResGroup56], (instregex "VPHADDSWrr256")>;
		def: InstRW<[HWWriteResGroup56], (instregex "VPHADDWYrr")>;
		def: InstRW<[HWWriteResGroup56], (instregex "VPHADDWrr")>;
		def: InstRW<[HWWriteResGroup56], (instregex "VPHSUBDYrr")>;
		def: InstRW<[HWWriteResGroup56], (instregex "VPHSUBDrr")>;
		def: InstRW<[HWWriteResGroup56], (instregex "VPHSUBSWrr128")>;
		def: InstRW<[HWWriteResGroup56], (instregex "VPHSUBSWrr256")>;
		def: InstRW<[HWWriteResGroup56], (instregex "VPHSUBWYrr")>;
		def: InstRW<[HWWriteResGroup56], (instregex "VPHSUBWrr")>;

// x,y.		def HWWriteResGroup57 : SchedWriteRes<[HWPort5,HWPort0156]> {
def WriteCVTPD2PSYrr : SchedWriteRes<[HWPort1, HWPort5]> {		let Latency = 3;
let Latency = 5;		let NumMicroOps = 3;
let NumMicroOps = 2;		let ResourceCycles = [2,1];
let ResourceCycles = [1, 1];
}		}
def : InstRW<[WriteCVTPD2PSYrr], (instregex "(V?)CVTPD2PSYrr")>;		def: InstRW<[HWWriteResGroup57], (instregex "MMX_PACKSSDWirr")>;
		def: InstRW<[HWWriteResGroup57], (instregex "MMX_PACKSSWBirr")>;
		def: InstRW<[HWWriteResGroup57], (instregex "MMX_PACKUSWBirr")>;

// x,m256.		def HWWriteResGroup58 : SchedWriteRes<[HWPort6,HWPort0156]> {
def WriteCVTPD2PSYrm : SchedWriteRes<[HWPort1, HWPort5, HWPort23]> {		let Latency = 3;
let Latency = 9;		let NumMicroOps = 3;
		let ResourceCycles = [1,2];
		}
		def: InstRW<[HWWriteResGroup58], (instregex "CLD")>;

		def HWWriteResGroup59 : SchedWriteRes<[HWPort06,HWPort0156]> {
		let Latency = 3;
		let NumMicroOps = 3;
		let ResourceCycles = [1,2];
		}
		def: InstRW<[HWWriteResGroup59], (instregex "CMOVA(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup59], (instregex "CMOVBE(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup59], (instregex "RCL(16\|32\|64)r1")>;
		def: InstRW<[HWWriteResGroup59], (instregex "RCL(16\|32\|64)ri")>;
		def: InstRW<[HWWriteResGroup59], (instregex "RCL8r1")>;
		def: InstRW<[HWWriteResGroup59], (instregex "RCL8ri")>;
		def: InstRW<[HWWriteResGroup59], (instregex "RCR(16\|32\|64)r1")>;
		def: InstRW<[HWWriteResGroup59], (instregex "RCR(16\|32\|64)ri")>;
		def: InstRW<[HWWriteResGroup59], (instregex "RCR8r1")>;
		def: InstRW<[HWWriteResGroup59], (instregex "RCR8ri")>;

		def HWWriteResGroup60 : SchedWriteRes<[HWPort06,HWPort0156]> {
		let Latency = 3;
		let NumMicroOps = 3;
		let ResourceCycles = [2,1];
		}
		def: InstRW<[HWWriteResGroup60], (instregex "ROL(16\|32\|64)rCL")>;
		def: InstRW<[HWWriteResGroup60], (instregex "ROL8rCL")>;
		def: InstRW<[HWWriteResGroup60], (instregex "ROR(16\|32\|64)rCL")>;
		def: InstRW<[HWWriteResGroup60], (instregex "ROR8rCL")>;
		def: InstRW<[HWWriteResGroup60], (instregex "SAR(16\|32\|64)rCL")>;
		def: InstRW<[HWWriteResGroup60], (instregex "SAR8rCL")>;
		def: InstRW<[HWWriteResGroup60], (instregex "SHL(16\|32\|64)rCL")>;
		def: InstRW<[HWWriteResGroup60], (instregex "SHL8rCL")>;
		def: InstRW<[HWWriteResGroup60], (instregex "SHR(16\|32\|64)rCL")>;
		def: InstRW<[HWWriteResGroup60], (instregex "SHR8rCL")>;

		def HWWriteResGroup61 : SchedWriteRes<[HWPort0,HWPort4,HWPort237]> {
		let Latency = 3;
let NumMicroOps = 3;		let NumMicroOps = 3;
let ResourceCycles = [1, 1, 1];		let ResourceCycles = [1,1,1];
}		}
def : InstRW<[WriteCVTPD2PSYrm], (instregex "(V?)CVTPD2PSYrm")>;		def: InstRW<[HWWriteResGroup61], (instregex "FNSTSWm")>;

// CVTSD2SS.		def HWWriteResGroup62 : SchedWriteRes<[HWPort1,HWPort4,HWPort237]> {
// x,x.		let Latency = 3;
def : InstRW<[WriteP1_P5_Lat4], (instregex "(Int_)?(V)?CVTSD2SSrr")>;		let NumMicroOps = 3;
		let ResourceCycles = [1,1,1];
		}
		def: InstRW<[HWWriteResGroup62], (instregex "ISTT_FP16m")>;
		def: InstRW<[HWWriteResGroup62], (instregex "ISTT_FP32m")>;
		def: InstRW<[HWWriteResGroup62], (instregex "ISTT_FP64m")>;
		def: InstRW<[HWWriteResGroup62], (instregex "IST_F16m")>;
		def: InstRW<[HWWriteResGroup62], (instregex "IST_F32m")>;
		def: InstRW<[HWWriteResGroup62], (instregex "IST_FP16m")>;
		def: InstRW<[HWWriteResGroup62], (instregex "IST_FP32m")>;
		def: InstRW<[HWWriteResGroup62], (instregex "IST_FP64m")>;

// x,m64.		def HWWriteResGroup63 : SchedWriteRes<[HWPort0,HWPort5,HWPort23]> {
def : InstRW<[WriteP1_P5_Lat4Ld], (instregex "(Int_)?(V)?CVTSD2SSrm")>;		let Latency = 3;
		let NumMicroOps = 4;
		let ResourceCycles = [2,1,1];
		}
		def: InstRW<[HWWriteResGroup63], (instregex "VPSLLVDYrm")>;
		def: InstRW<[HWWriteResGroup63], (instregex "VPSLLVDrm")>;
		def: InstRW<[HWWriteResGroup63], (instregex "VPSRAVDYrm")>;
		def: InstRW<[HWWriteResGroup63], (instregex "VPSRAVDrm")>;
		def: InstRW<[HWWriteResGroup63], (instregex "VPSRLVDYrm")>;
		def: InstRW<[HWWriteResGroup63], (instregex "VPSRLVDrm")>;

// CVTPS2PD.		def HWWriteResGroup64 : SchedWriteRes<[HWPort5,HWPort23,HWPort15]> {
// x,x.		let Latency = 3;
def WriteCVTPS2PDrr : SchedWriteRes<[HWPort0, HWPort5]> {		let NumMicroOps = 4;
let Latency = 2;		let ResourceCycles = [2,1,1];
		}
		def: InstRW<[HWWriteResGroup64], (instregex "MMX_PHADDSWrm64")>;
		def: InstRW<[HWWriteResGroup64], (instregex "MMX_PHADDWrm64")>;
		def: InstRW<[HWWriteResGroup64], (instregex "MMX_PHADDrm64")>;
		def: InstRW<[HWWriteResGroup64], (instregex "MMX_PHSUBDrm64")>;
		def: InstRW<[HWWriteResGroup64], (instregex "MMX_PHSUBSWrm64")>;
		def: InstRW<[HWWriteResGroup64], (instregex "MMX_PHSUBWrm64")>;
		def: InstRW<[HWWriteResGroup64], (instregex "PHADDDrm")>;
		def: InstRW<[HWWriteResGroup64], (instregex "PHADDSWrm128")>;
		def: InstRW<[HWWriteResGroup64], (instregex "PHADDWrm")>;
		def: InstRW<[HWWriteResGroup64], (instregex "PHSUBDrm")>;
		def: InstRW<[HWWriteResGroup64], (instregex "PHSUBSWrm128")>;
		def: InstRW<[HWWriteResGroup64], (instregex "PHSUBWrm")>;
		def: InstRW<[HWWriteResGroup64], (instregex "VPHADDDYrm")>;
		def: InstRW<[HWWriteResGroup64], (instregex "VPHADDDrm")>;
		def: InstRW<[HWWriteResGroup64], (instregex "VPHADDSWrm128")>;
		def: InstRW<[HWWriteResGroup64], (instregex "VPHADDSWrm256")>;
		def: InstRW<[HWWriteResGroup64], (instregex "VPHADDWYrm")>;
		def: InstRW<[HWWriteResGroup64], (instregex "VPHADDWrm")>;
		def: InstRW<[HWWriteResGroup64], (instregex "VPHSUBDYrm")>;
		def: InstRW<[HWWriteResGroup64], (instregex "VPHSUBDrm")>;
		def: InstRW<[HWWriteResGroup64], (instregex "VPHSUBSWrm128")>;
		def: InstRW<[HWWriteResGroup64], (instregex "VPHSUBSWrm256")>;
		def: InstRW<[HWWriteResGroup64], (instregex "VPHSUBWYrm")>;
		def: InstRW<[HWWriteResGroup64], (instregex "VPHSUBWrm")>;

		def HWWriteResGroup65 : SchedWriteRes<[HWPort23,HWPort06,HWPort0156]> {
		let Latency = 3;
		let NumMicroOps = 4;
		let ResourceCycles = [1,1,2];
		}
		def: InstRW<[HWWriteResGroup65], (instregex "CMOVA(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup65], (instregex "CMOVBE(16\|32\|64)rm")>;

		def HWWriteResGroup66 : SchedWriteRes<[HWPort23,HWPort237,HWPort06,HWPort0156]> {
		let Latency = 3;
		let NumMicroOps = 5;
		let ResourceCycles = [1,1,1,2];
		}
		def: InstRW<[HWWriteResGroup66], (instregex "RCL(16\|32\|64)m1")>;
		def: InstRW<[HWWriteResGroup66], (instregex "RCL(16\|32\|64)mi")>;
		def: InstRW<[HWWriteResGroup66], (instregex "RCL8m1")>;
		def: InstRW<[HWWriteResGroup66], (instregex "RCL8mi")>;
		def: InstRW<[HWWriteResGroup66], (instregex "RCR(16\|32\|64)m1")>;
		def: InstRW<[HWWriteResGroup66], (instregex "RCR(16\|32\|64)mi")>;
		def: InstRW<[HWWriteResGroup66], (instregex "RCR8m1")>;
		def: InstRW<[HWWriteResGroup66], (instregex "RCR8mi")>;

		def HWWriteResGroup67 : SchedWriteRes<[HWPort23,HWPort237,HWPort06,HWPort0156]> {
		let Latency = 3;
		let NumMicroOps = 5;
		let ResourceCycles = [1,1,2,1];
		}
		def: InstRW<[HWWriteResGroup67], (instregex "ROR(16\|32\|64)mCL")>;
		def: InstRW<[HWWriteResGroup67], (instregex "ROR8mCL")>;

		def HWWriteResGroup68 : SchedWriteRes<[HWPort4,HWPort23,HWPort237,HWPort0156]> {
		let Latency = 3;
		let NumMicroOps = 6;
		let ResourceCycles = [1,1,1,3];
		}
		def: InstRW<[HWWriteResGroup68], (instregex "ADC(16\|32\|64)mi8")>;
		def: InstRW<[HWWriteResGroup68], (instregex "ADC8mi")>;
		def: InstRW<[HWWriteResGroup68], (instregex "ADD8mi")>;
		def: InstRW<[HWWriteResGroup68], (instregex "AND8mi")>;
		def: InstRW<[HWWriteResGroup68], (instregex "OR8mi")>;
		def: InstRW<[HWWriteResGroup68], (instregex "SUB8mi")>;
		def: InstRW<[HWWriteResGroup68], (instregex "XCHG(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup68], (instregex "XCHG8rm")>;
		def: InstRW<[HWWriteResGroup68], (instregex "XOR8mi")>;

		def HWWriteResGroup69 : SchedWriteRes<[HWPort4,HWPort23,HWPort237,HWPort06,HWPort0156]> {
		let Latency = 3;
		let NumMicroOps = 6;
		let ResourceCycles = [1,1,1,2,1];
		}
		def: InstRW<[HWWriteResGroup69], (instregex "ADC(16\|32\|64)mr")>;
		def: InstRW<[HWWriteResGroup69], (instregex "ADC8mr")>;
		def: InstRW<[HWWriteResGroup69], (instregex "CMPXCHG(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup69], (instregex "CMPXCHG8rm")>;
		def: InstRW<[HWWriteResGroup69], (instregex "ROL(16\|32\|64)mCL")>;
		def: InstRW<[HWWriteResGroup69], (instregex "ROL8mCL")>;
		def: InstRW<[HWWriteResGroup69], (instregex "SAR(16\|32\|64)mCL")>;
		def: InstRW<[HWWriteResGroup69], (instregex "SAR8mCL")>;
		def: InstRW<[HWWriteResGroup69], (instregex "SBB(16\|32\|64)mi8")>;
		def: InstRW<[HWWriteResGroup69], (instregex "SBB(16\|32\|64)mr")>;
		def: InstRW<[HWWriteResGroup69], (instregex "SBB8mi")>;
		def: InstRW<[HWWriteResGroup69], (instregex "SBB8mr")>;
		def: InstRW<[HWWriteResGroup69], (instregex "SHL(16\|32\|64)mCL")>;
		def: InstRW<[HWWriteResGroup69], (instregex "SHL8mCL")>;
		def: InstRW<[HWWriteResGroup69], (instregex "SHR(16\|32\|64)mCL")>;
		def: InstRW<[HWWriteResGroup69], (instregex "SHR8mCL")>;

		def HWWriteResGroup70 : SchedWriteRes<[HWPort0,HWPort1]> {
		let Latency = 4;
let NumMicroOps = 2;		let NumMicroOps = 2;
let ResourceCycles = [1, 1];		let ResourceCycles = [1,1];
}		}
def : InstRW<[WriteCVTPS2PDrr], (instregex "(V?)CVTPS2PDrr")>;		def: InstRW<[HWWriteResGroup70], (instregex "CVTSD2SI64rr")>;
		def: InstRW<[HWWriteResGroup70], (instregex "CVTSD2SIrr")>;
		def: InstRW<[HWWriteResGroup70], (instregex "CVTSS2SI64rr")>;
		def: InstRW<[HWWriteResGroup70], (instregex "CVTSS2SIrr")>;
		def: InstRW<[HWWriteResGroup70], (instregex "CVTTSD2SI64rr")>;
		def: InstRW<[HWWriteResGroup70], (instregex "CVTTSD2SIrr")>;
		def: InstRW<[HWWriteResGroup70], (instregex "CVTTSS2SI64rr")>;
		def: InstRW<[HWWriteResGroup70], (instregex "CVTTSS2SIrr")>;
		def: InstRW<[HWWriteResGroup70], (instregex "VCVTSD2SI64rr")>;
		def: InstRW<[HWWriteResGroup70], (instregex "VCVTSD2SIrr")>;
		def: InstRW<[HWWriteResGroup70], (instregex "VCVTSS2SI64rr")>;
		def: InstRW<[HWWriteResGroup70], (instregex "VCVTSS2SIrr")>;
		def: InstRW<[HWWriteResGroup70], (instregex "VCVTTSD2SI64rr")>;
		def: InstRW<[HWWriteResGroup70], (instregex "VCVTTSD2SIrr")>;
		def: InstRW<[HWWriteResGroup70], (instregex "VCVTTSS2SI64rr")>;
		def: InstRW<[HWWriteResGroup70], (instregex "VCVTTSS2SIrr")>;

// x,m64.		def HWWriteResGroup71 : SchedWriteRes<[HWPort0,HWPort5]> {
// y,m128.		let Latency = 4;
def WriteCVTPS2PDrm : SchedWriteRes<[HWPort0, HWPort23]> {
let Latency = 5;
let NumMicroOps = 2;		let NumMicroOps = 2;
let ResourceCycles = [1, 1];		let ResourceCycles = [1,1];
}		}
def : InstRW<[WriteCVTPS2PDrm], (instregex "(V?)CVTPS2PD(Y?)rm")>;		def: InstRW<[HWWriteResGroup71], (instregex "VCVTPS2PDYrr")>;
		def: InstRW<[HWWriteResGroup71], (instregex "VPSLLDYrr")>;
		def: InstRW<[HWWriteResGroup71], (instregex "VPSLLQYrr")>;
		def: InstRW<[HWWriteResGroup71], (instregex "VPSLLWYrr")>;
		def: InstRW<[HWWriteResGroup71], (instregex "VPSRADYrr")>;
		def: InstRW<[HWWriteResGroup71], (instregex "VPSRAWYrr")>;
		def: InstRW<[HWWriteResGroup71], (instregex "VPSRLDYrr")>;
		def: InstRW<[HWWriteResGroup71], (instregex "VPSRLQYrr")>;
		def: InstRW<[HWWriteResGroup71], (instregex "VPSRLWYrr")>;
		def: InstRW<[HWWriteResGroup71], (instregex "VPTESTYrr")>;

// y,x.		def HWWriteResGroup72 : SchedWriteRes<[HWPort0,HWPort0156]> {
def WriteVCVTPS2PDYrr : SchedWriteRes<[HWPort0, HWPort5]> {		let Latency = 4;
let Latency = 5;
let NumMicroOps = 2;		let NumMicroOps = 2;
let ResourceCycles = [1, 1];		let ResourceCycles = [1,1];
}		}
def : InstRW<[WriteVCVTPS2PDYrr], (instregex "VCVTPS2PDYrr")>;		def: InstRW<[HWWriteResGroup72], (instregex "FNSTSW16r")>;

// CVTSS2SD.		def HWWriteResGroup73 : SchedWriteRes<[HWPort1,HWPort5]> {
// x,x.		let Latency = 4;
def WriteCVTSS2SDrr : SchedWriteRes<[HWPort0, HWPort5]> {
let Latency = 2;
let NumMicroOps = 2;		let NumMicroOps = 2;
let ResourceCycles = [1, 1];		let ResourceCycles = [1,1];
}		}
def : InstRW<[WriteCVTSS2SDrr], (instregex "(Int_)?(V?)CVTSS2SDrr")>;		def: InstRW<[HWWriteResGroup73], (instregex "CVTDQ2PDrr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "CVTPD2DQrr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "CVTPD2PSrr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "CVTSD2SSrr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "CVTSI2SD64rr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "CVTSI2SDrr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "CVTSI2SSrr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "CVTTPD2DQrr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "MMX_CVTPD2PIirr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "MMX_CVTPI2PDirr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "MMX_CVTPS2PIirr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "MMX_CVTTPD2PIirr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "MMX_CVTTPS2PIirr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "VCVTDQ2PDrr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "VCVTPD2DQrr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "VCVTPD2PSrr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "VCVTPS2PHrr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "VCVTSD2SSrr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "VCVTSI2SD64rr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "VCVTSI2SDrr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "VCVTSI2SSrr")>;
		def: InstRW<[HWWriteResGroup73], (instregex "VCVTTPD2DQrr")>;

// x,m32.		def HWWriteResGroup74 : SchedWriteRes<[HWPort1,HWPort6]> {
def WriteCVTSS2SDrm : SchedWriteRes<[HWPort0, HWPort23]> {		let Latency = 4;
let Latency = 5;
let NumMicroOps = 2;		let NumMicroOps = 2;
let ResourceCycles = [1, 1];		let ResourceCycles = [1,1];
}		}
def : InstRW<[WriteCVTSS2SDrm], (instregex "(Int_)?(V?)CVTSS2SDrm")>;		def: InstRW<[HWWriteResGroup74], (instregex "IMUL(16\|32\|64)r")>;
		craig.topperUnsubmitted Not Done Reply Inline Actions Can you recheck this. I believe the following MUL16r/IMUL16r - 4 uops MUL32r/IMUL32r - 3 uops IMUL64r/IMUL64r - 2 uops MULX64rr - 2 uops craig.topper: Can you recheck this. I believe the following MUL16r/IMUL16r - 4 uops MUL32r/IMUL32r - 3 uops…
		gadi.haberAuthorUnsubmitted Not Done Reply Inline Actions Will re-check with the architects to verify. gadi.haber: Will re-check with the architects to verify.
		def: InstRW<[HWWriteResGroup74], (instregex "MUL(16\|32\|64)r")>;
		def: InstRW<[HWWriteResGroup74], (instregex "MULX64rr")>;

// CVTDQ2PD.		def HWWriteResGroup75 : SchedWriteRes<[HWPort1,HWPort23]> {
// x,x.		let Latency = 4;
def : InstRW<[WriteP1_P5_Lat4], (instregex "(V)?CVTDQ2PDrr")>;		let NumMicroOps = 3;
		let ResourceCycles = [2,1];
// y,x.		}
def : InstRW<[WriteP1_P5_Lat6], (instregex "VCVTDQ2PDYrr")>;		def: InstRW<[HWWriteResGroup75], (instregex "FICOM16m")>;
		def: InstRW<[HWWriteResGroup75], (instregex "FICOM32m")>;
// CVT(T)PD2DQ.		def: InstRW<[HWWriteResGroup75], (instregex "FICOMP16m")>;
// x,x.		def: InstRW<[HWWriteResGroup75], (instregex "FICOMP32m")>;
def : InstRW<[WriteP1_P5_Lat4], (instregex "(V?)CVT(T?)PD2DQrr")>;
// x,m128.
def : InstRW<[WriteP1_P5_Lat4Ld], (instregex "(V?)CVT(T?)PD2DQrm")>;
// x,y.
def : InstRW<[WriteP1_P5_Lat6], (instregex "VCVT(T?)PD2DQYrr")>;
// x,m256.
def : InstRW<[WriteP1_P5_Lat6Ld], (instregex "VCVT(T?)PD2DQYrm")>;

// CVT(T)PS2PI.
// mm,x.
def : InstRW<[WriteP1_P5_Lat4], (instregex "MMX_CVT(T?)PS2PIirr")>;

// CVTPI2PD.
// x,mm.
def : InstRW<[WriteP1_P5_Lat4], (instregex "MMX_CVT(T?)PI2PDirr")>;

// CVT(T)PD2PI.
// mm,x.
def : InstRW<[WriteP1_P5_Lat4], (instregex "MMX_CVT(T?)PD2PIirr")>;

// CVSTSI2SS.
// x,r32.
def : InstRW<[WriteP1_P5_Lat4], (instregex "(Int_)?(V?)CVT(T?)SI2SS(64)?rr")>;

// CVT(T)SS2SI.
// r32,x.
def : InstRW<[WriteP0_P1_Lat4], (instregex "(Int_)?(V?)CVT(T?)SS2SI(64)?rr")>;
// r32,m32.
def : InstRW<[WriteP0_P1_Lat4Ld], (instregex "(Int_)?(V?)CVT(T?)SS2SI(64)?rm")>;

// CVTSI2SD.
// x,r32/64.
def : InstRW<[WriteP0_P1_Lat4], (instregex "(Int_)?(V?)CVTSI2SS(64)?rr")>;

// CVTSD2SI.
// r32/64
def : InstRW<[WriteP0_P1_Lat4], (instregex "(Int_)?(V?)CVT(T?)SD2SI(64)?rr")>;
// r32,m32.
def : InstRW<[WriteP0_P1_Lat4Ld], (instregex "(Int_)?(V?)CVT(T?)SD2SI(64)?rm")>;

// VCVTPS2PH.
// x,v,i.
def : InstRW<[WriteP1_P5_Lat4], (instregex "VCVTPS2PH(Y?)rr")>;
// m,v,i.
def : InstRW<[WriteP1_P5_Lat4Ld, WriteRMW], (instregex "VCVTPS2PH(Y?)mr")>;

// VCVTPH2PS.
// v,x.
def : InstRW<[WriteP1_P5_Lat4], (instregex "VCVTPH2PS(Y?)rr")>;

//-- Arithmetic instructions --//		def HWWriteResGroup76 : SchedWriteRes<[HWPort0,HWPort1,HWPort23]> {
		let Latency = 4;
		let NumMicroOps = 3;
		let ResourceCycles = [1,1,1];
		}
		def: InstRW<[HWWriteResGroup76], (instregex "CVTSD2SI64rm")>;
		def: InstRW<[HWWriteResGroup76], (instregex "CVTSD2SIrm")>;
		def: InstRW<[HWWriteResGroup76], (instregex "CVTSS2SI64rm")>;
		def: InstRW<[HWWriteResGroup76], (instregex "CVTSS2SIrm")>;
		def: InstRW<[HWWriteResGroup76], (instregex "CVTTSD2SI64rm")>;
		def: InstRW<[HWWriteResGroup76], (instregex "CVTTSD2SIrm")>;
		def: InstRW<[HWWriteResGroup76], (instregex "CVTTSS2SIrm")>;
		def: InstRW<[HWWriteResGroup76], (instregex "VCVTSD2SI64rm")>;
		def: InstRW<[HWWriteResGroup76], (instregex "VCVTSD2SIrm")>;
		def: InstRW<[HWWriteResGroup76], (instregex "VCVTSS2SI64rm")>;
		def: InstRW<[HWWriteResGroup76], (instregex "VCVTSS2SIrm")>;
		def: InstRW<[HWWriteResGroup76], (instregex "VCVTTSD2SI64rm")>;
		def: InstRW<[HWWriteResGroup76], (instregex "VCVTTSD2SIrm")>;
		def: InstRW<[HWWriteResGroup76], (instregex "VCVTTSS2SI64rm")>;
		def: InstRW<[HWWriteResGroup76], (instregex "VCVTTSS2SIrm")>;

// HADD, HSUB PS/PD		def HWWriteResGroup77 : SchedWriteRes<[HWPort0,HWPort5,HWPort23]> {
// x,x / v,v,v.		let Latency = 4;
def WriteHADDSUBPr : SchedWriteRes<[HWPort1, HWPort5]> {
let Latency = 5;
let NumMicroOps = 3;		let NumMicroOps = 3;
let ResourceCycles = [1, 2];		let ResourceCycles = [1,1,1];
}		}
def : InstRW<[WriteHADDSUBPr], (instregex "(V?)H(ADD\|SUB)P(S\|D)(Y?)rr")>;		def: InstRW<[HWWriteResGroup77], (instregex "VCVTPS2PDYrm")>;
		def: InstRW<[HWWriteResGroup77], (instregex "VPTESTYrm")>;

// x,m / v,v,m.		def HWWriteResGroup78 : SchedWriteRes<[HWPort1,HWPort5,HWPort23]> {
def WriteHADDSUBPm : SchedWriteRes<[HWPort1, HWPort5, HWPort23]> {		let Latency = 4;
let Latency = 9;		let NumMicroOps = 3;
		let ResourceCycles = [1,1,1];
		}
		def: InstRW<[HWWriteResGroup78], (instregex "CVTDQ2PDrm")>;
		def: InstRW<[HWWriteResGroup78], (instregex "CVTPD2DQrm")>;
		def: InstRW<[HWWriteResGroup78], (instregex "CVTPD2PSrm")>;
		def: InstRW<[HWWriteResGroup78], (instregex "CVTSD2SSrm")>;
		def: InstRW<[HWWriteResGroup78], (instregex "CVTTPD2DQrm")>;
		def: InstRW<[HWWriteResGroup78], (instregex "MMX_CVTPD2PIirm")>;
		def: InstRW<[HWWriteResGroup78], (instregex "MMX_CVTPI2PDirm")>;
		def: InstRW<[HWWriteResGroup78], (instregex "MMX_CVTTPD2PIirm")>;
		def: InstRW<[HWWriteResGroup78], (instregex "VCVTDQ2PDrm")>;
		def: InstRW<[HWWriteResGroup78], (instregex "VCVTSD2SSrm")>;

		def HWWriteResGroup79 : SchedWriteRes<[HWPort1,HWPort6,HWPort23]> {
		let Latency = 4;
		let NumMicroOps = 3;
		let ResourceCycles = [1,1,1];
		}
		def: InstRW<[HWWriteResGroup79], (instregex "MULX64rm")>;

		def HWWriteResGroup80 : SchedWriteRes<[HWPort5,HWPort23,HWPort015]> {
		let Latency = 4;
		let NumMicroOps = 3;
		let ResourceCycles = [1,1,1];
		}
		def: InstRW<[HWWriteResGroup80], (instregex "VPBROADCASTBYrm")>;
		def: InstRW<[HWWriteResGroup80], (instregex "VPBROADCASTBrm")>;
		def: InstRW<[HWWriteResGroup80], (instregex "VPBROADCASTWYrm")>;
		def: InstRW<[HWWriteResGroup80], (instregex "VPBROADCASTWrm")>;

		def HWWriteResGroup81 : SchedWriteRes<[HWPort0156]> {
		let Latency = 4;
let NumMicroOps = 4;		let NumMicroOps = 4;
let ResourceCycles = [1, 2, 1];		let ResourceCycles = [4];
}		}
def : InstRW<[WriteHADDSUBPm], (instregex "(V?)H(ADD\|SUB)P(S\|D)(Y?)rm")>;		def: InstRW<[HWWriteResGroup81], (instregex "FNCLEX")>;

// MULL SS/SD PS/PD.		def HWWriteResGroup82 : SchedWriteRes<[HWPort015,HWPort0156]> {
// x,x / v,v,v.		let Latency = 4;
def WriteMULr : SchedWriteRes<[HWPort01]> {		let NumMicroOps = 4;
		let ResourceCycles = [1,3];
		}
		def: InstRW<[HWWriteResGroup82], (instregex "VZEROUPPER")>;

		def HWWriteResGroup83 : SchedWriteRes<[HWPort1,HWPort6,HWPort0156]> {
		let Latency = 4;
		let NumMicroOps = 4;
		let ResourceCycles = [1,1,2];
		}
		def: InstRW<[HWWriteResGroup83], (instregex "LAR(16\|32\|64)rr")>;

		def HWWriteResGroup84 : SchedWriteRes<[HWPort0,HWPort4,HWPort237,HWPort15]> {
		let Latency = 4;
		let NumMicroOps = 4;
		let ResourceCycles = [1,1,1,1];
		}
		def: InstRW<[HWWriteResGroup84], (instregex "VMASKMOVPDYmr")>;
		def: InstRW<[HWWriteResGroup84], (instregex "VMASKMOVPDmr")>;
		def: InstRW<[HWWriteResGroup84], (instregex "VMASKMOVPSYmr")>;
		def: InstRW<[HWWriteResGroup84], (instregex "VMASKMOVPSmr")>;
		def: InstRW<[HWWriteResGroup84], (instregex "VPMASKMOVDYmr")>;
		def: InstRW<[HWWriteResGroup84], (instregex "VPMASKMOVDmr")>;
		def: InstRW<[HWWriteResGroup84], (instregex "VPMASKMOVQYmr")>;
		def: InstRW<[HWWriteResGroup84], (instregex "VPMASKMOVQmr")>;

		def HWWriteResGroup85 : SchedWriteRes<[HWPort1,HWPort4,HWPort5,HWPort237]> {
		let Latency = 4;
		let NumMicroOps = 4;
		let ResourceCycles = [1,1,1,1];
		}
		def: InstRW<[HWWriteResGroup85], (instregex "VCVTPS2PHmr")>;

		def HWWriteResGroup86 : SchedWriteRes<[HWPort1,HWPort23,HWPort237,HWPort0156]> {
		let Latency = 4;
		let NumMicroOps = 4;
		let ResourceCycles = [1,1,1,1];
		}
		def: InstRW<[HWWriteResGroup86], (instregex "SHLD(16\|32\|64)mri8")>;
		def: InstRW<[HWWriteResGroup86], (instregex "SHRD(16\|32\|64)mri8")>;

		def HWWriteResGroup87 : SchedWriteRes<[HWPort1,HWPort6,HWPort23,HWPort0156]> {
		let Latency = 4;
		let NumMicroOps = 5;
		let ResourceCycles = [1,2,1,1];
		}
		def: InstRW<[HWWriteResGroup87], (instregex "LAR(16\|32\|64)rm")>;
		def: InstRW<[HWWriteResGroup87], (instregex "LSL(16\|32\|64)rm")>;

		def HWWriteResGroup88 : SchedWriteRes<[HWPort4,HWPort237,HWPort0156]> {
		let Latency = 4;
		let NumMicroOps = 6;
		let ResourceCycles = [1,1,4];
		}
		def: InstRW<[HWWriteResGroup88], (instregex "PUSHF16")>;
		def: InstRW<[HWWriteResGroup88], (instregex "PUSHF64")>;

		def HWWriteResGroup89 : SchedWriteRes<[HWPort0]> {
let Latency = 5;		let Latency = 5;
		let NumMicroOps = 1;
		let ResourceCycles = [1];
}		}
def : InstRW<[WriteMULr], (instregex "(V?)MUL(P\|S)(S\|D)rr")>;		def: InstRW<[HWWriteResGroup89], (instregex "MMX_PMADDUBSWrr64")>;
		def: InstRW<[HWWriteResGroup89], (instregex "MMX_PMADDWDirr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "MMX_PMULHRSWrr64")>;
		def: InstRW<[HWWriteResGroup89], (instregex "MMX_PMULHUWirr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "MMX_PMULHWirr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "MMX_PMULLWirr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "MMX_PMULUDQirr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "MMX_PSADBWirr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "MUL_FPrST0")>;
		def: InstRW<[HWWriteResGroup89], (instregex "MUL_FST0r")>;
		def: InstRW<[HWWriteResGroup89], (instregex "MUL_FrST0")>;
		def: InstRW<[HWWriteResGroup89], (instregex "PCMPGTQrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "PHMINPOSUWrr128")>;
		def: InstRW<[HWWriteResGroup89], (instregex "PMADDUBSWrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "PMADDWDrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "PMULDQrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "PMULHRSWrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "PMULHUWrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "PMULHWrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "PMULLWrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "PMULUDQrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "PSADBWrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "RCPPSr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "RCPSSr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "RSQRTPSr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "RSQRTSSr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPCMPGTQYrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPCMPGTQrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPHMINPOSUWrr128")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPMADDUBSWYrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPMADDUBSWrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPMADDWDYrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPMADDWDrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPMULDQYrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPMULDQrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPMULHRSWYrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPMULHRSWrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPMULHUWYrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPMULHUWrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPMULHWYrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPMULHWrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPMULLWYrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPMULLWrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPMULUDQYrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPMULUDQrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPSADBWYrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VPSADBWrr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VRCPPSr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VRCPSSr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VRSQRTPSr")>;
		def: InstRW<[HWWriteResGroup89], (instregex "VRSQRTSSr")>;

// x,m / v,v,m.		def HWWriteResGroup90 : SchedWriteRes<[HWPort01]> {
def WriteMULm : SchedWriteRes<[HWPort01, HWPort23]> {		let Latency = 5;
let Latency = 9;		let NumMicroOps = 1;
		let ResourceCycles = [1];
		}
		def: InstRW<[HWWriteResGroup90], (instregex "MULPDrr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "MULPSrr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "MULSDrr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "MULSSrr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADD132PDYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADD132PDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADD132PSYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADD132PSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADD132SDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADD132SSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADD213PDYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADD213PDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADD213PSYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADD213PSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADD213SDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADD213SSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADD231PDYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADD231PDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADD231PSYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADD231PSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADD231SDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADD231SSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADDSUB132PDYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADDSUB132PDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADDSUB132PSYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADDSUB132PSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADDSUB213PDYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADDSUB213PDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADDSUB213PSYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADDSUB213PSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADDSUB231PDYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADDSUB231PDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADDSUB231PSYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMADDSUB231PSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUB132PDYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUB132PDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUB132PSYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUB132PSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUB132SDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUB132SSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUB213PDYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUB213PDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUB213PSYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUB213PSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUB213SDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUB213SSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUB231PDYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUB231PDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUB231PSYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUB231PSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUB231SDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUB231SSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUBADD132PDYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUBADD132PDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUBADD132PSYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUBADD132PSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUBADD213PDYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUBADD213PDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUBADD213PSYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUBADD213PSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUBADD231PDYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUBADD231PDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUBADD231PSYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFMSUBADD231PSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMADD132PDYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMADD132PDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMADD132PSYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMADD132PSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMADD132SDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMADD132SSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMADD213PDYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMADD213PDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMADD213PSYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMADD213PSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMADD213SDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMADD213SSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMADD231PDYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMADD231PDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMADD231PSYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMADD231PSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMADD231SDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMADD231SSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMSUB132PDYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMSUB132PDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMSUB132PSYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMSUB132PSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMSUB132SDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMSUB132SSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMSUB213PDYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMSUB213PDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMSUB213PSYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMSUB213PSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMSUB213SDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMSUB213SSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMSUB231PDYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMSUB231PDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMSUB231PSYr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMSUB231PSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMSUB231SDr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VFNMSUB231SSr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VMULPDYrr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VMULPDrr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VMULPSYrr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VMULPSrr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VMULSDrr")>;
		def: InstRW<[HWWriteResGroup90], (instregex "VMULSSrr")>;

		def HWWriteResGroup91 : SchedWriteRes<[HWPort0,HWPort23]> {
		let Latency = 5;
		let NumMicroOps = 2;
		let ResourceCycles = [1,1];
		}
		def: InstRW<[HWWriteResGroup91], (instregex "MMX_PMADDUBSWrm64")>;
		def: InstRW<[HWWriteResGroup91], (instregex "MMX_PMADDWDirm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "MMX_PMULHRSWrm64")>;
		def: InstRW<[HWWriteResGroup91], (instregex "MMX_PMULHUWirm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "MMX_PMULHWirm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "MMX_PMULLWirm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "MMX_PMULUDQirm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "MMX_PSADBWirm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "MUL_F32m")>;
		def: InstRW<[HWWriteResGroup91], (instregex "MUL_F64m")>;
		def: InstRW<[HWWriteResGroup91], (instregex "PCMPGTQrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "PHMINPOSUWrm128")>;
		def: InstRW<[HWWriteResGroup91], (instregex "PMADDUBSWrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "PMADDWDrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "PMULDQrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "PMULHRSWrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "PMULHUWrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "PMULHWrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "PMULLWrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "PMULUDQrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "PSADBWrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "RCPPSm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "RCPSSm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "RSQRTPSm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "RSQRTSSm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPCMPGTQYrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPCMPGTQrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPHMINPOSUWrm128")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPMADDUBSWYrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPMADDUBSWrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPMADDWDYrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPMADDWDrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPMULDQYrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPMULDQrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPMULHRSWYrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPMULHRSWrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPMULHUWYrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPMULHUWrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPMULHWYrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPMULHWrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPMULLWYrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPMULLWrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPMULUDQYrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPMULUDQrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPSADBWYrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VPSADBWrm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VRCPPSm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VRCPSSm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VRSQRTPSm")>;
		def: InstRW<[HWWriteResGroup91], (instregex "VRSQRTSSm")>;

		def HWWriteResGroup92 : SchedWriteRes<[HWPort01,HWPort23]> {
		let Latency = 5;
let NumMicroOps = 2;		let NumMicroOps = 2;
let ResourceCycles = [1, 1];		let ResourceCycles = [1,1];
}		}
def : InstRW<[WriteMULm], (instregex "(V?)MUL(P\|S)(S\|D)rm")>;		def: InstRW<[HWWriteResGroup92], (instregex "MULPDrm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "MULPSrm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "MULSDrm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "MULSSrm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADD132PDYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADD132PDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADD132PSYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADD132PSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADD132SDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADD132SSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADD213PDYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADD213PDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADD213PSYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADD213PSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADD213SDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADD213SSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADD231PDYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADD231PDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADD231PSYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADD231PSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADD231SDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADD231SSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADDSUB132PDYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADDSUB132PDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADDSUB132PSYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADDSUB132PSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADDSUB213PDYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADDSUB213PDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADDSUB213PSYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADDSUB213PSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADDSUB231PDYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADDSUB231PDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADDSUB231PSYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMADDSUB231PSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUB132PDYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUB132PDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUB132PSYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUB132PSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUB132SDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUB132SSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUB213PDYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUB213PDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUB213PSYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUB213PSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUB213SDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUB213SSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUB231PDYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUB231PDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUB231PSYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUB231PSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUB231SDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUB231SSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUBADD132PDYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUBADD132PDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUBADD132PSYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUBADD132PSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUBADD213PDYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUBADD213PDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUBADD213PSYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUBADD213PSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUBADD231PDYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUBADD231PDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUBADD231PSYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFMSUBADD231PSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMADD132PDYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMADD132PDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMADD132PSYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMADD132PSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMADD132SDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMADD132SSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMADD213PDYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMADD213PDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMADD213PSYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMADD213PSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMADD213SDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMADD213SSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMADD231PDYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMADD231PDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMADD231PSYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMADD231PSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMADD231SDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMADD231SSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMSUB132PDYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMSUB132PDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMSUB132PSYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMSUB132PSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMSUB132SDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMSUB132SSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMSUB213PDYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMSUB213PDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMSUB213PSYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMSUB213PSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMSUB213SDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMSUB213SSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMSUB231PDYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMSUB231PDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMSUB231PSYm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMSUB231PSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMSUB231SDm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VFNMSUB231SSm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VMULPDYrm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VMULPDrm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VMULPSYrm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VMULPSrm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VMULSDrm")>;
		def: InstRW<[HWWriteResGroup92], (instregex "VMULSSrm")>;

// VDIVPS.		def HWWriteResGroup93 : SchedWriteRes<[HWPort1,HWPort5]> {
// y,y,y.		let Latency = 5;
def WriteVDIVPSYrr : SchedWriteRes<[HWPort0, HWPort15]> {
let Latency = 19; // 18-21 cycles.
let NumMicroOps = 3;		let NumMicroOps = 3;
let ResourceCycles = [2, 1];		let ResourceCycles = [1,2];
}		}
def : InstRW<[WriteVDIVPSYrr], (instregex "VDIVPSYrr")>;		def: InstRW<[HWWriteResGroup93], (instregex "CVTSI2SS64rr")>;
		def: InstRW<[HWWriteResGroup93], (instregex "HADDPDrr")>;
		def: InstRW<[HWWriteResGroup93], (instregex "HADDPSrr")>;
		def: InstRW<[HWWriteResGroup93], (instregex "HSUBPDrr")>;
		def: InstRW<[HWWriteResGroup93], (instregex "HSUBPSrr")>;
		def: InstRW<[HWWriteResGroup93], (instregex "VCVTSI2SS64rr")>;
		def: InstRW<[HWWriteResGroup93], (instregex "VHADDPDYrr")>;
		def: InstRW<[HWWriteResGroup93], (instregex "VHADDPDrr")>;
		def: InstRW<[HWWriteResGroup93], (instregex "VHADDPSYrr")>;
		def: InstRW<[HWWriteResGroup93], (instregex "VHADDPSrr")>;
		def: InstRW<[HWWriteResGroup93], (instregex "VHSUBPDYrr")>;
		def: InstRW<[HWWriteResGroup93], (instregex "VHSUBPDrr")>;
		def: InstRW<[HWWriteResGroup93], (instregex "VHSUBPSYrr")>;
		def: InstRW<[HWWriteResGroup93], (instregex "VHSUBPSrr")>;

// y,y,m256.		def HWWriteResGroup94 : SchedWriteRes<[HWPort1,HWPort6,HWPort06]> {
def WriteVDIVPSYrm : SchedWriteRes<[HWPort0, HWPort15, HWPort23]> {		let Latency = 5;
let Latency = 23; // 18-21 + 4 cycles.		let NumMicroOps = 3;
let NumMicroOps = 4;		let ResourceCycles = [1,1,1];
let ResourceCycles = [2, 1, 1];
}		}
def : InstRW<[WriteVDIVPSYrm, ReadAfterLd], (instregex "VDIVPSYrm")>;		def: InstRW<[HWWriteResGroup94], (instregex "STR(16\|32\|64)r")>;

// VDIVPD.		def HWWriteResGroup95 : SchedWriteRes<[HWPort1,HWPort06,HWPort0156]> {
// y,y,y.		let Latency = 5;
def WriteVDIVPDYrr : SchedWriteRes<[HWPort0, HWPort15]> {
let Latency = 27; // 19-35 cycles.
let NumMicroOps = 3;		let NumMicroOps = 3;
let ResourceCycles = [2, 1];		let ResourceCycles = [1,1,1];
}		}
def : InstRW<[WriteVDIVPDYrr], (instregex "VDIVPDYrr")>;		def: InstRW<[HWWriteResGroup95], (instregex "MULX32rr")>;

// y,y,m256.		def HWWriteResGroup96 : SchedWriteRes<[HWPort1,HWPort5,HWPort23]> {
def WriteVDIVPDYrm : SchedWriteRes<[HWPort0, HWPort15, HWPort23]> {		let Latency = 5;
let Latency = 31; // 19-35 + 4 cycles.
let NumMicroOps = 4;		let NumMicroOps = 4;
let ResourceCycles = [2, 1, 1];		let ResourceCycles = [1,2,1];
}		}
def : InstRW<[WriteVDIVPDYrm, ReadAfterLd], (instregex "VDIVPDYrm")>;		def: InstRW<[HWWriteResGroup96], (instregex "HADDPDrm")>;
		def: InstRW<[HWWriteResGroup96], (instregex "HADDPSrm")>;
		def: InstRW<[HWWriteResGroup96], (instregex "HSUBPDrm")>;
		def: InstRW<[HWWriteResGroup96], (instregex "HSUBPSrm")>;
		def: InstRW<[HWWriteResGroup96], (instregex "VHADDPDYrm")>;
		def: InstRW<[HWWriteResGroup96], (instregex "VHADDPDrm")>;
		def: InstRW<[HWWriteResGroup96], (instregex "VHADDPSYrm")>;
		def: InstRW<[HWWriteResGroup96], (instregex "VHADDPSrm")>;
		def: InstRW<[HWWriteResGroup96], (instregex "VHSUBPDYrm")>;
		def: InstRW<[HWWriteResGroup96], (instregex "VHSUBPDrm")>;
		def: InstRW<[HWWriteResGroup96], (instregex "VHSUBPSYrm")>;
		def: InstRW<[HWWriteResGroup96], (instregex "VHSUBPSrm")>;

// VRCPPS.		def HWWriteResGroup97 : SchedWriteRes<[HWPort0,HWPort1,HWPort5,HWPort23]> {
// y,y.		let Latency = 5;
def WriteVRCPPSr : SchedWriteRes<[HWPort0, HWPort15]> {		let NumMicroOps = 4;
let Latency = 7;		let ResourceCycles = [1,1,1,1];
let NumMicroOps = 3;
let ResourceCycles = [2, 1];
}		}
def : InstRW<[WriteVRCPPSr], (instregex "VRCPPSYr(_Int)?")>;		def: InstRW<[HWWriteResGroup97], (instregex "CVTTSS2SI64rm")>;

// y,m256.		def HWWriteResGroup98 : SchedWriteRes<[HWPort1,HWPort23,HWPort06,HWPort0156]> {
def WriteVRCPPSm : SchedWriteRes<[HWPort0, HWPort15, HWPort23]> {		let Latency = 5;
let Latency = 11;
let NumMicroOps = 4;		let NumMicroOps = 4;
let ResourceCycles = [2, 1, 1];		let ResourceCycles = [1,1,1,1];
		}
		def: InstRW<[HWWriteResGroup98], (instregex "MULX32rm")>;

		def HWWriteResGroup99 : SchedWriteRes<[HWPort6,HWPort0156]> {
		let Latency = 5;
		let NumMicroOps = 5;
		let ResourceCycles = [1,4];
		}
		def: InstRW<[HWWriteResGroup99], (instregex "PAUSE")>;

		def HWWriteResGroup100 : SchedWriteRes<[HWPort06,HWPort0156]> {
		let Latency = 5;
		let NumMicroOps = 5;
		let ResourceCycles = [1,4];
		}
		def: InstRW<[HWWriteResGroup100], (instregex "XSETBV")>;

		def HWWriteResGroup101 : SchedWriteRes<[HWPort06,HWPort0156]> {
		let Latency = 5;
		let NumMicroOps = 5;
		let ResourceCycles = [2,3];
}		}
def : InstRW<[WriteVRCPPSm], (instregex "VRCPPSYm(_Int)?")>;		def: InstRW<[HWWriteResGroup101], (instregex "CMPXCHG(16\|32\|64)rr")>;
		def: InstRW<[HWWriteResGroup101], (instregex "CMPXCHG8rr")>;
		def: InstRW<[HWWriteResGroup101], (instregex "ROUNDPDr")>;
		def: InstRW<[HWWriteResGroup101], (instregex "ROUNDPSr")>;
		def: InstRW<[HWWriteResGroup101], (instregex "ROUNDSDr")>;
		def: InstRW<[HWWriteResGroup101], (instregex "ROUNDSSr")>;
		def: InstRW<[HWWriteResGroup101], (instregex "VROUNDPDr")>;
		def: InstRW<[HWWriteResGroup101], (instregex "VROUNDPSr")>;
		def: InstRW<[HWWriteResGroup101], (instregex "VROUNDSDr")>;
		def: InstRW<[HWWriteResGroup101], (instregex "VROUNDSSr")>;
		def: InstRW<[HWWriteResGroup101], (instregex "VROUNDYPDr")>;
		def: InstRW<[HWWriteResGroup101], (instregex "VROUNDYPSr")>;

// ROUND SS/SD PS/PD.		def HWWriteResGroup102 : SchedWriteRes<[HWPort1,HWPort5]> {
// v,v,i.
def WriteROUNDr : SchedWriteRes<[HWPort1]> {
let Latency = 6;		let Latency = 6;
let NumMicroOps = 2;		let NumMicroOps = 2;
let ResourceCycles = [2];		let ResourceCycles = [1,1];
}		}
def : InstRW<[WriteROUNDr], (instregex "(V?)ROUND(Y?)(S\|P)(S\|D)r(_Int)?")>;		def: InstRW<[HWWriteResGroup102], (instregex "VCVTDQ2PDYrr")>;
		def: InstRW<[HWWriteResGroup102], (instregex "VCVTPD2DQYrr")>;
		def: InstRW<[HWWriteResGroup102], (instregex "VCVTPD2PSYrr")>;
		def: InstRW<[HWWriteResGroup102], (instregex "VCVTPS2PHYrr")>;
		def: InstRW<[HWWriteResGroup102], (instregex "VCVTTPD2DQYrr")>;

// v,m,i.		def HWWriteResGroup103 : SchedWriteRes<[HWPort1,HWPort23]> {
def WriteROUNDm : SchedWriteRes<[HWPort1, HWPort23]> {		let Latency = 6;
let Latency = 10;
let NumMicroOps = 3;		let NumMicroOps = 3;
let ResourceCycles = [2, 1];		let ResourceCycles = [2,1];
}		}
def : InstRW<[WriteROUNDm], (instregex "(V?)ROUND(Y?)(S\|P)(S\|D)m(_Int)?")>;		def: InstRW<[HWWriteResGroup103], (instregex "ADD_FI16m")>;
		def: InstRW<[HWWriteResGroup103], (instregex "ADD_FI32m")>;
		def: InstRW<[HWWriteResGroup103], (instregex "ROUNDPDm")>;
		def: InstRW<[HWWriteResGroup103], (instregex "ROUNDPSm")>;
		def: InstRW<[HWWriteResGroup103], (instregex "ROUNDSDm")>;
		def: InstRW<[HWWriteResGroup103], (instregex "ROUNDSSm")>;
		def: InstRW<[HWWriteResGroup103], (instregex "SUBR_FI16m")>;
		def: InstRW<[HWWriteResGroup103], (instregex "SUBR_FI32m")>;
		def: InstRW<[HWWriteResGroup103], (instregex "SUB_FI16m")>;
		def: InstRW<[HWWriteResGroup103], (instregex "SUB_FI32m")>;
		def: InstRW<[HWWriteResGroup103], (instregex "VROUNDPDm")>;
		def: InstRW<[HWWriteResGroup103], (instregex "VROUNDPSm")>;
		def: InstRW<[HWWriteResGroup103], (instregex "VROUNDSDm")>;
		def: InstRW<[HWWriteResGroup103], (instregex "VROUNDSSm")>;
		def: InstRW<[HWWriteResGroup103], (instregex "VROUNDYPDm")>;
		def: InstRW<[HWWriteResGroup103], (instregex "VROUNDYPSm")>;

// DPPS.		def HWWriteResGroup104 : SchedWriteRes<[HWPort1,HWPort5,HWPort23]> {
// x,x,i / v,v,v,i.		let Latency = 6;
def WriteDPPSr : SchedWriteRes<[HWPort0, HWPort1, HWPort5]> {		let NumMicroOps = 3;
let Latency = 14;		let ResourceCycles = [1,1,1];
		}
		def: InstRW<[HWWriteResGroup104], (instregex "VCVTDQ2PDYrm")>;

		def HWWriteResGroup105 : SchedWriteRes<[HWPort1,HWPort06,HWPort0156]> {
		let Latency = 6;
let NumMicroOps = 4;		let NumMicroOps = 4;
let ResourceCycles = [2, 1, 1];		let ResourceCycles = [1,1,2];
}		}
def : InstRW<[WriteDPPSr], (instregex "(V?)DPPS(Y?)rri")>;		def: InstRW<[HWWriteResGroup105], (instregex "SHLD(16\|32\|64)rrCL")>;
		def: InstRW<[HWWriteResGroup105], (instregex "SHRD(16\|32\|64)rrCL")>;

// x,m,i / v,v,m,i.		def HWWriteResGroup106 : SchedWriteRes<[HWPort1,HWPort4,HWPort5,HWPort237]> {
def WriteDPPSm : SchedWriteRes<[HWPort0, HWPort1, HWPort5, HWPort23, HWPort6]> {		let Latency = 6;
let Latency = 18;		let NumMicroOps = 4;
		let ResourceCycles = [1,1,1,1];
		}
		def: InstRW<[HWWriteResGroup106], (instregex "VCVTPS2PHYmr")>;

		def HWWriteResGroup107 : SchedWriteRes<[HWPort1,HWPort6,HWPort06,HWPort0156]> {
		let Latency = 6;
		let NumMicroOps = 4;
		let ResourceCycles = [1,1,1,1];
		}
		def: InstRW<[HWWriteResGroup107], (instregex "SLDT(16\|32\|64)r")>;

		def HWWriteResGroup108 : SchedWriteRes<[HWPort6,HWPort0156]> {
		let Latency = 6;
		let NumMicroOps = 6;
		let ResourceCycles = [1,5];
		}
		def: InstRW<[HWWriteResGroup108], (instregex "STD")>;

		def HWWriteResGroup109 : SchedWriteRes<[HWPort1,HWPort23,HWPort237,HWPort06,HWPort0156]> {
		let Latency = 6;
let NumMicroOps = 6;		let NumMicroOps = 6;
let ResourceCycles = [2, 1, 1, 1, 1];		let ResourceCycles = [1,1,1,1,2];
}		}
def : InstRW<[WriteDPPSm, ReadAfterLd], (instregex "(V?)DPPS(Y?)rmi")>;		def: InstRW<[HWWriteResGroup109], (instregex "SHLD(16\|32\|64)mrCL")>;
		def: InstRW<[HWWriteResGroup109], (instregex "SHRD(16\|32\|64)mrCL")>;

// DPPD.		def HWWriteResGroup110 : SchedWriteRes<[HWPort5]> {
// x,x,i.		let Latency = 7;
def WriteDPPDr : SchedWriteRes<[HWPort0, HWPort1, HWPort5]> {		let NumMicroOps = 1;
		let ResourceCycles = [1];
		}
		def: InstRW<[HWWriteResGroup110], (instregex "AESDECLASTrr")>;
		def: InstRW<[HWWriteResGroup110], (instregex "AESDECrr")>;
		def: InstRW<[HWWriteResGroup110], (instregex "AESENCLASTrr")>;
		def: InstRW<[HWWriteResGroup110], (instregex "AESENCrr")>;
		def: InstRW<[HWWriteResGroup110], (instregex "VAESDECLASTrr")>;
		def: InstRW<[HWWriteResGroup110], (instregex "VAESDECrr")>;
		def: InstRW<[HWWriteResGroup110], (instregex "VAESENCLASTrr")>;
		def: InstRW<[HWWriteResGroup110], (instregex "VAESENCrr")>;

		def HWWriteResGroup111 : SchedWriteRes<[HWPort5,HWPort23]> {
		let Latency = 7;
		let NumMicroOps = 2;
		let ResourceCycles = [1,1];
		}
		def: InstRW<[HWWriteResGroup111], (instregex "AESDECLASTrm")>;
		def: InstRW<[HWWriteResGroup111], (instregex "AESDECrm")>;
		def: InstRW<[HWWriteResGroup111], (instregex "AESENCLASTrm")>;
		def: InstRW<[HWWriteResGroup111], (instregex "AESENCrm")>;
		def: InstRW<[HWWriteResGroup111], (instregex "VAESDECLASTrm")>;
		def: InstRW<[HWWriteResGroup111], (instregex "VAESDECrm")>;
		def: InstRW<[HWWriteResGroup111], (instregex "VAESENCLASTrm")>;
		def: InstRW<[HWWriteResGroup111], (instregex "VAESENCrm")>;

		def HWWriteResGroup112 : SchedWriteRes<[HWPort0,HWPort5]> {
		let Latency = 7;
		let NumMicroOps = 3;
		let ResourceCycles = [1,2];
		}
		def: InstRW<[HWWriteResGroup112], (instregex "MPSADBWrri")>;
		def: InstRW<[HWWriteResGroup112], (instregex "VMPSADBWYrri")>;
		def: InstRW<[HWWriteResGroup112], (instregex "VMPSADBWrri")>;

		def HWWriteResGroup113 : SchedWriteRes<[HWPort0,HWPort5,HWPort23]> {
		let Latency = 7;
		let NumMicroOps = 4;
		let ResourceCycles = [1,2,1];
		}
		def: InstRW<[HWWriteResGroup113], (instregex "MPSADBWrmi")>;
		def: InstRW<[HWWriteResGroup113], (instregex "VMPSADBWYrmi")>;
		def: InstRW<[HWWriteResGroup113], (instregex "VMPSADBWrmi")>;

		def HWWriteResGroup114 : SchedWriteRes<[HWPort6,HWPort06,HWPort15,HWPort0156]> {
		let Latency = 7;
		let NumMicroOps = 7;
		let ResourceCycles = [2,2,1,2];
		}
		def: InstRW<[HWWriteResGroup114], (instregex "LOOP")>;

		def HWWriteResGroup115 : SchedWriteRes<[HWPort0,HWPort1,HWPort23]> {
		let Latency = 8;
		let NumMicroOps = 3;
		let ResourceCycles = [1,1,1];
		}
		def: InstRW<[HWWriteResGroup115], (instregex "MUL_FI16m")>;
		def: InstRW<[HWWriteResGroup115], (instregex "MUL_FI32m")>;

		def HWWriteResGroup116 : SchedWriteRes<[HWPort0,HWPort1,HWPort5]> {
let Latency = 9;		let Latency = 9;
let NumMicroOps = 3;		let NumMicroOps = 3;
let ResourceCycles = [1, 1, 1];		let ResourceCycles = [1,1,1];
}		}
def : InstRW<[WriteDPPDr], (instregex "(V?)DPPDrri")>;		def: InstRW<[HWWriteResGroup116], (instregex "DPPDrri")>;
		def: InstRW<[HWWriteResGroup116], (instregex "VDPPDrri")>;

// x,m,i.		def HWWriteResGroup117 : SchedWriteRes<[HWPort0,HWPort1,HWPort5,HWPort23]> {
def WriteDPPDm : SchedWriteRes<[HWPort0, HWPort1, HWPort5, HWPort23]> {		let Latency = 9;
let Latency = 13;
let NumMicroOps = 4;		let NumMicroOps = 4;
let ResourceCycles = [1, 1, 1, 1];		let ResourceCycles = [1,1,1,1];
}		}
def : InstRW<[WriteDPPDm], (instregex "(V?)DPPDrmi")>;		def: InstRW<[HWWriteResGroup117], (instregex "DPPDrmi")>;
		def: InstRW<[HWWriteResGroup117], (instregex "VDPPDrmi")>;

// VFMADD.		def HWWriteResGroup118 : SchedWriteRes<[HWPort0]> {
// v,v,v.		let Latency = 10;
def WriteFMADDr : SchedWriteRes<[HWPort01]> {		let NumMicroOps = 2;
let Latency = 5;		let ResourceCycles = [2];
		}
		def: InstRW<[HWWriteResGroup118], (instregex "PMULLDrr")>;
		def: InstRW<[HWWriteResGroup118], (instregex "VPMULLDYrr")>;
		def: InstRW<[HWWriteResGroup118], (instregex "VPMULLDrr")>;

		def HWWriteResGroup119 : SchedWriteRes<[HWPort0,HWPort23]> {
		let Latency = 10;
		let NumMicroOps = 3;
		let ResourceCycles = [2,1];
		}
		def: InstRW<[HWWriteResGroup119], (instregex "PMULLDrm")>;
		def: InstRW<[HWWriteResGroup119], (instregex "VPMULLDYrm")>;
		def: InstRW<[HWWriteResGroup119], (instregex "VPMULLDrm")>;

		def HWWriteResGroup120 : SchedWriteRes<[HWPort1,HWPort23,HWPort237,HWPort06,HWPort15,HWPort0156]> {
		let Latency = 10;
		let NumMicroOps = 10;
		let ResourceCycles = [1,1,1,4,1,2];
		}
		def: InstRW<[HWWriteResGroup120], (instregex "RCL(16\|32\|64)mCL")>;
		def: InstRW<[HWWriteResGroup120], (instregex "RCL8mCL")>;

		def HWWriteResGroup121 : SchedWriteRes<[HWPort0]> {
		let Latency = 11;
let NumMicroOps = 1;		let NumMicroOps = 1;
		let ResourceCycles = [1];
}		}
def : InstRW<[WriteFMADDr],		def: InstRW<[HWWriteResGroup121], (instregex "DIVPSrr")>;
(instregex		def: InstRW<[HWWriteResGroup121], (instregex "DIVSSrr")>;
// 3p forms.
"VF(N?)M(ADD\|SUB\|ADDSUB\|SUBADD)P(S\|D)(r213\|r132\|r231)r(Y)?",
// 3s forms.
"VF(N?)M(ADD\|SUB)S(S\|D)(r132\|r231\|r213)r",
// 4s/4s_int forms.
"VF(N?)M(ADD\|SUB)S(S\|D)4rr(_REV\|_Int)?",
// 4p forms.
"VF(N?)M(ADD\|SUB)P(S\|D)4rr(Y)?(_REV)?")>;

// v,v,m.		def HWWriteResGroup122 : SchedWriteRes<[HWPort0,HWPort23]> {
def WriteFMADDm : SchedWriteRes<[HWPort01, HWPort23]> {		let Latency = 11;
let Latency = 9;
let NumMicroOps = 2;		let NumMicroOps = 2;
let ResourceCycles = [1, 1];		let ResourceCycles = [1,1];
}		}
def : InstRW<[WriteFMADDm],		def: InstRW<[HWWriteResGroup122], (instregex "DIVPSrm")>;
(instregex		def: InstRW<[HWWriteResGroup122], (instregex "DIVSSrm")>;
// 3p forms.
"VF(N?)M(ADD\|SUB\|ADDSUB\|SUBADD)P(S\|D)(r213\|r132\|r231)m(Y)?",
// 3s forms.
"VF(N?)M(ADD\|SUB)S(S\|D)(r132\|r231\|r213)m",
// 4s/4s_int forms.
"VF(N?)M(ADD\|SUB)S(S\|D)4(rm\|mr)(_Int)?",
// 4p forms.
"VF(N?)M(ADD\|SUB)P(S\|D)4(rm\|mr)(Y)?")>;

//-- Math instructions --//		def HWWriteResGroup123 : SchedWriteRes<[HWPort0]> {
		let Latency = 11;
		let NumMicroOps = 3;
		let ResourceCycles = [3];
		}
		def: InstRW<[HWWriteResGroup123], (instregex "PCMPISTRIrr")>;
		def: InstRW<[HWWriteResGroup123], (instregex "PCMPISTRM128rr")>;
		def: InstRW<[HWWriteResGroup123], (instregex "VPCMPISTRIrr")>;
		def: InstRW<[HWWriteResGroup123], (instregex "VPCMPISTRM128rr")>;

// VSQRTPS.		def HWWriteResGroup124 : SchedWriteRes<[HWPort0,HWPort5]> {
// y,y.		let Latency = 11;
def WriteVSQRTPSYr : SchedWriteRes<[HWPort0, HWPort15]> {
let Latency = 19;
let NumMicroOps = 3;		let NumMicroOps = 3;
let ResourceCycles = [2, 1];		let ResourceCycles = [2,1];
}		}
def : InstRW<[WriteVSQRTPSYr], (instregex "VSQRTPSYr")>;		def: InstRW<[HWWriteResGroup124], (instregex "PCLMULQDQrr")>;
		def: InstRW<[HWWriteResGroup124], (instregex "VPCLMULQDQrr")>;

// y,m256.		def HWWriteResGroup125 : SchedWriteRes<[HWPort0,HWPort015]> {
def WriteVSQRTPSYm : SchedWriteRes<[HWPort0, HWPort15, HWPort23]> {		let Latency = 11;
let Latency = 23;		let NumMicroOps = 3;
		let ResourceCycles = [2,1];
		}
		def: InstRW<[HWWriteResGroup125], (instregex "VRCPPSYr")>;
		def: InstRW<[HWWriteResGroup125], (instregex "VRSQRTPSYr")>;

		def HWWriteResGroup126 : SchedWriteRes<[HWPort0,HWPort23]> {
		let Latency = 11;
		let NumMicroOps = 4;
		let ResourceCycles = [3,1];
		}
		def: InstRW<[HWWriteResGroup126], (instregex "PCMPISTRIrm")>;
		def: InstRW<[HWWriteResGroup126], (instregex "PCMPISTRM128rm")>;
		def: InstRW<[HWWriteResGroup126], (instregex "VPCMPISTRIrm")>;
		def: InstRW<[HWWriteResGroup126], (instregex "VPCMPISTRM128rm")>;

		def HWWriteResGroup127 : SchedWriteRes<[HWPort0,HWPort5,HWPort23]> {
		let Latency = 11;
let NumMicroOps = 4;		let NumMicroOps = 4;
let ResourceCycles = [2, 1, 1];		let ResourceCycles = [2,1,1];
}		}
def : InstRW<[WriteVSQRTPSYm], (instregex "VSQRTPSYm")>;		def: InstRW<[HWWriteResGroup127], (instregex "PCLMULQDQrm")>;
		def: InstRW<[HWWriteResGroup127], (instregex "VPCLMULQDQrm")>;

// VSQRTPD.		def HWWriteResGroup128 : SchedWriteRes<[HWPort0,HWPort23,HWPort015]> {
// y,y.		let Latency = 11;
def WriteVSQRTPDYr : SchedWriteRes<[HWPort0, HWPort15]> {		let NumMicroOps = 4;
let Latency = 28;		let ResourceCycles = [2,1,1];
		}
		def: InstRW<[HWWriteResGroup128], (instregex "VRCPPSYm")>;
		def: InstRW<[HWWriteResGroup128], (instregex "VRSQRTPSYm")>;

		def HWWriteResGroup129 : SchedWriteRes<[HWPort1,HWPort06,HWPort0156]> {
		let Latency = 11;
		let NumMicroOps = 7;
		let ResourceCycles = [2,2,3];
		}
		def: InstRW<[HWWriteResGroup129], (instregex "RCL(16\|32\|64)rCL")>;
		def: InstRW<[HWWriteResGroup129], (instregex "RCR(16\|32\|64)rCL")>;

		def HWWriteResGroup130 : SchedWriteRes<[HWPort1,HWPort06,HWPort15,HWPort0156]> {
		let Latency = 11;
		let NumMicroOps = 9;
		let ResourceCycles = [1,4,1,3];
		}
		def: InstRW<[HWWriteResGroup130], (instregex "RCL8rCL")>;

		def HWWriteResGroup131 : SchedWriteRes<[HWPort06,HWPort0156]> {
		let Latency = 11;
		let NumMicroOps = 11;
		let ResourceCycles = [2,9];
		}
		def: InstRW<[HWWriteResGroup131], (instregex "LOOPE")>;
		def: InstRW<[HWWriteResGroup131], (instregex "LOOPNE")>;

		def HWWriteResGroup132 : SchedWriteRes<[HWPort4,HWPort23,HWPort237,HWPort06,HWPort15,HWPort0156]> {
		let Latency = 11;
		let NumMicroOps = 14;
		let ResourceCycles = [1,1,1,4,2,5];
		}
		def: InstRW<[HWWriteResGroup132], (instregex "CMPXCHG8B")>;

		def HWWriteResGroup133 : SchedWriteRes<[HWPort0]> {
		let Latency = 13;
		let NumMicroOps = 1;
		let ResourceCycles = [1];
		}
		def: InstRW<[HWWriteResGroup133], (instregex "SQRTPSr")>;
		def: InstRW<[HWWriteResGroup133], (instregex "SQRTSSr")>;
		def: InstRW<[HWWriteResGroup133], (instregex "VDIVPSrr")>;
		def: InstRW<[HWWriteResGroup133], (instregex "VDIVSSrr")>;

		def HWWriteResGroup134 : SchedWriteRes<[HWPort0,HWPort23]> {
		let Latency = 13;
		let NumMicroOps = 2;
		let ResourceCycles = [1,1];
		}
		def: InstRW<[HWWriteResGroup134], (instregex "SQRTPSm")>;
		def: InstRW<[HWWriteResGroup134], (instregex "SQRTSSm")>;
		def: InstRW<[HWWriteResGroup134], (instregex "VDIVPSrm")>;
		def: InstRW<[HWWriteResGroup134], (instregex "VDIVSSrm")>;

		def HWWriteResGroup135 : SchedWriteRes<[HWPort1,HWPort23,HWPort237,HWPort06,HWPort15,HWPort0156]> {
		let Latency = 13;
		let NumMicroOps = 11;
		let ResourceCycles = [2,1,1,3,1,3];
		}
		def: InstRW<[HWWriteResGroup135], (instregex "RCR(16\|32\|64)mCL")>;
		def: InstRW<[HWWriteResGroup135], (instregex "RCR8mCL")>;

		def HWWriteResGroup136 : SchedWriteRes<[HWPort0]> {
		let Latency = 14;
		let NumMicroOps = 1;
		let ResourceCycles = [1];
		}
		def: InstRW<[HWWriteResGroup136], (instregex "DIVPDrr")>;
		def: InstRW<[HWWriteResGroup136], (instregex "DIVSDrr")>;
		def: InstRW<[HWWriteResGroup136], (instregex "VSQRTPSr")>;
		def: InstRW<[HWWriteResGroup136], (instregex "VSQRTSSr")>;

		def HWWriteResGroup137 : SchedWriteRes<[HWPort5]> {
		let Latency = 14;
		let NumMicroOps = 2;
		let ResourceCycles = [2];
		}
		def: InstRW<[HWWriteResGroup137], (instregex "AESIMCrr")>;
		def: InstRW<[HWWriteResGroup137], (instregex "VAESIMCrr")>;

		def HWWriteResGroup138 : SchedWriteRes<[HWPort0,HWPort23]> {
		let Latency = 14;
		let NumMicroOps = 2;
		let ResourceCycles = [1,1];
		}
		def: InstRW<[HWWriteResGroup138], (instregex "DIVPDrm")>;
		def: InstRW<[HWWriteResGroup138], (instregex "DIVSDrm")>;
		def: InstRW<[HWWriteResGroup138], (instregex "VSQRTPSm")>;
		def: InstRW<[HWWriteResGroup138], (instregex "VSQRTSSm")>;

		def HWWriteResGroup139 : SchedWriteRes<[HWPort5,HWPort23]> {
		let Latency = 14;
let NumMicroOps = 3;		let NumMicroOps = 3;
let ResourceCycles = [2, 1];		let ResourceCycles = [2,1];
}		}
def : InstRW<[WriteVSQRTPDYr], (instregex "VSQRTPDYr")>;		def: InstRW<[HWWriteResGroup139], (instregex "AESIMCrm")>;
		def: InstRW<[HWWriteResGroup139], (instregex "VAESIMCrm")>;

// y,m256.		def HWWriteResGroup140 : SchedWriteRes<[HWPort0,HWPort1,HWPort5]> {
def WriteVSQRTPDYm : SchedWriteRes<[HWPort0, HWPort15, HWPort23]> {		let Latency = 14;
let Latency = 32;
let NumMicroOps = 4;		let NumMicroOps = 4;
let ResourceCycles = [2, 1, 1];		let ResourceCycles = [2,1,1];
}		}
def : InstRW<[WriteVSQRTPDYm], (instregex "VSQRTPDYm")>;		def: InstRW<[HWWriteResGroup140], (instregex "DPPSrri")>;
		def: InstRW<[HWWriteResGroup140], (instregex "VDPPSYrri")>;
		def: InstRW<[HWWriteResGroup140], (instregex "VDPPSrri")>;

// RSQRT SS/PS.		def HWWriteResGroup141 : SchedWriteRes<[HWPort0,HWPort1,HWPort5,HWPort23]> {
// x,x.		let Latency = 14;
def WriteRSQRTr : SchedWriteRes<[HWPort0]> {		let NumMicroOps = 5;
let Latency = 5;		let ResourceCycles = [2,1,1,1];
}		}
def : InstRW<[WriteRSQRTr], (instregex "(V?)RSQRT(SS\|PS)r(_Int)?")>;		def: InstRW<[HWWriteResGroup141], (instregex "DPPSrmi")>;
		def: InstRW<[HWWriteResGroup141], (instregex "VDPPSYrmi")>;
		def: InstRW<[HWWriteResGroup141], (instregex "VDPPSrmi")>;

// x,m128.		def HWWriteResGroup142 : SchedWriteRes<[HWPort1,HWPort06,HWPort15,HWPort0156]> {
def WriteRSQRTm : SchedWriteRes<[HWPort0, HWPort23]> {		let Latency = 14;
let Latency = 9;		let NumMicroOps = 10;
		let ResourceCycles = [2,3,1,4];
		}
		def: InstRW<[HWWriteResGroup142], (instregex "RCR8rCL")>;

		def HWWriteResGroup143 : SchedWriteRes<[HWPort23,HWPort0156]> {
		let Latency = 14;
		let NumMicroOps = 15;
		let ResourceCycles = [1,14];
		}
		def: InstRW<[HWWriteResGroup143], (instregex "POPF16")>;

		def HWWriteResGroup144 : SchedWriteRes<[HWPort4,HWPort5,HWPort6,HWPort23,HWPort237,HWPort06,HWPort0156]> {
		let Latency = 15;
		let NumMicroOps = 8;
		let ResourceCycles = [1,1,1,1,1,1,2];
		}
		def: InstRW<[HWWriteResGroup144], (instregex "INSB")>;
		def: InstRW<[HWWriteResGroup144], (instregex "INSL")>;
		def: InstRW<[HWWriteResGroup144], (instregex "INSW")>;

		def HWWriteResGroup145 : SchedWriteRes<[HWPort5]> {
		let Latency = 16;
		let NumMicroOps = 16;
		let ResourceCycles = [16];
		}
		def: InstRW<[HWWriteResGroup145], (instregex "VZEROALL")>;

		def HWWriteResGroup146 : SchedWriteRes<[HWPort0,HWPort4,HWPort5,HWPort23,HWPort237,HWPort06,HWPort0156]> {
		let Latency = 16;
		let NumMicroOps = 19;
		let ResourceCycles = [2,1,4,1,1,4,6];
		}
		def: InstRW<[HWWriteResGroup146], (instregex "CMPXCHG16B")>;

		def HWWriteResGroup147 : SchedWriteRes<[HWPort0,HWPort1,HWPort5,HWPort6,HWPort01,HWPort0156]> {
		let Latency = 17;
		let NumMicroOps = 15;
		let ResourceCycles = [2,1,2,4,2,4];
		}
		def: InstRW<[HWWriteResGroup147], (instregex "XCH_F")>;

		def HWWriteResGroup148 : SchedWriteRes<[HWPort0,HWPort5,HWPort0156]> {
		let Latency = 18;
		let NumMicroOps = 8;
		let ResourceCycles = [4,3,1];
		}
		def: InstRW<[HWWriteResGroup148], (instregex "PCMPESTRIrr")>;
		def: InstRW<[HWWriteResGroup148], (instregex "VPCMPESTRIrr")>;

		def HWWriteResGroup149 : SchedWriteRes<[HWPort5,HWPort6,HWPort06,HWPort0156]> {
		let Latency = 18;
		let NumMicroOps = 8;
		let ResourceCycles = [1,1,1,5];
		}
		def: InstRW<[HWWriteResGroup149], (instregex "CPUID")>;
		def: InstRW<[HWWriteResGroup149], (instregex "RDTSC")>;

		def HWWriteResGroup150 : SchedWriteRes<[HWPort0,HWPort5,HWPort23,HWPort0156]> {
		let Latency = 18;
		let NumMicroOps = 9;
		let ResourceCycles = [4,3,1,1];
		}
		def: InstRW<[HWWriteResGroup150], (instregex "PCMPESTRIrm")>;
		def: InstRW<[HWWriteResGroup150], (instregex "VPCMPESTRIrm")>;

		def HWWriteResGroup151 : SchedWriteRes<[HWPort6,HWPort23,HWPort0156]> {
		let Latency = 18;
		let NumMicroOps = 19;
		let ResourceCycles = [3,1,15];
		}
		def: InstRW<[HWWriteResGroup151], (instregex "XRSTOR")>;

		def HWWriteResGroup152 : SchedWriteRes<[HWPort0,HWPort5,HWPort015,HWPort0156]> {
		let Latency = 19;
		let NumMicroOps = 9;
		let ResourceCycles = [4,3,1,1];
		}
		def: InstRW<[HWWriteResGroup152], (instregex "PCMPESTRM128rr")>;
		def: InstRW<[HWWriteResGroup152], (instregex "VPCMPESTRM128rr")>;

		def HWWriteResGroup153 : SchedWriteRes<[HWPort0,HWPort5,HWPort23,HWPort015,HWPort0156]> {
		let Latency = 19;
		let NumMicroOps = 10;
		let ResourceCycles = [4,3,1,1,1];
		}
		def: InstRW<[HWWriteResGroup153], (instregex "PCMPESTRM128rm")>;
		def: InstRW<[HWWriteResGroup153], (instregex "VPCMPESTRM128rm")>;

		def HWWriteResGroup154 : SchedWriteRes<[HWPort0]> {
		let Latency = 20;
		let NumMicroOps = 1;
		let ResourceCycles = [1];
		}
		def: InstRW<[HWWriteResGroup154], (instregex "DIV_FPrST0")>;
		def: InstRW<[HWWriteResGroup154], (instregex "DIV_FST0r")>;
		def: InstRW<[HWWriteResGroup154], (instregex "DIV_FrST0")>;
		def: InstRW<[HWWriteResGroup154], (instregex "SQRTPDr")>;
		def: InstRW<[HWWriteResGroup154], (instregex "SQRTSDr")>;
		def: InstRW<[HWWriteResGroup154], (instregex "VDIVPDrr")>;
		def: InstRW<[HWWriteResGroup154], (instregex "VDIVSDrr")>;

		def HWWriteResGroup155 : SchedWriteRes<[HWPort0,HWPort23]> {
		let Latency = 20;
let NumMicroOps = 2;		let NumMicroOps = 2;
let ResourceCycles = [1, 1];		let ResourceCycles = [1,1];
}		}
def : InstRW<[WriteRSQRTm], (instregex "(V?)RSQRT(SS\|PS)m(_Int)?")>;		def: InstRW<[HWWriteResGroup155], (instregex "DIVR_F32m")>;
		def: InstRW<[HWWriteResGroup155], (instregex "DIVR_F64m")>;
		def: InstRW<[HWWriteResGroup155], (instregex "SQRTPDm")>;
		def: InstRW<[HWWriteResGroup155], (instregex "SQRTSDm")>;
		def: InstRW<[HWWriteResGroup155], (instregex "VDIVPDrm")>;
		def: InstRW<[HWWriteResGroup155], (instregex "VDIVSDrm")>;

// RSQRTPS 256.		def HWWriteResGroup156 : SchedWriteRes<[HWPort5,HWPort6,HWPort0156]> {
// y,y.		let Latency = 20;
def WriteRSQRTPSYr : SchedWriteRes<[HWPort0, HWPort15]> {		let NumMicroOps = 10;
let Latency = 7;		let ResourceCycles = [1,2,7];
		}
		def: InstRW<[HWWriteResGroup156], (instregex "MWAITrr")>;

		def HWWriteResGroup157 : SchedWriteRes<[HWPort0]> {
		let Latency = 21;
		let NumMicroOps = 1;
		let ResourceCycles = [1];
		}
		def: InstRW<[HWWriteResGroup157], (instregex "VSQRTPDr")>;
		def: InstRW<[HWWriteResGroup157], (instregex "VSQRTSDr")>;

		def HWWriteResGroup158 : SchedWriteRes<[HWPort0,HWPort23]> {
		let Latency = 21;
		let NumMicroOps = 2;
		let ResourceCycles = [1,1];
		}
		def: InstRW<[HWWriteResGroup158], (instregex "VSQRTPDm")>;
		def: InstRW<[HWWriteResGroup158], (instregex "VSQRTSDm")>;

		def HWWriteResGroup159 : SchedWriteRes<[HWPort0,HWPort015]> {
		let Latency = 21;
let NumMicroOps = 3;		let NumMicroOps = 3;
let ResourceCycles = [2, 1];		let ResourceCycles = [2,1];
}		}
def : InstRW<[WriteRSQRTPSYr], (instregex "VRSQRTPSYr(_Int)?")>;		def: InstRW<[HWWriteResGroup159], (instregex "VDIVPSYrr")>;
		def: InstRW<[HWWriteResGroup159], (instregex "VSQRTPSYr")>;

// y,m256.		def HWWriteResGroup160 : SchedWriteRes<[HWPort0,HWPort23,HWPort015]> {
def WriteRSQRTPSYm : SchedWriteRes<[HWPort0, HWPort15, HWPort23]> {		let Latency = 21;
let Latency = 11;
let NumMicroOps = 4;		let NumMicroOps = 4;
let ResourceCycles = [2, 1, 1];		let ResourceCycles = [2,1,1];
}		}
def : InstRW<[WriteRSQRTPSYm], (instregex "VRSQRTPSYm(_Int)?")>;		def: InstRW<[HWWriteResGroup160], (instregex "VDIVPSYrm")>;
		def: InstRW<[HWWriteResGroup160], (instregex "VSQRTPSYm")>;

//-- Logic instructions --//		def HWWriteResGroup161 : SchedWriteRes<[HWPort0,HWPort1,HWPort23]> {
		let Latency = 23;
		let NumMicroOps = 3;
		let ResourceCycles = [1,1,1];
		}
		def: InstRW<[HWWriteResGroup161], (instregex "DIVR_FI16m")>;
		def: InstRW<[HWWriteResGroup161], (instregex "DIVR_FI32m")>;

// AND, ANDN, OR, XOR PS/PD.		def HWWriteResGroup162 : SchedWriteRes<[HWPort0]> {
// x,x / v,v,v.		let Latency = 24;
def : InstRW<[WriteP5], (instregex "(V?)(AND\|ANDN\|OR\|XOR)P(S\|D)(Y?)rr")>;		let NumMicroOps = 1;
// x,m / v,v,m.		let ResourceCycles = [1];
def : InstRW<[WriteP5Ld, ReadAfterLd],		}
(instregex "(V?)(AND\|ANDN\|OR\|XOR)P(S\|D)(Y?)rm")>;		def: InstRW<[HWWriteResGroup162], (instregex "DIVR_FPrST0")>;
		def: InstRW<[HWWriteResGroup162], (instregex "DIVR_FST0r")>;
		def: InstRW<[HWWriteResGroup162], (instregex "DIVR_FrST0")>;

//-- Other instructions --//		def HWWriteResGroup163 : SchedWriteRes<[HWPort0,HWPort23]> {
		let Latency = 24;
		let NumMicroOps = 2;
		let ResourceCycles = [1,1];
		}
		def: InstRW<[HWWriteResGroup163], (instregex "DIV_F32m")>;
		def: InstRW<[HWWriteResGroup163], (instregex "DIV_F64m")>;

// VZEROUPPER.		def HWWriteResGroup164 : SchedWriteRes<[HWPort4,HWPort6,HWPort23,HWPort237,HWPort0156]> {
def WriteVZEROUPPER : SchedWriteRes<[]> {		let Latency = 24;
let NumMicroOps = 4;		let NumMicroOps = 27;
		let ResourceCycles = [1,5,1,1,19];
}		}
def : InstRW<[WriteVZEROUPPER], (instregex "VZEROUPPER")>;		def: InstRW<[HWWriteResGroup164], (instregex "XSAVE64")>;

// VZEROALL.		def HWWriteResGroup165 : SchedWriteRes<[HWPort4,HWPort6,HWPort23,HWPort237,HWPort0156]> {
def WriteVZEROALL : SchedWriteRes<[]> {		let Latency = 25;
let NumMicroOps = 12;		let NumMicroOps = 28;
		let ResourceCycles = [1,6,1,1,19];
}		}
def : InstRW<[WriteVZEROALL], (instregex "VZEROALL")>;		def: InstRW<[HWWriteResGroup165], (instregex "XSAVE")>;

// LDMXCSR.		def HWWriteResGroup166 : SchedWriteRes<[HWPort0,HWPort1,HWPort23]> {
def WriteLDMXCSR : SchedWriteRes<[HWPort0, HWPort6, HWPort23]> {		let Latency = 27;
let Latency = 6;
let NumMicroOps = 3;		let NumMicroOps = 3;
let ResourceCycles = [1, 1, 1];		let ResourceCycles = [1,1,1];
}		}
def : InstRW<[WriteLDMXCSR], (instregex "(V)?LDMXCSR")>;		def: InstRW<[HWWriteResGroup166], (instregex "DIV_FI16m")>;
		def: InstRW<[HWWriteResGroup166], (instregex "DIV_FI32m")>;

// STMXCSR.		def HWWriteResGroup167 : SchedWriteRes<[HWPort0,HWPort5,HWPort23,HWPort015]> {
def WriteSTMXCSR : SchedWriteRes<[HWPort0, HWPort4, HWPort6, HWPort237]> {		let Latency = 28;
let Latency = 7;		let NumMicroOps = 11;
		let ResourceCycles = [2,7,1,1];
		}
		def: InstRW<[HWWriteResGroup167], (instregex "AESKEYGENASSIST128rm")>;
		def: InstRW<[HWWriteResGroup167], (instregex "VAESKEYGENASSIST128rm")>;

		def HWWriteResGroup168 : SchedWriteRes<[HWPort0,HWPort5,HWPort015]> {
		let Latency = 29;
		let NumMicroOps = 11;
		let ResourceCycles = [2,7,2];
		}
		def: InstRW<[HWWriteResGroup168], (instregex "AESKEYGENASSIST128rr")>;
		def: InstRW<[HWWriteResGroup168], (instregex "VAESKEYGENASSIST128rr")>;

		def HWWriteResGroup170 : SchedWriteRes<[HWPort5,HWPort6,HWPort23,HWPort06,HWPort0156]> {
		let Latency = 30;
		let NumMicroOps = 23;
		let ResourceCycles = [1,5,3,4,10];
		}
		def: InstRW<[HWWriteResGroup170], (instregex "IN32ri")>;
		def: InstRW<[HWWriteResGroup170], (instregex "IN32rr")>;
		def: InstRW<[HWWriteResGroup170], (instregex "IN8ri")>;
		def: InstRW<[HWWriteResGroup170], (instregex "IN8rr")>;

		def HWWriteResGroup171 : SchedWriteRes<[HWPort5,HWPort6,HWPort23,HWPort237,HWPort06,HWPort0156]> {
		let Latency = 30;
		let NumMicroOps = 23;
		let ResourceCycles = [1,5,2,1,4,10];
		}
		def: InstRW<[HWWriteResGroup171], (instregex "OUT32ir")>;
		def: InstRW<[HWWriteResGroup171], (instregex "OUT32rr")>;
		def: InstRW<[HWWriteResGroup171], (instregex "OUT8ir")>;
		def: InstRW<[HWWriteResGroup171], (instregex "OUT8rr")>;

		def HWWriteResGroup172 : SchedWriteRes<[HWPort01,HWPort15,HWPort015,HWPort0156]> {
		let Latency = 31;
		let NumMicroOps = 31;
		let ResourceCycles = [8,1,21,1];
		}
		def: InstRW<[HWWriteResGroup172], (instregex "MMX_EMMS")>;

		def HWWriteResGroup173 : SchedWriteRes<[HWPort0,HWPort015]> {
		let Latency = 35;
		let NumMicroOps = 3;
		let ResourceCycles = [2,1];
		}
		def: InstRW<[HWWriteResGroup173], (instregex "VDIVPDYrr")>;
		def: InstRW<[HWWriteResGroup173], (instregex "VSQRTPDYr")>;

		def HWWriteResGroup174 : SchedWriteRes<[HWPort0,HWPort23,HWPort015]> {
		let Latency = 35;
let NumMicroOps = 4;		let NumMicroOps = 4;
let ResourceCycles = [1, 1, 1, 1];		let ResourceCycles = [2,1,1];
		}
		def: InstRW<[HWWriteResGroup174], (instregex "VDIVPDYrm")>;
		def: InstRW<[HWWriteResGroup174], (instregex "VSQRTPDYm")>;

		def HWWriteResGroup175 : SchedWriteRes<[HWPort1,HWPort4,HWPort5,HWPort6,HWPort23,HWPort237,HWPort15,HWPort0156]> {
		let Latency = 35;
		let NumMicroOps = 18;
		let ResourceCycles = [1,1,2,3,1,1,1,8];
		}
		def: InstRW<[HWWriteResGroup175], (instregex "VMCLEARm")>;

		def HWWriteResGroup176 : SchedWriteRes<[HWPort5,HWPort0156]> {
		let Latency = 42;
		let NumMicroOps = 22;
		let ResourceCycles = [2,20];
		}
		def: InstRW<[HWWriteResGroup176], (instregex "RDTSCP")>;

		def HWWriteResGroup177 : SchedWriteRes<[HWPort0,HWPort01,HWPort23,HWPort05,HWPort06,HWPort015,HWPort0156]> {
		let Latency = 56;
		let NumMicroOps = 64;
		let ResourceCycles = [2,2,8,1,10,2,39];
		}
		def: InstRW<[HWWriteResGroup177], (instregex "FLDENVm")>;
		def: InstRW<[HWWriteResGroup177], (instregex "FLDENVm")>;

		def HWWriteResGroup178 : SchedWriteRes<[HWPort0,HWPort6,HWPort23,HWPort05,HWPort06,HWPort15,HWPort0156]> {
		let Latency = 59;
		let NumMicroOps = 88;
		let ResourceCycles = [4,4,31,1,2,1,45];
		}
		def: InstRW<[HWWriteResGroup178], (instregex "FXRSTOR64")>;

		def HWWriteResGroup179 : SchedWriteRes<[HWPort0,HWPort6,HWPort23,HWPort05,HWPort06,HWPort15,HWPort0156]> {
		let Latency = 59;
		let NumMicroOps = 90;
		let ResourceCycles = [4,2,33,1,2,1,47];
		}
		def: InstRW<[HWWriteResGroup179], (instregex "FXRSTOR")>;

		def HWWriteResGroup180 : SchedWriteRes<[HWPort5,HWPort01,HWPort0156]> {
		let Latency = 75;
		let NumMicroOps = 15;
		let ResourceCycles = [6,3,6];
		}
		def: InstRW<[HWWriteResGroup180], (instregex "FNINIT")>;

		def HWWriteResGroup181 : SchedWriteRes<[HWPort0,HWPort1,HWPort5,HWPort6,HWPort01,HWPort0156]> {
		let Latency = 98;
		let NumMicroOps = 32;
		let ResourceCycles = [7,7,3,3,1,11];
		}
		def: InstRW<[HWWriteResGroup181], (instregex "DIV(16\|32\|64)r")>;

		def HWWriteResGroup182 : SchedWriteRes<[HWPort0,HWPort1,HWPort5,HWPort6,HWPort06,HWPort0156]> {
		let Latency = 112;
		let NumMicroOps = 66;
		let ResourceCycles = [4,2,4,8,14,34];
		}
		def: InstRW<[HWWriteResGroup182], (instregex "IDIV(16\|32\|64)r")>;

		def HWWriteResGroup183 : SchedWriteRes<[HWPort0,HWPort1,HWPort4,HWPort5,HWPort6,HWPort237,HWPort06,HWPort0156]> {
		let Latency = 114;
		let NumMicroOps = 100;
		let ResourceCycles = [9,9,11,8,1,11,21,30];
}		}
def : InstRW<[WriteSTMXCSR], (instregex "(V)?STMXCSR")>;		def: InstRW<[HWWriteResGroup183], (instregex "FSTENVm")>;
		def: InstRW<[HWWriteResGroup183], (instregex "FSTENVm")>;

} // SchedModel		} // SchedModel
		craig.topperUnsubmitted Not Done Reply Inline Actions Is MUL32r/IMUL32r really different than MULX32rr? craig.topper: Is MUL32r/IMUL32r really different than MULX32rr?
		gadi.haberAuthorUnsubmitted Not Done Reply Inline Actions yes. This one is different. gadi.haber: yes. This one is different.

test/CodeGen/X86/avx-schedule.ll

	Show All 17 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vaddpd (%rdi), %ymm0, %ymm0 # sched: [10:1.00]			; SANDY-NEXT: vaddpd (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_addpd:			; HASWELL-LABEL: test_addpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vaddpd (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; HASWELL-NEXT: vaddpd (%rdi), %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_addpd:			; BTVER2-LABEL: test_addpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: vaddpd (%rdi), %ymm0, %ymm0 # sched: [8:2.00]			; BTVER2-NEXT: vaddpd (%rdi), %ymm0, %ymm0 # sched: [8:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_addpd:			; ZNVER1-LABEL: test_addpd:
	Show All 18 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vaddps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]			; SANDY-NEXT: vaddps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_addps:			; HASWELL-LABEL: test_addps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vaddps (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; HASWELL-NEXT: vaddps (%rdi), %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_addps:			; BTVER2-LABEL: test_addps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: vaddps (%rdi), %ymm0, %ymm0 # sched: [8:2.00]			; BTVER2-NEXT: vaddps (%rdi), %ymm0, %ymm0 # sched: [8:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_addps:			; ZNVER1-LABEL: test_addps:
	Show All 18 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vaddsubpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddsubpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vaddsubpd (%rdi), %ymm0, %ymm0 # sched: [10:1.00]			; SANDY-NEXT: vaddsubpd (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_addsubpd:			; HASWELL-LABEL: test_addsubpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vaddsubpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddsubpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vaddsubpd (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; HASWELL-NEXT: vaddsubpd (%rdi), %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_addsubpd:			; BTVER2-LABEL: test_addsubpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vaddsubpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddsubpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: vaddsubpd (%rdi), %ymm0, %ymm0 # sched: [8:2.00]			; BTVER2-NEXT: vaddsubpd (%rdi), %ymm0, %ymm0 # sched: [8:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_addsubpd:			; ZNVER1-LABEL: test_addsubpd:
	Show All 19 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vaddsubps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddsubps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vaddsubps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]			; SANDY-NEXT: vaddsubps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_addsubps:			; HASWELL-LABEL: test_addsubps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vaddsubps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddsubps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vaddsubps (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; HASWELL-NEXT: vaddsubps (%rdi), %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_addsubps:			; BTVER2-LABEL: test_addsubps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vaddsubps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddsubps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: vaddsubps (%rdi), %ymm0, %ymm0 # sched: [8:2.00]			; BTVER2-NEXT: vaddsubps (%rdi), %ymm0, %ymm0 # sched: [8:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_addsubps:			; ZNVER1-LABEL: test_addsubps:
	Show All 21 Lines
	; SANDY-NEXT: vandnpd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; SANDY-NEXT: vandnpd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; SANDY-NEXT: vandnpd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]			; SANDY-NEXT: vandnpd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
	; SANDY-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_andnotpd:			; HASWELL-LABEL: test_andnotpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vandnpd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; HASWELL-NEXT: vandnpd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: vandnpd (%rdi), %ymm0, %ymm0 # sched: [5:1.00]			; HASWELL-NEXT: vandnpd (%rdi), %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_andnotpd:			; BTVER2-LABEL: test_andnotpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vandnpd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; BTVER2-NEXT: vandnpd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; BTVER2-NEXT: vandnpd (%rdi), %ymm0, %ymm0 # sched: [6:1.00]			; BTVER2-NEXT: vandnpd (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
	; BTVER2-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 29 Lines
	; SANDY-NEXT: vandnps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; SANDY-NEXT: vandnps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; SANDY-NEXT: vandnps (%rdi), %ymm0, %ymm0 # sched: [8:1.00]			; SANDY-NEXT: vandnps (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
	; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_andnotps:			; HASWELL-LABEL: test_andnotps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vandnps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; HASWELL-NEXT: vandnps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: vandnps (%rdi), %ymm0, %ymm0 # sched: [5:1.00]			; HASWELL-NEXT: vandnps (%rdi), %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_andnotps:			; BTVER2-LABEL: test_andnotps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vandnps %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; BTVER2-NEXT: vandnps %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; BTVER2-NEXT: vandnps (%rdi), %ymm0, %ymm0 # sched: [6:1.00]			; BTVER2-NEXT: vandnps (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
	; BTVER2-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 29 Lines
	; SANDY-NEXT: vandpd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; SANDY-NEXT: vandpd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; SANDY-NEXT: vandpd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]			; SANDY-NEXT: vandpd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
	; SANDY-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_andpd:			; HASWELL-LABEL: test_andpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vandpd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; HASWELL-NEXT: vandpd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: vandpd (%rdi), %ymm0, %ymm0 # sched: [5:1.00]			; HASWELL-NEXT: vandpd (%rdi), %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_andpd:			; BTVER2-LABEL: test_andpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vandpd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; BTVER2-NEXT: vandpd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; BTVER2-NEXT: vandpd (%rdi), %ymm0, %ymm0 # sched: [6:1.00]			; BTVER2-NEXT: vandpd (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
	; BTVER2-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 27 Lines
	; SANDY-NEXT: vandps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; SANDY-NEXT: vandps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; SANDY-NEXT: vandps (%rdi), %ymm0, %ymm0 # sched: [8:1.00]			; SANDY-NEXT: vandps (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
	; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_andps:			; HASWELL-LABEL: test_andps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vandps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; HASWELL-NEXT: vandps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: vandps (%rdi), %ymm0, %ymm0 # sched: [5:1.00]			; HASWELL-NEXT: vandps (%rdi), %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_andps:			; BTVER2-LABEL: test_andps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vandps %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; BTVER2-NEXT: vandps %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; BTVER2-NEXT: vandps (%rdi), %ymm0, %ymm0 # sched: [6:1.00]			; BTVER2-NEXT: vandps (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
	; BTVER2-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 28 Lines
	; SANDY-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],mem[1,2],ymm0[3] sched: [8:0.50]			; SANDY-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],mem[1,2],ymm0[3] sched: [8:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_blendpd:			; HASWELL-LABEL: test_blendpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],ymm1[1,2],ymm0[3] sched: [1:0.33]			; HASWELL-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],ymm1[1,2],ymm0[3] sched: [1:0.33]
	; HASWELL-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],mem[1,2],ymm0[3] sched: [5:0.50]			; HASWELL-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],mem[1,2],ymm0[3] sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_blendpd:			; BTVER2-LABEL: test_blendpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],ymm1[1,2],ymm0[3] sched: [1:0.50]			; BTVER2-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],ymm1[1,2],ymm0[3] sched: [1:0.50]
	; BTVER2-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],mem[1,2],ymm0[3] sched: [6:1.00]			; BTVER2-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],mem[1,2],ymm0[3] sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 21 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vblendps {{.*#+}} ymm0 = ymm0[0],ymm1[1,2],ymm0[3,4,5,6,7] sched: [1:0.50]			; SANDY-NEXT: vblendps {{.*#+}} ymm0 = ymm0[0],ymm1[1,2],ymm0[3,4,5,6,7] sched: [1:0.50]
	; SANDY-NEXT: vblendps {{.*#+}} ymm0 = ymm0[0,1],mem[2],ymm0[3],mem[4,5,6],ymm0[7] sched: [8:0.50]			; SANDY-NEXT: vblendps {{.*#+}} ymm0 = ymm0[0,1],mem[2],ymm0[3],mem[4,5,6],ymm0[7] sched: [8:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_blendps:			; HASWELL-LABEL: test_blendps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vblendps {{.*#+}} ymm0 = ymm0[0],ymm1[1,2],ymm0[3,4,5,6,7] sched: [1:0.33]			; HASWELL-NEXT: vblendps {{.*#+}} ymm0 = ymm0[0],ymm1[1,2],ymm0[3,4,5,6,7] sched: [1:0.33]
	; HASWELL-NEXT: vblendps {{.*#+}} ymm0 = ymm0[0,1],mem[2],ymm0[3],mem[4,5,6],ymm0[7] sched: [5:0.50]			; HASWELL-NEXT: vblendps {{.*#+}} ymm0 = ymm0[0,1],mem[2],ymm0[3],mem[4,5,6],ymm0[7] sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_blendps:			; BTVER2-LABEL: test_blendps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vblendps {{.*#+}} ymm0 = ymm0[0],ymm1[1,2],ymm0[3,4,5,6,7] sched: [1:0.50]			; BTVER2-NEXT: vblendps {{.*#+}} ymm0 = ymm0[0],ymm1[1,2],ymm0[3,4,5,6,7] sched: [1:0.50]
	; BTVER2-NEXT: vblendps {{.*#+}} ymm0 = ymm0[0,1],mem[2],ymm0[3],mem[4,5,6],ymm0[7] sched: [6:1.00]			; BTVER2-NEXT: vblendps {{.*#+}} ymm0 = ymm0[0,1],mem[2],ymm0[3],mem[4,5,6],ymm0[7] sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_blendps:			; ZNVER1-LABEL: test_blendps:
	Show All 18 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vblendvpd %ymm2, %ymm1, %ymm0, %ymm0 # sched: [2:1.00]			; SANDY-NEXT: vblendvpd %ymm2, %ymm1, %ymm0, %ymm0 # sched: [2:1.00]
	; SANDY-NEXT: vblendvpd %ymm2, (%rdi), %ymm0, %ymm0 # sched: [9:1.00]			; SANDY-NEXT: vblendvpd %ymm2, (%rdi), %ymm0, %ymm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_blendvpd:			; HASWELL-LABEL: test_blendvpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vblendvpd %ymm2, %ymm1, %ymm0, %ymm0 # sched: [2:2.00]			; HASWELL-NEXT: vblendvpd %ymm2, %ymm1, %ymm0, %ymm0 # sched: [2:2.00]
	; HASWELL-NEXT: vblendvpd %ymm2, (%rdi), %ymm0, %ymm0 # sched: [6:2.00]			; HASWELL-NEXT: vblendvpd %ymm2, (%rdi), %ymm0, %ymm0 # sched: [2:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_blendvpd:			; BTVER2-LABEL: test_blendvpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vblendvpd %ymm2, %ymm1, %ymm0, %ymm0 # sched: [2:1.00]			; BTVER2-NEXT: vblendvpd %ymm2, %ymm1, %ymm0, %ymm0 # sched: [2:1.00]
	; BTVER2-NEXT: vblendvpd %ymm2, (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; BTVER2-NEXT: vblendvpd %ymm2, (%rdi), %ymm0, %ymm0 # sched: [7:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_blendvpd:			; ZNVER1-LABEL: test_blendvpd:
	Show All 19 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vblendvps %ymm2, %ymm1, %ymm0, %ymm0 # sched: [2:1.00]			; SANDY-NEXT: vblendvps %ymm2, %ymm1, %ymm0, %ymm0 # sched: [2:1.00]
	; SANDY-NEXT: vblendvps %ymm2, (%rdi), %ymm0, %ymm0 # sched: [9:1.00]			; SANDY-NEXT: vblendvps %ymm2, (%rdi), %ymm0, %ymm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_blendvps:			; HASWELL-LABEL: test_blendvps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vblendvps %ymm2, %ymm1, %ymm0, %ymm0 # sched: [2:2.00]			; HASWELL-NEXT: vblendvps %ymm2, %ymm1, %ymm0, %ymm0 # sched: [2:2.00]
	; HASWELL-NEXT: vblendvps %ymm2, (%rdi), %ymm0, %ymm0 # sched: [6:2.00]			; HASWELL-NEXT: vblendvps %ymm2, (%rdi), %ymm0, %ymm0 # sched: [2:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_blendvps:			; BTVER2-LABEL: test_blendvps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vblendvps %ymm2, %ymm1, %ymm0, %ymm0 # sched: [2:1.00]			; BTVER2-NEXT: vblendvps %ymm2, %ymm1, %ymm0, %ymm0 # sched: [2:1.00]
	; BTVER2-NEXT: vblendvps %ymm2, (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; BTVER2-NEXT: vblendvps %ymm2, (%rdi), %ymm0, %ymm0 # sched: [7:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_blendvps:			; ZNVER1-LABEL: test_blendvps:
	Show All 16 Lines
	;			;
	; SANDY-LABEL: test_broadcastf128:			; SANDY-LABEL: test_broadcastf128:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vbroadcastf128 {{.*#+}} ymm0 = mem[0,1,0,1] sched: [7:1.00]			; SANDY-NEXT: vbroadcastf128 {{.*#+}} ymm0 = mem[0,1,0,1] sched: [7:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_broadcastf128:			; HASWELL-LABEL: test_broadcastf128:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vbroadcastf128 {{.*#+}} ymm0 = mem[0,1,0,1] sched: [4:0.50]			; HASWELL-NEXT: vbroadcastf128 {{.*#+}} ymm0 = mem[0,1,0,1] sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_broadcastf128:			; BTVER2-LABEL: test_broadcastf128:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vbroadcastf128 {{.*#+}} ymm0 = mem[0,1,0,1] sched: [6:1.00]			; BTVER2-NEXT: vbroadcastf128 {{.*#+}} ymm0 = mem[0,1,0,1] sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_broadcastf128:			; ZNVER1-LABEL: test_broadcastf128:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 12 Lines
	;			;
	; SANDY-LABEL: test_broadcastsd_ymm:			; SANDY-LABEL: test_broadcastsd_ymm:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vbroadcastsd (%rdi), %ymm0 # sched: [7:0.50]			; SANDY-NEXT: vbroadcastsd (%rdi), %ymm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_broadcastsd_ymm:			; HASWELL-LABEL: test_broadcastsd_ymm:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vbroadcastsd (%rdi), %ymm0 # sched: [5:1.00]			; HASWELL-NEXT: vbroadcastsd (%rdi), %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_broadcastsd_ymm:			; BTVER2-LABEL: test_broadcastsd_ymm:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vbroadcastsd (%rdi), %ymm0 # sched: [6:1.00]			; BTVER2-NEXT: vbroadcastsd (%rdi), %ymm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_broadcastsd_ymm:			; ZNVER1-LABEL: test_broadcastsd_ymm:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 13 Lines
	;			;
	; SANDY-LABEL: test_broadcastss:			; SANDY-LABEL: test_broadcastss:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vbroadcastss (%rdi), %xmm0 # sched: [6:0.50]			; SANDY-NEXT: vbroadcastss (%rdi), %xmm0 # sched: [6:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_broadcastss:			; HASWELL-LABEL: test_broadcastss:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vbroadcastss (%rdi), %xmm0 # sched: [4:0.50]			; HASWELL-NEXT: vbroadcastss (%rdi), %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_broadcastss:			; BTVER2-LABEL: test_broadcastss:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vbroadcastss (%rdi), %xmm0 # sched: [5:1.00]			; BTVER2-NEXT: vbroadcastss (%rdi), %xmm0 # sched: [5:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_broadcastss:			; ZNVER1-LABEL: test_broadcastss:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 13 Lines
	;			;
	; SANDY-LABEL: test_broadcastss_ymm:			; SANDY-LABEL: test_broadcastss_ymm:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vbroadcastss (%rdi), %ymm0 # sched: [7:0.50]			; SANDY-NEXT: vbroadcastss (%rdi), %ymm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_broadcastss_ymm:			; HASWELL-LABEL: test_broadcastss_ymm:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vbroadcastss (%rdi), %ymm0 # sched: [5:1.00]			; HASWELL-NEXT: vbroadcastss (%rdi), %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_broadcastss_ymm:			; BTVER2-LABEL: test_broadcastss_ymm:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vbroadcastss (%rdi), %ymm0 # sched: [6:1.00]			; BTVER2-NEXT: vbroadcastss (%rdi), %ymm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_broadcastss_ymm:			; ZNVER1-LABEL: test_broadcastss_ymm:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 18 Lines
	; SANDY-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm1 # sched: [3:1.00]			; SANDY-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm1 # sched: [3:1.00]
	; SANDY-NEXT: vcmpeqpd (%rdi), %ymm0, %ymm0 # sched: [10:1.00]			; SANDY-NEXT: vcmpeqpd (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
	; SANDY-NEXT: vorpd %ymm0, %ymm1, %ymm0 # sched: [1:1.00]			; SANDY-NEXT: vorpd %ymm0, %ymm1, %ymm0 # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cmppd:			; HASWELL-LABEL: test_cmppd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm1 # sched: [3:1.00]			; HASWELL-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm1 # sched: [3:1.00]
	; HASWELL-NEXT: vcmpeqpd (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; HASWELL-NEXT: vcmpeqpd (%rdi), %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vorpd %ymm0, %ymm1, %ymm0 # sched: [1:1.00]			; HASWELL-NEXT: vorpd %ymm0, %ymm1, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cmppd:			; BTVER2-LABEL: test_cmppd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm1 # sched: [3:1.00]			; BTVER2-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm1 # sched: [3:1.00]
	; BTVER2-NEXT: vcmpeqpd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]			; BTVER2-NEXT: vcmpeqpd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
	; BTVER2-NEXT: vorpd %ymm0, %ymm1, %ymm0 # sched: [1:0.50]			; BTVER2-NEXT: vorpd %ymm0, %ymm1, %ymm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 26 Lines
	; SANDY-NEXT: vcmpeqps %ymm1, %ymm0, %ymm1 # sched: [3:1.00]			; SANDY-NEXT: vcmpeqps %ymm1, %ymm0, %ymm1 # sched: [3:1.00]
	; SANDY-NEXT: vcmpeqps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]			; SANDY-NEXT: vcmpeqps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
	; SANDY-NEXT: vorps %ymm0, %ymm1, %ymm0 # sched: [1:1.00]			; SANDY-NEXT: vorps %ymm0, %ymm1, %ymm0 # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cmpps:			; HASWELL-LABEL: test_cmpps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcmpeqps %ymm1, %ymm0, %ymm1 # sched: [3:1.00]			; HASWELL-NEXT: vcmpeqps %ymm1, %ymm0, %ymm1 # sched: [3:1.00]
	; HASWELL-NEXT: vcmpeqps (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; HASWELL-NEXT: vcmpeqps (%rdi), %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vorps %ymm0, %ymm1, %ymm0 # sched: [1:1.00]			; HASWELL-NEXT: vorps %ymm0, %ymm1, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cmpps:			; BTVER2-LABEL: test_cmpps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcmpeqps %ymm1, %ymm0, %ymm1 # sched: [3:1.00]			; BTVER2-NEXT: vcmpeqps %ymm1, %ymm0, %ymm1 # sched: [3:1.00]
	; BTVER2-NEXT: vcmpeqps (%rdi), %ymm0, %ymm0 # sched: [8:1.00]			; BTVER2-NEXT: vcmpeqps (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
	; BTVER2-NEXT: vorps %ymm0, %ymm1, %ymm0 # sched: [1:0.50]			; BTVER2-NEXT: vorps %ymm0, %ymm1, %ymm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 26 Lines
	; SANDY-NEXT: vcvtdq2pd %xmm0, %ymm0 # sched: [4:1.00]			; SANDY-NEXT: vcvtdq2pd %xmm0, %ymm0 # sched: [4:1.00]
	; SANDY-NEXT: vcvtdq2pd (%rdi), %ymm1 # sched: [10:1.00]			; SANDY-NEXT: vcvtdq2pd (%rdi), %ymm1 # sched: [10:1.00]
	; SANDY-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtdq2pd:			; HASWELL-LABEL: test_cvtdq2pd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtdq2pd %xmm0, %ymm0 # sched: [6:1.00]			; HASWELL-NEXT: vcvtdq2pd %xmm0, %ymm0 # sched: [6:1.00]
	; HASWELL-NEXT: vcvtdq2pd (%rdi), %ymm1 # sched: [8:1.00]			; HASWELL-NEXT: vcvtdq2pd (%rdi), %ymm1 # sched: [6:1.00]
	; HASWELL-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtdq2pd:			; BTVER2-LABEL: test_cvtdq2pd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtdq2pd (%rdi), %ymm1 # sched: [8:1.00]			; BTVER2-NEXT: vcvtdq2pd (%rdi), %ymm1 # sched: [8:1.00]
	; BTVER2-NEXT: vcvtdq2pd %xmm0, %ymm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvtdq2pd %xmm0, %ymm0 # sched: [3:1.00]
	; BTVER2-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 24 Lines
	; SANDY-NEXT: vmovaps (%rdi), %xmm1 # sched: [6:0.50]			; SANDY-NEXT: vmovaps (%rdi), %xmm1 # sched: [6:0.50]
	; SANDY-NEXT: vinsertf128 $1, 16(%rdi), %ymm1, %ymm1 # sched: [7:0.50]			; SANDY-NEXT: vinsertf128 $1, 16(%rdi), %ymm1, %ymm1 # sched: [7:0.50]
	; SANDY-NEXT: vcvtdq2ps %ymm1, %ymm1 # sched: [3:1.00]			; SANDY-NEXT: vcvtdq2ps %ymm1, %ymm1 # sched: [3:1.00]
	; SANDY-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtdq2ps:			; HASWELL-LABEL: test_cvtdq2ps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtdq2ps %ymm0, %ymm0 # sched: [4:1.00]			; HASWELL-NEXT: vcvtdq2ps %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vcvtdq2ps (%rdi), %ymm1 # sched: [8:1.00]			; HASWELL-NEXT: vcvtdq2ps (%rdi), %ymm1 # sched: [3:1.00]
	; HASWELL-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtdq2ps:			; BTVER2-LABEL: test_cvtdq2ps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtdq2ps (%rdi), %ymm1 # sched: [8:1.00]			; BTVER2-NEXT: vcvtdq2ps (%rdi), %ymm1 # sched: [8:1.00]
	; BTVER2-NEXT: vcvtdq2ps %ymm0, %ymm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvtdq2ps %ymm0, %ymm0 # sched: [3:1.00]
	; BTVER2-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 23 Lines
	; SANDY-NEXT: vcvttpd2dq %ymm0, %xmm0 # sched: [4:1.00]			; SANDY-NEXT: vcvttpd2dq %ymm0, %xmm0 # sched: [4:1.00]
	; SANDY-NEXT: vcvttpd2dqy (%rdi), %xmm1 # sched: [11:1.00]			; SANDY-NEXT: vcvttpd2dqy (%rdi), %xmm1 # sched: [11:1.00]
	; SANDY-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0 # sched: [1:1.00]			; SANDY-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0 # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtpd2dq:			; HASWELL-LABEL: test_cvtpd2dq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvttpd2dq %ymm0, %xmm0 # sched: [6:1.00]			; HASWELL-NEXT: vcvttpd2dq %ymm0, %xmm0 # sched: [6:1.00]
	; HASWELL-NEXT: vcvttpd2dqy (%rdi), %xmm1 # sched: [10:1.00]			; HASWELL-NEXT: vcvttpd2dqy (%rdi), %xmm1 # sched: [7:1.00]
	; HASWELL-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtpd2dq:			; BTVER2-LABEL: test_cvtpd2dq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvttpd2dqy (%rdi), %xmm1 # sched: [8:1.00]			; BTVER2-NEXT: vcvttpd2dqy (%rdi), %xmm1 # sched: [8:1.00]
	; BTVER2-NEXT: vcvttpd2dq %ymm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvttpd2dq %ymm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0 # sched: [1:0.50]			; BTVER2-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 22 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vcvtpd2ps %ymm0, %xmm0 # sched: [4:1.00]			; SANDY-NEXT: vcvtpd2ps %ymm0, %xmm0 # sched: [4:1.00]
	; SANDY-NEXT: vcvtpd2psy (%rdi), %xmm1 # sched: [11:1.00]			; SANDY-NEXT: vcvtpd2psy (%rdi), %xmm1 # sched: [11:1.00]
	; SANDY-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0 # sched: [1:1.00]			; SANDY-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0 # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtpd2ps:			; HASWELL-LABEL: test_cvtpd2ps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtpd2ps %ymm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vcvtpd2ps %ymm0, %xmm0 # sched: [6:1.00]
	; HASWELL-NEXT: vcvtpd2psy (%rdi), %xmm1 # sched: [9:1.00]			; HASWELL-NEXT: vcvtpd2psy (%rdi), %xmm1 # sched: [7:1.00]
	; HASWELL-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtpd2ps:			; BTVER2-LABEL: test_cvtpd2ps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtpd2psy (%rdi), %xmm1 # sched: [8:1.00]			; BTVER2-NEXT: vcvtpd2psy (%rdi), %xmm1 # sched: [8:1.00]
	; BTVER2-NEXT: vcvtpd2ps %ymm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvtpd2ps %ymm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0 # sched: [1:0.50]			; BTVER2-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 23 Lines
	; SANDY-NEXT: vcvttps2dq %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vcvttps2dq %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vcvttps2dq (%rdi), %ymm1 # sched: [10:1.00]			; SANDY-NEXT: vcvttps2dq (%rdi), %ymm1 # sched: [10:1.00]
	; SANDY-NEXT: vorps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; SANDY-NEXT: vorps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtps2dq:			; HASWELL-LABEL: test_cvtps2dq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvttps2dq %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vcvttps2dq %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vcvttps2dq (%rdi), %ymm1 # sched: [7:1.00]			; HASWELL-NEXT: vcvttps2dq (%rdi), %ymm1 # sched: [3:1.00]
	; HASWELL-NEXT: vorps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; HASWELL-NEXT: vorps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtps2dq:			; BTVER2-LABEL: test_cvtps2dq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvttps2dq (%rdi), %ymm1 # sched: [8:1.00]			; BTVER2-NEXT: vcvttps2dq (%rdi), %ymm1 # sched: [8:1.00]
	; BTVER2-NEXT: vcvttps2dq %ymm0, %ymm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvttps2dq %ymm0, %ymm0 # sched: [3:1.00]
	; BTVER2-NEXT: vorps %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; BTVER2-NEXT: vorps %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 20 Lines
	; SANDY-LABEL: test_divpd:			; SANDY-LABEL: test_divpd:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vdivpd %ymm1, %ymm0, %ymm0 # sched: [45:2.00]			; SANDY-NEXT: vdivpd %ymm1, %ymm0, %ymm0 # sched: [45:2.00]
	; SANDY-NEXT: vdivpd (%rdi), %ymm0, %ymm0 # sched: [52:2.00]			; SANDY-NEXT: vdivpd (%rdi), %ymm0, %ymm0 # sched: [52:2.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_divpd:			; HASWELL-LABEL: test_divpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vdivpd %ymm1, %ymm0, %ymm0 # sched: [27:2.00]			; HASWELL-NEXT: vdivpd %ymm1, %ymm0, %ymm0 # sched: [35:2.00]
	; HASWELL-NEXT: vdivpd (%rdi), %ymm0, %ymm0 # sched: [31:2.00]			; HASWELL-NEXT: vdivpd (%rdi), %ymm0, %ymm0 # sched: [35:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_divpd:			; BTVER2-LABEL: test_divpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vdivpd %ymm1, %ymm0, %ymm0 # sched: [38:38.00]			; BTVER2-NEXT: vdivpd %ymm1, %ymm0, %ymm0 # sched: [38:38.00]
	; BTVER2-NEXT: vdivpd (%rdi), %ymm0, %ymm0 # sched: [43:38.00]			; BTVER2-NEXT: vdivpd (%rdi), %ymm0, %ymm0 # sched: [43:38.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_divpd:			; ZNVER1-LABEL: test_divpd:
	Show All 17 Lines
	; SANDY-LABEL: test_divps:			; SANDY-LABEL: test_divps:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vdivps %ymm1, %ymm0, %ymm0 # sched: [29:2.00]			; SANDY-NEXT: vdivps %ymm1, %ymm0, %ymm0 # sched: [29:2.00]
	; SANDY-NEXT: vdivps (%rdi), %ymm0, %ymm0 # sched: [36:2.00]			; SANDY-NEXT: vdivps (%rdi), %ymm0, %ymm0 # sched: [36:2.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_divps:			; HASWELL-LABEL: test_divps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vdivps %ymm1, %ymm0, %ymm0 # sched: [19:2.00]			; HASWELL-NEXT: vdivps %ymm1, %ymm0, %ymm0 # sched: [21:2.00]
	; HASWELL-NEXT: vdivps (%rdi), %ymm0, %ymm0 # sched: [23:2.00]			; HASWELL-NEXT: vdivps (%rdi), %ymm0, %ymm0 # sched: [21:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_divps:			; BTVER2-LABEL: test_divps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vdivps %ymm1, %ymm0, %ymm0 # sched: [38:38.00]			; BTVER2-NEXT: vdivps %ymm1, %ymm0, %ymm0 # sched: [38:38.00]
	; BTVER2-NEXT: vdivps (%rdi), %ymm0, %ymm0 # sched: [43:38.00]			; BTVER2-NEXT: vdivps (%rdi), %ymm0, %ymm0 # sched: [43:38.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_divps:			; ZNVER1-LABEL: test_divps:
	Show All 18 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vdpps $7, %ymm1, %ymm0, %ymm0 # sched: [12:2.00]			; SANDY-NEXT: vdpps $7, %ymm1, %ymm0, %ymm0 # sched: [12:2.00]
	; SANDY-NEXT: vdpps $7, (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; SANDY-NEXT: vdpps $7, (%rdi), %ymm0, %ymm0 # sched: [7:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_dpps:			; HASWELL-LABEL: test_dpps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vdpps $7, %ymm1, %ymm0, %ymm0 # sched: [14:2.00]			; HASWELL-NEXT: vdpps $7, %ymm1, %ymm0, %ymm0 # sched: [14:2.00]
	; HASWELL-NEXT: vdpps $7, (%rdi), %ymm0, %ymm0 # sched: [18:2.00]			; HASWELL-NEXT: vdpps $7, (%rdi), %ymm0, %ymm0 # sched: [14:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_dpps:			; BTVER2-LABEL: test_dpps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vdpps $7, %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; BTVER2-NEXT: vdpps $7, %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; BTVER2-NEXT: vdpps $7, (%rdi), %ymm0, %ymm0 # sched: [8:1.00]			; BTVER2-NEXT: vdpps $7, (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_dpps:			; ZNVER1-LABEL: test_dpps:
	Show All 21 Lines
	; SANDY-NEXT: vextractf128 $1, %ymm0, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vextractf128 $1, %ymm0, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: vextractf128 $1, %ymm1, (%rdi) # sched: [5:1.00]			; SANDY-NEXT: vextractf128 $1, %ymm1, (%rdi) # sched: [5:1.00]
	; SANDY-NEXT: vzeroupper			; SANDY-NEXT: vzeroupper
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_extractf128:			; HASWELL-LABEL: test_extractf128:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vextractf128 $1, %ymm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vextractf128 $1, %ymm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vextractf128 $1, %ymm1, (%rdi) # sched: [4:1.00]			; HASWELL-NEXT: vextractf128 $1, %ymm1, (%rdi) # sched: [1:1.00]
	; HASWELL-NEXT: vzeroupper # sched: [1:?]			; HASWELL-NEXT: vzeroupper # sched: [4:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_extractf128:			; BTVER2-LABEL: test_extractf128:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vextractf128 $1, %ymm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vextractf128 $1, %ymm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vextractf128 $1, %ymm1, (%rdi) # sched: [1:1.00]			; BTVER2-NEXT: vextractf128 $1, %ymm1, (%rdi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_extractf128:			; ZNVER1-LABEL: test_extractf128:
	Show All 19 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vhaddpd %ymm1, %ymm0, %ymm0 # sched: [5:2.00]			; SANDY-NEXT: vhaddpd %ymm1, %ymm0, %ymm0 # sched: [5:2.00]
	; SANDY-NEXT: vhaddpd (%rdi), %ymm0, %ymm0 # sched: [12:2.00]			; SANDY-NEXT: vhaddpd (%rdi), %ymm0, %ymm0 # sched: [12:2.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_haddpd:			; HASWELL-LABEL: test_haddpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vhaddpd %ymm1, %ymm0, %ymm0 # sched: [5:2.00]			; HASWELL-NEXT: vhaddpd %ymm1, %ymm0, %ymm0 # sched: [5:2.00]
	; HASWELL-NEXT: vhaddpd (%rdi), %ymm0, %ymm0 # sched: [9:2.00]			; HASWELL-NEXT: vhaddpd (%rdi), %ymm0, %ymm0 # sched: [5:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_haddpd:			; BTVER2-LABEL: test_haddpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vhaddpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vhaddpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: vhaddpd (%rdi), %ymm0, %ymm0 # sched: [8:2.00]			; BTVER2-NEXT: vhaddpd (%rdi), %ymm0, %ymm0 # sched: [8:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_haddpd:			; ZNVER1-LABEL: test_haddpd:
	Show All 19 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vhaddps %ymm1, %ymm0, %ymm0 # sched: [5:2.00]			; SANDY-NEXT: vhaddps %ymm1, %ymm0, %ymm0 # sched: [5:2.00]
	; SANDY-NEXT: vhaddps (%rdi), %ymm0, %ymm0 # sched: [12:2.00]			; SANDY-NEXT: vhaddps (%rdi), %ymm0, %ymm0 # sched: [12:2.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_haddps:			; HASWELL-LABEL: test_haddps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vhaddps %ymm1, %ymm0, %ymm0 # sched: [5:2.00]			; HASWELL-NEXT: vhaddps %ymm1, %ymm0, %ymm0 # sched: [5:2.00]
	; HASWELL-NEXT: vhaddps (%rdi), %ymm0, %ymm0 # sched: [9:2.00]			; HASWELL-NEXT: vhaddps (%rdi), %ymm0, %ymm0 # sched: [5:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_haddps:			; BTVER2-LABEL: test_haddps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vhaddps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vhaddps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: vhaddps (%rdi), %ymm0, %ymm0 # sched: [8:2.00]			; BTVER2-NEXT: vhaddps (%rdi), %ymm0, %ymm0 # sched: [8:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_haddps:			; ZNVER1-LABEL: test_haddps:
	Show All 19 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vhsubpd %ymm1, %ymm0, %ymm0 # sched: [5:2.00]			; SANDY-NEXT: vhsubpd %ymm1, %ymm0, %ymm0 # sched: [5:2.00]
	; SANDY-NEXT: vhsubpd (%rdi), %ymm0, %ymm0 # sched: [12:2.00]			; SANDY-NEXT: vhsubpd (%rdi), %ymm0, %ymm0 # sched: [12:2.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_hsubpd:			; HASWELL-LABEL: test_hsubpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vhsubpd %ymm1, %ymm0, %ymm0 # sched: [5:2.00]			; HASWELL-NEXT: vhsubpd %ymm1, %ymm0, %ymm0 # sched: [5:2.00]
	; HASWELL-NEXT: vhsubpd (%rdi), %ymm0, %ymm0 # sched: [9:2.00]			; HASWELL-NEXT: vhsubpd (%rdi), %ymm0, %ymm0 # sched: [5:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_hsubpd:			; BTVER2-LABEL: test_hsubpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vhsubpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vhsubpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: vhsubpd (%rdi), %ymm0, %ymm0 # sched: [8:2.00]			; BTVER2-NEXT: vhsubpd (%rdi), %ymm0, %ymm0 # sched: [8:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_hsubpd:			; ZNVER1-LABEL: test_hsubpd:
	Show All 19 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vhsubps %ymm1, %ymm0, %ymm0 # sched: [5:2.00]			; SANDY-NEXT: vhsubps %ymm1, %ymm0, %ymm0 # sched: [5:2.00]
	; SANDY-NEXT: vhsubps (%rdi), %ymm0, %ymm0 # sched: [12:2.00]			; SANDY-NEXT: vhsubps (%rdi), %ymm0, %ymm0 # sched: [12:2.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_hsubps:			; HASWELL-LABEL: test_hsubps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vhsubps %ymm1, %ymm0, %ymm0 # sched: [5:2.00]			; HASWELL-NEXT: vhsubps %ymm1, %ymm0, %ymm0 # sched: [5:2.00]
	; HASWELL-NEXT: vhsubps (%rdi), %ymm0, %ymm0 # sched: [9:2.00]			; HASWELL-NEXT: vhsubps (%rdi), %ymm0, %ymm0 # sched: [5:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_hsubps:			; BTVER2-LABEL: test_hsubps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vhsubps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vhsubps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: vhsubps (%rdi), %ymm0, %ymm0 # sched: [8:2.00]			; BTVER2-NEXT: vhsubps (%rdi), %ymm0, %ymm0 # sched: [8:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_hsubps:			; ZNVER1-LABEL: test_hsubps:
	Show All 21 Lines
	; SANDY-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm1 # sched: [1:1.00]			; SANDY-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm1 # sched: [1:1.00]
	; SANDY-NEXT: vinsertf128 $1, (%rdi), %ymm0, %ymm0 # sched: [7:0.50]			; SANDY-NEXT: vinsertf128 $1, (%rdi), %ymm0, %ymm0 # sched: [7:0.50]
	; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_insertf128:			; HASWELL-LABEL: test_insertf128:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm1 # sched: [3:1.00]			; HASWELL-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm1 # sched: [3:1.00]
	; HASWELL-NEXT: vinsertf128 $1, (%rdi), %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vinsertf128 $1, (%rdi), %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_insertf128:			; BTVER2-LABEL: test_insertf128:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm1 # sched: [1:0.50]			; BTVER2-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm1 # sched: [1:0.50]
	; BTVER2-NEXT: vinsertf128 $1, (%rdi), %ymm0, %ymm0 # sched: [6:1.00]			; BTVER2-NEXT: vinsertf128 $1, (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
	; BTVER2-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 20 Lines
	;			;
	; SANDY-LABEL: test_lddqu:			; SANDY-LABEL: test_lddqu:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vlddqu (%rdi), %ymm0 # sched: [6:0.50]			; SANDY-NEXT: vlddqu (%rdi), %ymm0 # sched: [6:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lddqu:			; HASWELL-LABEL: test_lddqu:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vlddqu (%rdi), %ymm0 # sched: [4:0.50]			; HASWELL-NEXT: vlddqu (%rdi), %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lddqu:			; BTVER2-LABEL: test_lddqu:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vlddqu (%rdi), %ymm0 # sched: [5:1.00]			; BTVER2-NEXT: vlddqu (%rdi), %ymm0 # sched: [5:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_lddqu:			; ZNVER1-LABEL: test_lddqu:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 16 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmaskmovpd (%rdi), %xmm0, %xmm2 # sched: [8:1.00]			; SANDY-NEXT: vmaskmovpd (%rdi), %xmm0, %xmm2 # sched: [8:1.00]
	; SANDY-NEXT: vmaskmovpd %xmm1, %xmm0, (%rdi) # sched: [5:1.00]			; SANDY-NEXT: vmaskmovpd %xmm1, %xmm0, (%rdi) # sched: [5:1.00]
	; SANDY-NEXT: vmovapd %xmm2, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vmovapd %xmm2, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_maskmovpd:			; HASWELL-LABEL: test_maskmovpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmaskmovpd (%rdi), %xmm0, %xmm2 # sched: [4:2.00]			; HASWELL-NEXT: vmaskmovpd (%rdi), %xmm0, %xmm2 # sched: [2:2.00]
	; HASWELL-NEXT: vmaskmovpd %xmm1, %xmm0, (%rdi) # sched: [13:1.00]			; HASWELL-NEXT: vmaskmovpd %xmm1, %xmm0, (%rdi) # sched: [4:1.00]
	; HASWELL-NEXT: vmovapd %xmm2, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vmovapd %xmm2, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_maskmovpd:			; BTVER2-LABEL: test_maskmovpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmaskmovpd (%rdi), %xmm0, %xmm2			; BTVER2-NEXT: vmaskmovpd (%rdi), %xmm0, %xmm2
	; BTVER2-NEXT: vmaskmovpd %xmm1, %xmm0, (%rdi)			; BTVER2-NEXT: vmaskmovpd %xmm1, %xmm0, (%rdi)
	; BTVER2-NEXT: vmovapd %xmm2, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vmovapd %xmm2, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 22 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmaskmovpd (%rdi), %ymm0, %ymm2 # sched: [9:1.00]			; SANDY-NEXT: vmaskmovpd (%rdi), %ymm0, %ymm2 # sched: [9:1.00]
	; SANDY-NEXT: vmaskmovpd %ymm1, %ymm0, (%rdi) # sched: [5:1.00]			; SANDY-NEXT: vmaskmovpd %ymm1, %ymm0, (%rdi) # sched: [5:1.00]
	; SANDY-NEXT: vmovapd %ymm2, %ymm0 # sched: [1:1.00]			; SANDY-NEXT: vmovapd %ymm2, %ymm0 # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_maskmovpd_ymm:			; HASWELL-LABEL: test_maskmovpd_ymm:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmaskmovpd (%rdi), %ymm0, %ymm2 # sched: [4:2.00]			; HASWELL-NEXT: vmaskmovpd (%rdi), %ymm0, %ymm2 # sched: [2:2.00]
	; HASWELL-NEXT: vmaskmovpd %ymm1, %ymm0, (%rdi) # sched: [14:1.00]			; HASWELL-NEXT: vmaskmovpd %ymm1, %ymm0, (%rdi) # sched: [4:1.00]
	; HASWELL-NEXT: vmovapd %ymm2, %ymm0 # sched: [1:1.00]			; HASWELL-NEXT: vmovapd %ymm2, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_maskmovpd_ymm:			; BTVER2-LABEL: test_maskmovpd_ymm:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmaskmovpd (%rdi), %ymm0, %ymm2			; BTVER2-NEXT: vmaskmovpd (%rdi), %ymm0, %ymm2
	; BTVER2-NEXT: vmaskmovpd %ymm1, %ymm0, (%rdi)			; BTVER2-NEXT: vmaskmovpd %ymm1, %ymm0, (%rdi)
	; BTVER2-NEXT: vmovapd %ymm2, %ymm0 # sched: [1:0.50]			; BTVER2-NEXT: vmovapd %ymm2, %ymm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 22 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmaskmovps (%rdi), %xmm0, %xmm2 # sched: [8:1.00]			; SANDY-NEXT: vmaskmovps (%rdi), %xmm0, %xmm2 # sched: [8:1.00]
	; SANDY-NEXT: vmaskmovps %xmm1, %xmm0, (%rdi) # sched: [5:1.00]			; SANDY-NEXT: vmaskmovps %xmm1, %xmm0, (%rdi) # sched: [5:1.00]
	; SANDY-NEXT: vmovaps %xmm2, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vmovaps %xmm2, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_maskmovps:			; HASWELL-LABEL: test_maskmovps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmaskmovps (%rdi), %xmm0, %xmm2 # sched: [4:2.00]			; HASWELL-NEXT: vmaskmovps (%rdi), %xmm0, %xmm2 # sched: [2:2.00]
	; HASWELL-NEXT: vmaskmovps %xmm1, %xmm0, (%rdi) # sched: [13:1.00]			; HASWELL-NEXT: vmaskmovps %xmm1, %xmm0, (%rdi) # sched: [4:1.00]
	; HASWELL-NEXT: vmovaps %xmm2, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vmovaps %xmm2, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_maskmovps:			; BTVER2-LABEL: test_maskmovps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmaskmovps (%rdi), %xmm0, %xmm2			; BTVER2-NEXT: vmaskmovps (%rdi), %xmm0, %xmm2
	; BTVER2-NEXT: vmaskmovps %xmm1, %xmm0, (%rdi)			; BTVER2-NEXT: vmaskmovps %xmm1, %xmm0, (%rdi)
	; BTVER2-NEXT: vmovaps %xmm2, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vmovaps %xmm2, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 22 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmaskmovps (%rdi), %ymm0, %ymm2 # sched: [9:1.00]			; SANDY-NEXT: vmaskmovps (%rdi), %ymm0, %ymm2 # sched: [9:1.00]
	; SANDY-NEXT: vmaskmovps %ymm1, %ymm0, (%rdi) # sched: [5:1.00]			; SANDY-NEXT: vmaskmovps %ymm1, %ymm0, (%rdi) # sched: [5:1.00]
	; SANDY-NEXT: vmovaps %ymm2, %ymm0 # sched: [1:1.00]			; SANDY-NEXT: vmovaps %ymm2, %ymm0 # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_maskmovps_ymm:			; HASWELL-LABEL: test_maskmovps_ymm:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmaskmovps (%rdi), %ymm0, %ymm2 # sched: [4:2.00]			; HASWELL-NEXT: vmaskmovps (%rdi), %ymm0, %ymm2 # sched: [2:2.00]
	; HASWELL-NEXT: vmaskmovps %ymm1, %ymm0, (%rdi) # sched: [14:1.00]			; HASWELL-NEXT: vmaskmovps %ymm1, %ymm0, (%rdi) # sched: [4:1.00]
	; HASWELL-NEXT: vmovaps %ymm2, %ymm0 # sched: [1:1.00]			; HASWELL-NEXT: vmovaps %ymm2, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_maskmovps_ymm:			; BTVER2-LABEL: test_maskmovps_ymm:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmaskmovps (%rdi), %ymm0, %ymm2			; BTVER2-NEXT: vmaskmovps (%rdi), %ymm0, %ymm2
	; BTVER2-NEXT: vmaskmovps %ymm1, %ymm0, (%rdi)			; BTVER2-NEXT: vmaskmovps %ymm1, %ymm0, (%rdi)
	; BTVER2-NEXT: vmovaps %ymm2, %ymm0 # sched: [1:0.50]			; BTVER2-NEXT: vmovaps %ymm2, %ymm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 21 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmaxpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vmaxpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vmaxpd (%rdi), %ymm0, %ymm0 # sched: [10:1.00]			; SANDY-NEXT: vmaxpd (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_maxpd:			; HASWELL-LABEL: test_maxpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmaxpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vmaxpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmaxpd (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; HASWELL-NEXT: vmaxpd (%rdi), %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_maxpd:			; BTVER2-LABEL: test_maxpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmaxpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; BTVER2-NEXT: vmaxpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; BTVER2-NEXT: vmaxpd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]			; BTVER2-NEXT: vmaxpd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_maxpd:			; ZNVER1-LABEL: test_maxpd:
	Show All 19 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmaxps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vmaxps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vmaxps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]			; SANDY-NEXT: vmaxps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_maxps:			; HASWELL-LABEL: test_maxps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmaxps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vmaxps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmaxps (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; HASWELL-NEXT: vmaxps (%rdi), %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_maxps:			; BTVER2-LABEL: test_maxps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmaxps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; BTVER2-NEXT: vmaxps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; BTVER2-NEXT: vmaxps (%rdi), %ymm0, %ymm0 # sched: [8:1.00]			; BTVER2-NEXT: vmaxps (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_maxps:			; ZNVER1-LABEL: test_maxps:
	Show All 19 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vminpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vminpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vminpd (%rdi), %ymm0, %ymm0 # sched: [10:1.00]			; SANDY-NEXT: vminpd (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_minpd:			; HASWELL-LABEL: test_minpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vminpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vminpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vminpd (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; HASWELL-NEXT: vminpd (%rdi), %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_minpd:			; BTVER2-LABEL: test_minpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vminpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; BTVER2-NEXT: vminpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; BTVER2-NEXT: vminpd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]			; BTVER2-NEXT: vminpd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_minpd:			; ZNVER1-LABEL: test_minpd:
	Show All 19 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vminps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vminps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vminps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]			; SANDY-NEXT: vminps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_minps:			; HASWELL-LABEL: test_minps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vminps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vminps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vminps (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; HASWELL-NEXT: vminps (%rdi), %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_minps:			; BTVER2-LABEL: test_minps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vminps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; BTVER2-NEXT: vminps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; BTVER2-NEXT: vminps (%rdi), %ymm0, %ymm0 # sched: [8:1.00]			; BTVER2-NEXT: vminps (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_minps:			; ZNVER1-LABEL: test_minps:
	Show All 20 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovapd (%rdi), %ymm0 # sched: [7:0.50]			; SANDY-NEXT: vmovapd (%rdi), %ymm0 # sched: [7:0.50]
	; SANDY-NEXT: vaddpd %ymm0, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %ymm0, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vmovapd %ymm0, (%rsi) # sched: [5:1.00]			; SANDY-NEXT: vmovapd %ymm0, (%rsi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movapd:			; HASWELL-LABEL: test_movapd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovapd (%rdi), %ymm0 # sched: [4:0.50]			; HASWELL-NEXT: vmovapd (%rdi), %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: vaddpd %ymm0, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %ymm0, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmovapd %ymm0, (%rsi) # sched: [1:1.00]			; HASWELL-NEXT: vmovapd %ymm0, (%rsi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movapd:			; BTVER2-LABEL: test_movapd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovapd (%rdi), %ymm0 # sched: [5:1.00]			; BTVER2-NEXT: vmovapd (%rdi), %ymm0 # sched: [5:1.00]
	; BTVER2-NEXT: vaddpd %ymm0, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddpd %ymm0, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: vmovapd %ymm0, (%rsi) # sched: [1:1.00]			; BTVER2-NEXT: vmovapd %ymm0, (%rsi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 21 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovaps (%rdi), %ymm0 # sched: [7:0.50]			; SANDY-NEXT: vmovaps (%rdi), %ymm0 # sched: [7:0.50]
	; SANDY-NEXT: vaddps %ymm0, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm0, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vmovaps %ymm0, (%rsi) # sched: [5:1.00]			; SANDY-NEXT: vmovaps %ymm0, (%rsi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movaps:			; HASWELL-LABEL: test_movaps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovaps (%rdi), %ymm0 # sched: [4:0.50]			; HASWELL-NEXT: vmovaps (%rdi), %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: vaddps %ymm0, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %ymm0, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmovaps %ymm0, (%rsi) # sched: [1:1.00]			; HASWELL-NEXT: vmovaps %ymm0, (%rsi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movaps:			; BTVER2-LABEL: test_movaps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovaps (%rdi), %ymm0 # sched: [5:1.00]			; BTVER2-NEXT: vmovaps (%rdi), %ymm0 # sched: [5:1.00]
	; BTVER2-NEXT: vaddps %ymm0, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddps %ymm0, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: vmovaps %ymm0, (%rsi) # sched: [1:1.00]			; BTVER2-NEXT: vmovaps %ymm0, (%rsi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 22 Lines
	; SANDY-NEXT: vmovddup {{.*#+}} ymm0 = ymm0[0,0,2,2] sched: [1:1.00]			; SANDY-NEXT: vmovddup {{.*#+}} ymm0 = ymm0[0,0,2,2] sched: [1:1.00]
	; SANDY-NEXT: vmovddup {{.*#+}} ymm1 = mem[0,0,2,2] sched: [7:0.50]			; SANDY-NEXT: vmovddup {{.*#+}} ymm1 = mem[0,0,2,2] sched: [7:0.50]
	; SANDY-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movddup:			; HASWELL-LABEL: test_movddup:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovddup {{.*#+}} ymm0 = ymm0[0,0,2,2] sched: [1:1.00]			; HASWELL-NEXT: vmovddup {{.*#+}} ymm0 = ymm0[0,0,2,2] sched: [1:1.00]
	; HASWELL-NEXT: vmovddup {{.*#+}} ymm1 = mem[0,0,2,2] sched: [4:0.50]			; HASWELL-NEXT: vmovddup {{.*#+}} ymm1 = mem[0,0,2,2] sched: [1:0.50]
	; HASWELL-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movddup:			; BTVER2-LABEL: test_movddup:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovddup {{.*#+}} ymm1 = mem[0,0,2,2] sched: [5:1.00]			; BTVER2-NEXT: vmovddup {{.*#+}} ymm1 = mem[0,0,2,2] sched: [5:1.00]
	; BTVER2-NEXT: vmovddup {{.*#+}} ymm0 = ymm0[0,0,2,2] sched: [1:0.50]			; BTVER2-NEXT: vmovddup {{.*#+}} ymm0 = ymm0[0,0,2,2] sched: [1:0.50]
	; BTVER2-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 20 Lines
	; SANDY-LABEL: test_movmskpd:			; SANDY-LABEL: test_movmskpd:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovmskpd %ymm0, %eax # sched: [2:1.00]			; SANDY-NEXT: vmovmskpd %ymm0, %eax # sched: [2:1.00]
	; SANDY-NEXT: vzeroupper			; SANDY-NEXT: vzeroupper
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movmskpd:			; HASWELL-LABEL: test_movmskpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovmskpd %ymm0, %eax # sched: [2:1.00]			; HASWELL-NEXT: vmovmskpd %ymm0, %eax # sched: [3:1.00]
	; HASWELL-NEXT: vzeroupper # sched: [1:?]			; HASWELL-NEXT: vzeroupper # sched: [4:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movmskpd:			; BTVER2-LABEL: test_movmskpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovmskpd %ymm0, %eax # sched: [1:0.50]			; BTVER2-NEXT: vmovmskpd %ymm0, %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_movmskpd:			; ZNVER1-LABEL: test_movmskpd:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 15 Lines
	; SANDY-LABEL: test_movmskps:			; SANDY-LABEL: test_movmskps:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovmskps %ymm0, %eax # sched: [2:1.00]			; SANDY-NEXT: vmovmskps %ymm0, %eax # sched: [2:1.00]
	; SANDY-NEXT: vzeroupper			; SANDY-NEXT: vzeroupper
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movmskps:			; HASWELL-LABEL: test_movmskps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovmskps %ymm0, %eax # sched: [2:1.00]			; HASWELL-NEXT: vmovmskps %ymm0, %eax # sched: [3:1.00]
	; HASWELL-NEXT: vzeroupper # sched: [1:?]			; HASWELL-NEXT: vzeroupper # sched: [4:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movmskps:			; BTVER2-LABEL: test_movmskps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovmskps %ymm0, %eax # sched: [1:0.50]			; BTVER2-NEXT: vmovmskps %ymm0, %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_movmskps:			; ZNVER1-LABEL: test_movmskps:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 17 Lines
	; SANDY-NEXT: vaddpd %ymm0, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %ymm0, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vmovntpd %ymm0, (%rdi) # sched: [5:1.00]			; SANDY-NEXT: vmovntpd %ymm0, (%rdi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movntpd:			; HASWELL-LABEL: test_movntpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vaddpd %ymm0, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %ymm0, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmovntpd %ymm0, (%rdi) # sched: [1:1.00]			; HASWELL-NEXT: vmovntpd %ymm0, (%rdi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movntpd:			; BTVER2-LABEL: test_movntpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vaddpd %ymm0, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddpd %ymm0, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: vmovntpd %ymm0, (%rdi) # sched: [1:1.00]			; BTVER2-NEXT: vmovntpd %ymm0, (%rdi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_movntpd:			; ZNVER1-LABEL: test_movntpd:
	Show All 18 Lines
	; SANDY-NEXT: vaddps %ymm0, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm0, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vmovntps %ymm0, (%rdi) # sched: [5:1.00]			; SANDY-NEXT: vmovntps %ymm0, (%rdi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movntps:			; HASWELL-LABEL: test_movntps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vaddps %ymm0, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %ymm0, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmovntps %ymm0, (%rdi) # sched: [1:1.00]			; HASWELL-NEXT: vmovntps %ymm0, (%rdi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movntps:			; BTVER2-LABEL: test_movntps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vaddps %ymm0, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddps %ymm0, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: vmovntps %ymm0, (%rdi) # sched: [1:1.00]			; BTVER2-NEXT: vmovntps %ymm0, (%rdi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_movntps:			; ZNVER1-LABEL: test_movntps:
	Show All 19 Lines
	; SANDY-NEXT: vmovshdup {{.*#+}} ymm0 = ymm0[1,1,3,3,5,5,7,7] sched: [1:1.00]			; SANDY-NEXT: vmovshdup {{.*#+}} ymm0 = ymm0[1,1,3,3,5,5,7,7] sched: [1:1.00]
	; SANDY-NEXT: vmovshdup {{.*#+}} ymm1 = mem[1,1,3,3,5,5,7,7] sched: [7:0.50]			; SANDY-NEXT: vmovshdup {{.*#+}} ymm1 = mem[1,1,3,3,5,5,7,7] sched: [7:0.50]
	; SANDY-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movshdup:			; HASWELL-LABEL: test_movshdup:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovshdup {{.*#+}} ymm0 = ymm0[1,1,3,3,5,5,7,7] sched: [1:1.00]			; HASWELL-NEXT: vmovshdup {{.*#+}} ymm0 = ymm0[1,1,3,3,5,5,7,7] sched: [1:1.00]
	; HASWELL-NEXT: vmovshdup {{.*#+}} ymm1 = mem[1,1,3,3,5,5,7,7] sched: [4:0.50]			; HASWELL-NEXT: vmovshdup {{.*#+}} ymm1 = mem[1,1,3,3,5,5,7,7] sched: [1:0.50]
	; HASWELL-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movshdup:			; BTVER2-LABEL: test_movshdup:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovshdup {{.*#+}} ymm1 = mem[1,1,3,3,5,5,7,7] sched: [5:1.00]			; BTVER2-NEXT: vmovshdup {{.*#+}} ymm1 = mem[1,1,3,3,5,5,7,7] sched: [5:1.00]
	; BTVER2-NEXT: vmovshdup {{.*#+}} ymm0 = ymm0[1,1,3,3,5,5,7,7] sched: [1:0.50]			; BTVER2-NEXT: vmovshdup {{.*#+}} ymm0 = ymm0[1,1,3,3,5,5,7,7] sched: [1:0.50]
	; BTVER2-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 23 Lines
	; SANDY-NEXT: vmovsldup {{.*#+}} ymm0 = ymm0[0,0,2,2,4,4,6,6] sched: [1:1.00]			; SANDY-NEXT: vmovsldup {{.*#+}} ymm0 = ymm0[0,0,2,2,4,4,6,6] sched: [1:1.00]
	; SANDY-NEXT: vmovsldup {{.*#+}} ymm1 = mem[0,0,2,2,4,4,6,6] sched: [7:0.50]			; SANDY-NEXT: vmovsldup {{.*#+}} ymm1 = mem[0,0,2,2,4,4,6,6] sched: [7:0.50]
	; SANDY-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movsldup:			; HASWELL-LABEL: test_movsldup:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovsldup {{.*#+}} ymm0 = ymm0[0,0,2,2,4,4,6,6] sched: [1:1.00]			; HASWELL-NEXT: vmovsldup {{.*#+}} ymm0 = ymm0[0,0,2,2,4,4,6,6] sched: [1:1.00]
	; HASWELL-NEXT: vmovsldup {{.*#+}} ymm1 = mem[0,0,2,2,4,4,6,6] sched: [4:0.50]			; HASWELL-NEXT: vmovsldup {{.*#+}} ymm1 = mem[0,0,2,2,4,4,6,6] sched: [1:0.50]
	; HASWELL-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movsldup:			; BTVER2-LABEL: test_movsldup:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovsldup {{.*#+}} ymm1 = mem[0,0,2,2,4,4,6,6] sched: [5:1.00]			; BTVER2-NEXT: vmovsldup {{.*#+}} ymm1 = mem[0,0,2,2,4,4,6,6] sched: [5:1.00]
	; BTVER2-NEXT: vmovsldup {{.*#+}} ymm0 = ymm0[0,0,2,2,4,4,6,6] sched: [1:0.50]			; BTVER2-NEXT: vmovsldup {{.*#+}} ymm0 = ymm0[0,0,2,2,4,4,6,6] sched: [1:0.50]
	; BTVER2-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 24 Lines
	; SANDY-NEXT: vinsertf128 $1, 16(%rdi), %ymm0, %ymm0 # sched: [7:0.50]			; SANDY-NEXT: vinsertf128 $1, 16(%rdi), %ymm0, %ymm0 # sched: [7:0.50]
	; SANDY-NEXT: vaddpd %ymm0, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %ymm0, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vextractf128 $1, %ymm0, 16(%rsi) # sched: [5:1.00]			; SANDY-NEXT: vextractf128 $1, %ymm0, 16(%rsi) # sched: [5:1.00]
	; SANDY-NEXT: vmovupd %xmm0, (%rsi) # sched: [5:1.00]			; SANDY-NEXT: vmovupd %xmm0, (%rsi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movupd:			; HASWELL-LABEL: test_movupd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovupd (%rdi), %ymm0 # sched: [4:0.50]			; HASWELL-NEXT: vmovupd (%rdi), %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: vaddpd %ymm0, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %ymm0, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmovupd %ymm0, (%rsi) # sched: [1:1.00]			; HASWELL-NEXT: vmovupd %ymm0, (%rsi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movupd:			; BTVER2-LABEL: test_movupd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovupd (%rdi), %ymm0 # sched: [5:1.00]			; BTVER2-NEXT: vmovupd (%rdi), %ymm0 # sched: [5:1.00]
	; BTVER2-NEXT: vaddpd %ymm0, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddpd %ymm0, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: vmovupd %ymm0, (%rsi) # sched: [1:1.00]			; BTVER2-NEXT: vmovupd %ymm0, (%rsi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 23 Lines
	; SANDY-NEXT: vinsertf128 $1, 16(%rdi), %ymm0, %ymm0 # sched: [7:0.50]			; SANDY-NEXT: vinsertf128 $1, 16(%rdi), %ymm0, %ymm0 # sched: [7:0.50]
	; SANDY-NEXT: vaddps %ymm0, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm0, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vextractf128 $1, %ymm0, 16(%rsi) # sched: [5:1.00]			; SANDY-NEXT: vextractf128 $1, %ymm0, 16(%rsi) # sched: [5:1.00]
	; SANDY-NEXT: vmovups %xmm0, (%rsi) # sched: [5:1.00]			; SANDY-NEXT: vmovups %xmm0, (%rsi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movups:			; HASWELL-LABEL: test_movups:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovups (%rdi), %ymm0 # sched: [4:0.50]			; HASWELL-NEXT: vmovups (%rdi), %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: vaddps %ymm0, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %ymm0, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmovups %ymm0, (%rsi) # sched: [1:1.00]			; HASWELL-NEXT: vmovups %ymm0, (%rsi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movups:			; BTVER2-LABEL: test_movups:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovups (%rdi), %ymm0 # sched: [5:1.00]			; BTVER2-NEXT: vmovups (%rdi), %ymm0 # sched: [5:1.00]
	; BTVER2-NEXT: vaddps %ymm0, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddps %ymm0, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: vmovups %ymm0, (%rsi) # sched: [1:1.00]			; BTVER2-NEXT: vmovups %ymm0, (%rsi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 19 Lines
	; SANDY-LABEL: test_mulpd:			; SANDY-LABEL: test_mulpd:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmulpd %ymm1, %ymm0, %ymm0 # sched: [5:1.00]			; SANDY-NEXT: vmulpd %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
	; SANDY-NEXT: vmulpd (%rdi), %ymm0, %ymm0 # sched: [12:1.00]			; SANDY-NEXT: vmulpd (%rdi), %ymm0, %ymm0 # sched: [12:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_mulpd:			; HASWELL-LABEL: test_mulpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmulpd %ymm1, %ymm0, %ymm0 # sched: [5:1.00]			; HASWELL-NEXT: vmulpd %ymm1, %ymm0, %ymm0 # sched: [5:0.50]
	; HASWELL-NEXT: vmulpd (%rdi), %ymm0, %ymm0 # sched: [9:1.00]			; HASWELL-NEXT: vmulpd (%rdi), %ymm0, %ymm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_mulpd:			; BTVER2-LABEL: test_mulpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmulpd %ymm1, %ymm0, %ymm0 # sched: [4:4.00]			; BTVER2-NEXT: vmulpd %ymm1, %ymm0, %ymm0 # sched: [4:4.00]
	; BTVER2-NEXT: vmulpd (%rdi), %ymm0, %ymm0 # sched: [9:4.00]			; BTVER2-NEXT: vmulpd (%rdi), %ymm0, %ymm0 # sched: [9:4.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_mulpd:			; ZNVER1-LABEL: test_mulpd:
	Show All 17 Lines
	; SANDY-LABEL: test_mulps:			; SANDY-LABEL: test_mulps:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmulps %ymm1, %ymm0, %ymm0 # sched: [5:1.00]			; SANDY-NEXT: vmulps %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
	; SANDY-NEXT: vmulps (%rdi), %ymm0, %ymm0 # sched: [12:1.00]			; SANDY-NEXT: vmulps (%rdi), %ymm0, %ymm0 # sched: [12:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_mulps:			; HASWELL-LABEL: test_mulps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmulps %ymm1, %ymm0, %ymm0 # sched: [5:1.00]			; HASWELL-NEXT: vmulps %ymm1, %ymm0, %ymm0 # sched: [5:0.50]
	; HASWELL-NEXT: vmulps (%rdi), %ymm0, %ymm0 # sched: [9:1.00]			; HASWELL-NEXT: vmulps (%rdi), %ymm0, %ymm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_mulps:			; BTVER2-LABEL: test_mulps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmulps %ymm1, %ymm0, %ymm0 # sched: [2:2.00]			; BTVER2-NEXT: vmulps %ymm1, %ymm0, %ymm0 # sched: [2:2.00]
	; BTVER2-NEXT: vmulps (%rdi), %ymm0, %ymm0 # sched: [7:2.00]			; BTVER2-NEXT: vmulps (%rdi), %ymm0, %ymm0 # sched: [7:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_mulps:			; ZNVER1-LABEL: test_mulps:
	Show All 20 Lines
	; SANDY-NEXT: vorpd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; SANDY-NEXT: vorpd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; SANDY-NEXT: vorpd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]			; SANDY-NEXT: vorpd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
	; SANDY-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: orpd:			; HASWELL-LABEL: orpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vorpd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; HASWELL-NEXT: vorpd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: vorpd (%rdi), %ymm0, %ymm0 # sched: [5:1.00]			; HASWELL-NEXT: vorpd (%rdi), %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: orpd:			; BTVER2-LABEL: orpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vorpd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; BTVER2-NEXT: vorpd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; BTVER2-NEXT: vorpd (%rdi), %ymm0, %ymm0 # sched: [6:1.00]			; BTVER2-NEXT: vorpd (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
	; BTVER2-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 27 Lines
	; SANDY-NEXT: vorps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; SANDY-NEXT: vorps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; SANDY-NEXT: vorps (%rdi), %ymm0, %ymm0 # sched: [8:1.00]			; SANDY-NEXT: vorps (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
	; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_orps:			; HASWELL-LABEL: test_orps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vorps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; HASWELL-NEXT: vorps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: vorps (%rdi), %ymm0, %ymm0 # sched: [5:1.00]			; HASWELL-NEXT: vorps (%rdi), %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_orps:			; BTVER2-LABEL: test_orps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vorps %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; BTVER2-NEXT: vorps %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; BTVER2-NEXT: vorps (%rdi), %ymm0, %ymm0 # sched: [6:1.00]			; BTVER2-NEXT: vorps (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
	; BTVER2-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 27 Lines
	; SANDY-NEXT: vpermilpd {{.*#+}} xmm0 = xmm0[1,0] sched: [1:1.00]			; SANDY-NEXT: vpermilpd {{.*#+}} xmm0 = xmm0[1,0] sched: [1:1.00]
	; SANDY-NEXT: vpermilpd {{.*#+}} xmm1 = mem[1,0] sched: [7:1.00]			; SANDY-NEXT: vpermilpd {{.*#+}} xmm1 = mem[1,0] sched: [7:1.00]
	; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_permilpd:			; HASWELL-LABEL: test_permilpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpermilpd {{.*#+}} xmm0 = xmm0[1,0] sched: [1:1.00]			; HASWELL-NEXT: vpermilpd {{.*#+}} xmm0 = xmm0[1,0] sched: [1:1.00]
	; HASWELL-NEXT: vpermilpd {{.*#+}} xmm1 = mem[1,0] sched: [5:1.00]			; HASWELL-NEXT: vpermilpd {{.*#+}} xmm1 = mem[1,0] sched: [1:1.00]
	; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_permilpd:			; BTVER2-LABEL: test_permilpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpermilpd {{.*#+}} xmm1 = mem[1,0] sched: [6:1.00]			; BTVER2-NEXT: vpermilpd {{.*#+}} xmm1 = mem[1,0] sched: [6:1.00]
	; BTVER2-NEXT: vpermilpd {{.*#+}} xmm0 = xmm0[1,0] sched: [1:0.50]			; BTVER2-NEXT: vpermilpd {{.*#+}} xmm0 = xmm0[1,0] sched: [1:0.50]
	; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 23 Lines
	; SANDY-NEXT: vpermilpd {{.*#+}} ymm0 = ymm0[1,0,2,3] sched: [1:1.00]			; SANDY-NEXT: vpermilpd {{.*#+}} ymm0 = ymm0[1,0,2,3] sched: [1:1.00]
	; SANDY-NEXT: vpermilpd {{.*#+}} ymm1 = mem[1,0,2,3] sched: [8:1.00]			; SANDY-NEXT: vpermilpd {{.*#+}} ymm1 = mem[1,0,2,3] sched: [8:1.00]
	; SANDY-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_permilpd_ymm:			; HASWELL-LABEL: test_permilpd_ymm:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpermilpd {{.*#+}} ymm0 = ymm0[1,0,2,3] sched: [1:1.00]			; HASWELL-NEXT: vpermilpd {{.*#+}} ymm0 = ymm0[1,0,2,3] sched: [1:1.00]
	; HASWELL-NEXT: vpermilpd {{.*#+}} ymm1 = mem[1,0,2,3] sched: [5:1.00]			; HASWELL-NEXT: vpermilpd {{.*#+}} ymm1 = mem[1,0,2,3] sched: [1:1.00]
	; HASWELL-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_permilpd_ymm:			; BTVER2-LABEL: test_permilpd_ymm:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpermilpd {{.*#+}} ymm1 = mem[1,0,2,3] sched: [6:1.00]			; BTVER2-NEXT: vpermilpd {{.*#+}} ymm1 = mem[1,0,2,3] sched: [6:1.00]
	; BTVER2-NEXT: vpermilpd {{.*#+}} ymm0 = ymm0[1,0,2,3] sched: [1:0.50]			; BTVER2-NEXT: vpermilpd {{.*#+}} ymm0 = ymm0[1,0,2,3] sched: [1:0.50]
	; BTVER2-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 23 Lines
	; SANDY-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[3,2,1,0] sched: [1:1.00]			; SANDY-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[3,2,1,0] sched: [1:1.00]
	; SANDY-NEXT: vpermilps {{.*#+}} xmm1 = mem[3,2,1,0] sched: [7:1.00]			; SANDY-NEXT: vpermilps {{.*#+}} xmm1 = mem[3,2,1,0] sched: [7:1.00]
	; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_permilps:			; HASWELL-LABEL: test_permilps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[3,2,1,0] sched: [1:1.00]			; HASWELL-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[3,2,1,0] sched: [1:1.00]
	; HASWELL-NEXT: vpermilps {{.*#+}} xmm1 = mem[3,2,1,0] sched: [5:1.00]			; HASWELL-NEXT: vpermilps {{.*#+}} xmm1 = mem[3,2,1,0] sched: [1:1.00]
	; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_permilps:			; BTVER2-LABEL: test_permilps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpermilps {{.*#+}} xmm1 = mem[3,2,1,0] sched: [6:1.00]			; BTVER2-NEXT: vpermilps {{.*#+}} xmm1 = mem[3,2,1,0] sched: [6:1.00]
	; BTVER2-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[3,2,1,0] sched: [1:0.50]			; BTVER2-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[3,2,1,0] sched: [1:0.50]
	; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 23 Lines
	; SANDY-NEXT: vpermilps {{.*#+}} ymm0 = ymm0[3,2,1,0,7,6,5,4] sched: [1:1.00]			; SANDY-NEXT: vpermilps {{.*#+}} ymm0 = ymm0[3,2,1,0,7,6,5,4] sched: [1:1.00]
	; SANDY-NEXT: vpermilps {{.*#+}} ymm1 = mem[3,2,1,0,7,6,5,4] sched: [8:1.00]			; SANDY-NEXT: vpermilps {{.*#+}} ymm1 = mem[3,2,1,0,7,6,5,4] sched: [8:1.00]
	; SANDY-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_permilps_ymm:			; HASWELL-LABEL: test_permilps_ymm:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpermilps {{.*#+}} ymm0 = ymm0[3,2,1,0,7,6,5,4] sched: [1:1.00]			; HASWELL-NEXT: vpermilps {{.*#+}} ymm0 = ymm0[3,2,1,0,7,6,5,4] sched: [1:1.00]
	; HASWELL-NEXT: vpermilps {{.*#+}} ymm1 = mem[3,2,1,0,7,6,5,4] sched: [5:1.00]			; HASWELL-NEXT: vpermilps {{.*#+}} ymm1 = mem[3,2,1,0,7,6,5,4] sched: [1:1.00]
	; HASWELL-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_permilps_ymm:			; BTVER2-LABEL: test_permilps_ymm:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpermilps {{.*#+}} ymm1 = mem[3,2,1,0,7,6,5,4] sched: [6:1.00]			; BTVER2-NEXT: vpermilps {{.*#+}} ymm1 = mem[3,2,1,0,7,6,5,4] sched: [6:1.00]
	; BTVER2-NEXT: vpermilps {{.*#+}} ymm0 = ymm0[3,2,1,0,7,6,5,4] sched: [1:0.50]			; BTVER2-NEXT: vpermilps {{.*#+}} ymm0 = ymm0[3,2,1,0,7,6,5,4] sched: [1:0.50]
	; BTVER2-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 21 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpermilpd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vpermilpd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: vpermilpd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; SANDY-NEXT: vpermilpd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_permilvarpd:			; HASWELL-LABEL: test_permilvarpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpermilpd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpermilpd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vpermilpd (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpermilpd (%rdi), %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_permilvarpd:			; BTVER2-LABEL: test_permilvarpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpermilpd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpermilpd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpermilpd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpermilpd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_permilvarpd:			; ZNVER1-LABEL: test_permilvarpd:
	Show All 19 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpermilpd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; SANDY-NEXT: vpermilpd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; SANDY-NEXT: vpermilpd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]			; SANDY-NEXT: vpermilpd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_permilvarpd_ymm:			; HASWELL-LABEL: test_permilvarpd_ymm:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpermilpd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; HASWELL-NEXT: vpermilpd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: vpermilpd (%rdi), %ymm0, %ymm0 # sched: [5:1.00]			; HASWELL-NEXT: vpermilpd (%rdi), %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_permilvarpd_ymm:			; BTVER2-LABEL: test_permilvarpd_ymm:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpermilpd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; BTVER2-NEXT: vpermilpd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpermilpd (%rdi), %ymm0, %ymm0 # sched: [6:1.00]			; BTVER2-NEXT: vpermilpd (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_permilvarpd_ymm:			; ZNVER1-LABEL: test_permilvarpd_ymm:
	Show All 19 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpermilps %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vpermilps %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: vpermilps (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; SANDY-NEXT: vpermilps (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_permilvarps:			; HASWELL-LABEL: test_permilvarps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpermilps %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpermilps %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vpermilps (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpermilps (%rdi), %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_permilvarps:			; BTVER2-LABEL: test_permilvarps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpermilps %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpermilps %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpermilps (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpermilps (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_permilvarps:			; ZNVER1-LABEL: test_permilvarps:
	Show All 19 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpermilps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; SANDY-NEXT: vpermilps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; SANDY-NEXT: vpermilps (%rdi), %ymm0, %ymm0 # sched: [8:1.00]			; SANDY-NEXT: vpermilps (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_permilvarps_ymm:			; HASWELL-LABEL: test_permilvarps_ymm:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpermilps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; HASWELL-NEXT: vpermilps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: vpermilps (%rdi), %ymm0, %ymm0 # sched: [5:1.00]			; HASWELL-NEXT: vpermilps (%rdi), %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_permilvarps_ymm:			; BTVER2-LABEL: test_permilvarps_ymm:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpermilps %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; BTVER2-NEXT: vpermilps %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpermilps (%rdi), %ymm0, %ymm0 # sched: [6:1.00]			; BTVER2-NEXT: vpermilps (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_permilvarps_ymm:			; ZNVER1-LABEL: test_permilvarps_ymm:
	Show All 21 Lines
	; SANDY-NEXT: vrcpps (%rdi), %ymm1 # sched: [14:2.00]			; SANDY-NEXT: vrcpps (%rdi), %ymm1 # sched: [14:2.00]
	; SANDY-NEXT: vrcpps %ymm0, %ymm0 # sched: [7:2.00]			; SANDY-NEXT: vrcpps %ymm0, %ymm0 # sched: [7:2.00]
	; SANDY-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_rcpps:			; HASWELL-LABEL: test_rcpps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpps (%rdi), %ymm1 # sched: [11:2.00]			; HASWELL-NEXT: vrcpps (%rdi), %ymm1 # sched: [11:2.00]
	; HASWELL-NEXT: vrcpps %ymm0, %ymm0 # sched: [7:2.00]			; HASWELL-NEXT: vrcpps %ymm0, %ymm0 # sched: [11:2.00]
	; HASWELL-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_rcpps:			; BTVER2-LABEL: test_rcpps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vrcpps (%rdi), %ymm1 # sched: [7:2.00]			; BTVER2-NEXT: vrcpps (%rdi), %ymm1 # sched: [7:2.00]
	; BTVER2-NEXT: vrcpps %ymm0, %ymm0 # sched: [2:2.00]			; BTVER2-NEXT: vrcpps %ymm0, %ymm0 # sched: [2:2.00]
	; BTVER2-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 23 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vroundpd $7, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vroundpd $7, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vroundpd $7, (%rdi), %ymm1 # sched: [10:1.00]			; SANDY-NEXT: vroundpd $7, (%rdi), %ymm1 # sched: [10:1.00]
	; SANDY-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_roundpd:			; HASWELL-LABEL: test_roundpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vroundpd $7, %ymm0, %ymm0 # sched: [6:2.00]			; HASWELL-NEXT: vroundpd $7, %ymm0, %ymm0 # sched: [5:1.25]
	; HASWELL-NEXT: vroundpd $7, (%rdi), %ymm1 # sched: [10:2.00]			; HASWELL-NEXT: vroundpd $7, (%rdi), %ymm1 # sched: [6:2.00]
	; HASWELL-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_roundpd:			; BTVER2-LABEL: test_roundpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vroundpd $7, (%rdi), %ymm1 # sched: [8:1.00]			; BTVER2-NEXT: vroundpd $7, (%rdi), %ymm1 # sched: [8:1.00]
	; BTVER2-NEXT: vroundpd $7, %ymm0, %ymm0 # sched: [3:1.00]			; BTVER2-NEXT: vroundpd $7, %ymm0, %ymm0 # sched: [3:1.00]
	; BTVER2-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 23 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vroundps $7, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vroundps $7, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vroundps $7, (%rdi), %ymm1 # sched: [10:1.00]			; SANDY-NEXT: vroundps $7, (%rdi), %ymm1 # sched: [10:1.00]
	; SANDY-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_roundps:			; HASWELL-LABEL: test_roundps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vroundps $7, %ymm0, %ymm0 # sched: [6:2.00]			; HASWELL-NEXT: vroundps $7, %ymm0, %ymm0 # sched: [5:1.25]
	; HASWELL-NEXT: vroundps $7, (%rdi), %ymm1 # sched: [10:2.00]			; HASWELL-NEXT: vroundps $7, (%rdi), %ymm1 # sched: [6:2.00]
	; HASWELL-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_roundps:			; BTVER2-LABEL: test_roundps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vroundps $7, (%rdi), %ymm1 # sched: [8:1.00]			; BTVER2-NEXT: vroundps $7, (%rdi), %ymm1 # sched: [8:1.00]
	; BTVER2-NEXT: vroundps $7, %ymm0, %ymm0 # sched: [3:1.00]			; BTVER2-NEXT: vroundps $7, %ymm0, %ymm0 # sched: [3:1.00]
	; BTVER2-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 24 Lines
	; SANDY-NEXT: vrsqrtps (%rdi), %ymm1 # sched: [14:2.00]			; SANDY-NEXT: vrsqrtps (%rdi), %ymm1 # sched: [14:2.00]
	; SANDY-NEXT: vrsqrtps %ymm0, %ymm0 # sched: [7:2.00]			; SANDY-NEXT: vrsqrtps %ymm0, %ymm0 # sched: [7:2.00]
	; SANDY-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_rsqrtps:			; HASWELL-LABEL: test_rsqrtps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrsqrtps (%rdi), %ymm1 # sched: [11:2.00]			; HASWELL-NEXT: vrsqrtps (%rdi), %ymm1 # sched: [11:2.00]
	; HASWELL-NEXT: vrsqrtps %ymm0, %ymm0 # sched: [7:2.00]			; HASWELL-NEXT: vrsqrtps %ymm0, %ymm0 # sched: [11:2.00]
	; HASWELL-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_rsqrtps:			; BTVER2-LABEL: test_rsqrtps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vrsqrtps (%rdi), %ymm1 # sched: [7:2.00]			; BTVER2-NEXT: vrsqrtps (%rdi), %ymm1 # sched: [7:2.00]
	; BTVER2-NEXT: vrsqrtps %ymm0, %ymm0 # sched: [2:2.00]			; BTVER2-NEXT: vrsqrtps %ymm0, %ymm0 # sched: [2:2.00]
	; BTVER2-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 24 Lines
	; SANDY-NEXT: vshufpd {{.*#+}} ymm0 = ymm0[1],ymm1[0],ymm0[2],ymm1[3] sched: [1:1.00]			; SANDY-NEXT: vshufpd {{.*#+}} ymm0 = ymm0[1],ymm1[0],ymm0[2],ymm1[3] sched: [1:1.00]
	; SANDY-NEXT: vshufpd {{.*#+}} ymm1 = ymm1[1],mem[0],ymm1[2],mem[3] sched: [8:1.00]			; SANDY-NEXT: vshufpd {{.*#+}} ymm1 = ymm1[1],mem[0],ymm1[2],mem[3] sched: [8:1.00]
	; SANDY-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_shufpd:			; HASWELL-LABEL: test_shufpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vshufpd {{.*#+}} ymm0 = ymm0[1],ymm1[0],ymm0[2],ymm1[3] sched: [1:1.00]			; HASWELL-NEXT: vshufpd {{.*#+}} ymm0 = ymm0[1],ymm1[0],ymm0[2],ymm1[3] sched: [1:1.00]
	; HASWELL-NEXT: vshufpd {{.*#+}} ymm1 = ymm1[1],mem[0],ymm1[2],mem[3] sched: [5:1.00]			; HASWELL-NEXT: vshufpd {{.*#+}} ymm1 = ymm1[1],mem[0],ymm1[2],mem[3] sched: [1:1.00]
	; HASWELL-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_shufpd:			; BTVER2-LABEL: test_shufpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vshufpd {{.*#+}} ymm0 = ymm0[1],ymm1[0],ymm0[2],ymm1[3] sched: [1:0.50]			; BTVER2-NEXT: vshufpd {{.*#+}} ymm0 = ymm0[1],ymm1[0],ymm0[2],ymm1[3] sched: [1:0.50]
	; BTVER2-NEXT: vshufpd {{.*#+}} ymm1 = ymm1[1],mem[0],ymm1[2],mem[3] sched: [6:1.00]			; BTVER2-NEXT: vshufpd {{.*#+}} ymm1 = ymm1[1],mem[0],ymm1[2],mem[3] sched: [6:1.00]
	; BTVER2-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 21 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vshufps {{.*#+}} ymm0 = ymm0[0,0],ymm1[0,0],ymm0[4,4],ymm1[4,4] sched: [1:1.00]			; SANDY-NEXT: vshufps {{.*#+}} ymm0 = ymm0[0,0],ymm1[0,0],ymm0[4,4],ymm1[4,4] sched: [1:1.00]
	; SANDY-NEXT: vshufps {{.*#+}} ymm0 = ymm0[0,3],mem[0,0],ymm0[4,7],mem[4,4] sched: [8:1.00]			; SANDY-NEXT: vshufps {{.*#+}} ymm0 = ymm0[0,3],mem[0,0],ymm0[4,7],mem[4,4] sched: [8:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_shufps:			; HASWELL-LABEL: test_shufps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vshufps {{.*#+}} ymm0 = ymm0[0,0],ymm1[0,0],ymm0[4,4],ymm1[4,4] sched: [1:1.00]			; HASWELL-NEXT: vshufps {{.*#+}} ymm0 = ymm0[0,0],ymm1[0,0],ymm0[4,4],ymm1[4,4] sched: [1:1.00]
	; HASWELL-NEXT: vshufps {{.*#+}} ymm0 = ymm0[0,3],mem[0,0],ymm0[4,7],mem[4,4] sched: [5:1.00]			; HASWELL-NEXT: vshufps {{.*#+}} ymm0 = ymm0[0,3],mem[0,0],ymm0[4,7],mem[4,4] sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_shufps:			; BTVER2-LABEL: test_shufps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vshufps {{.*#+}} ymm0 = ymm0[0,0],ymm1[0,0],ymm0[4,4],ymm1[4,4] sched: [1:0.50]			; BTVER2-NEXT: vshufps {{.*#+}} ymm0 = ymm0[0,0],ymm1[0,0],ymm0[4,4],ymm1[4,4] sched: [1:0.50]
	; BTVER2-NEXT: vshufps {{.*#+}} ymm0 = ymm0[0,3],mem[0,0],ymm0[4,7],mem[4,4] sched: [6:1.00]			; BTVER2-NEXT: vshufps {{.*#+}} ymm0 = ymm0[0,3],mem[0,0],ymm0[4,7],mem[4,4] sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_shufps:			; ZNVER1-LABEL: test_shufps:
	Show All 19 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vsqrtpd (%rdi), %ymm1 # sched: [52:2.00]			; SANDY-NEXT: vsqrtpd (%rdi), %ymm1 # sched: [52:2.00]
	; SANDY-NEXT: vsqrtpd %ymm0, %ymm0 # sched: [45:2.00]			; SANDY-NEXT: vsqrtpd %ymm0, %ymm0 # sched: [45:2.00]
	; SANDY-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_sqrtpd:			; HASWELL-LABEL: test_sqrtpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vsqrtpd (%rdi), %ymm1 # sched: [32:2.00]			; HASWELL-NEXT: vsqrtpd (%rdi), %ymm1 # sched: [35:2.00]
	; HASWELL-NEXT: vsqrtpd %ymm0, %ymm0 # sched: [28:2.00]			; HASWELL-NEXT: vsqrtpd %ymm0, %ymm0 # sched: [35:2.00]
	; HASWELL-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_sqrtpd:			; BTVER2-LABEL: test_sqrtpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vsqrtpd (%rdi), %ymm1 # sched: [59:54.00]			; BTVER2-NEXT: vsqrtpd (%rdi), %ymm1 # sched: [59:54.00]
	; BTVER2-NEXT: vsqrtpd %ymm0, %ymm0 # sched: [54:54.00]			; BTVER2-NEXT: vsqrtpd %ymm0, %ymm0 # sched: [54:54.00]
	; BTVER2-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 23 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vsqrtps (%rdi), %ymm1 # sched: [36:2.00]			; SANDY-NEXT: vsqrtps (%rdi), %ymm1 # sched: [36:2.00]
	; SANDY-NEXT: vsqrtps %ymm0, %ymm0 # sched: [29:2.00]			; SANDY-NEXT: vsqrtps %ymm0, %ymm0 # sched: [29:2.00]
	; SANDY-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_sqrtps:			; HASWELL-LABEL: test_sqrtps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vsqrtps (%rdi), %ymm1 # sched: [23:2.00]			; HASWELL-NEXT: vsqrtps (%rdi), %ymm1 # sched: [21:2.00]
	; HASWELL-NEXT: vsqrtps %ymm0, %ymm0 # sched: [19:2.00]			; HASWELL-NEXT: vsqrtps %ymm0, %ymm0 # sched: [21:2.00]
	; HASWELL-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_sqrtps:			; BTVER2-LABEL: test_sqrtps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vsqrtps (%rdi), %ymm1 # sched: [47:42.00]			; BTVER2-NEXT: vsqrtps (%rdi), %ymm1 # sched: [47:42.00]
	; BTVER2-NEXT: vsqrtps %ymm0, %ymm0 # sched: [42:42.00]			; BTVER2-NEXT: vsqrtps %ymm0, %ymm0 # sched: [42:42.00]
	; BTVER2-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 22 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vsubpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vsubpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vsubpd (%rdi), %ymm0, %ymm0 # sched: [10:1.00]			; SANDY-NEXT: vsubpd (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_subpd:			; HASWELL-LABEL: test_subpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vsubpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vsubpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vsubpd (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; HASWELL-NEXT: vsubpd (%rdi), %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_subpd:			; BTVER2-LABEL: test_subpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vsubpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vsubpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: vsubpd (%rdi), %ymm0, %ymm0 # sched: [8:2.00]			; BTVER2-NEXT: vsubpd (%rdi), %ymm0, %ymm0 # sched: [8:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_subpd:			; ZNVER1-LABEL: test_subpd:
	Show All 18 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vsubps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vsubps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vsubps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]			; SANDY-NEXT: vsubps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_subps:			; HASWELL-LABEL: test_subps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vsubps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vsubps %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: vsubps (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; HASWELL-NEXT: vsubps (%rdi), %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_subps:			; BTVER2-LABEL: test_subps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vsubps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vsubps %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: vsubps (%rdi), %ymm0, %ymm0 # sched: [8:2.00]			; BTVER2-NEXT: vsubps (%rdi), %ymm0, %ymm0 # sched: [8:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_subps:			; ZNVER1-LABEL: test_subps:
	Show All 24 Lines
	; SANDY-NEXT: setb %al # sched: [1:0.50]			; SANDY-NEXT: setb %al # sched: [1:0.50]
	; SANDY-NEXT: vtestpd (%rdi), %xmm0 # sched: [7:1.00]			; SANDY-NEXT: vtestpd (%rdi), %xmm0 # sched: [7:1.00]
	; SANDY-NEXT: adcl $0, %eax # sched: [2:0.67]			; SANDY-NEXT: adcl $0, %eax # sched: [2:0.67]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_testpd:			; HASWELL-LABEL: test_testpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: xorl %eax, %eax # sched: [1:0.25]			; HASWELL-NEXT: xorl %eax, %eax # sched: [1:0.25]
	; HASWELL-NEXT: vtestpd %xmm1, %xmm0 # sched: [1:0.33]			; HASWELL-NEXT: vtestpd %xmm1, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: setb %al # sched: [1:0.50]			; HASWELL-NEXT: setb %al # sched: [1:0.50]
	; HASWELL-NEXT: vtestpd (%rdi), %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vtestpd (%rdi), %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: adcl $0, %eax # sched: [2:0.50]			; HASWELL-NEXT: adcl $0, %eax # sched: [2:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_testpd:			; BTVER2-LABEL: test_testpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: xorl %eax, %eax # sched: [1:0.50]			; BTVER2-NEXT: xorl %eax, %eax # sched: [1:0.50]
	; BTVER2-NEXT: vtestpd %xmm1, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vtestpd %xmm1, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: setb %al # sched: [1:0.50]			; BTVER2-NEXT: setb %al # sched: [1:0.50]
	; BTVER2-NEXT: vtestpd (%rdi), %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vtestpd (%rdi), %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: adcl $0, %eax # sched: [1:0.50]			; BTVER2-NEXT: adcl $0, %eax # sched: [1:0.50]
	Show All 34 Lines
	; SANDY-NEXT: vtestpd (%rdi), %ymm0 # sched: [8:1.00]			; SANDY-NEXT: vtestpd (%rdi), %ymm0 # sched: [8:1.00]
	; SANDY-NEXT: adcl $0, %eax # sched: [2:0.67]			; SANDY-NEXT: adcl $0, %eax # sched: [2:0.67]
	; SANDY-NEXT: vzeroupper			; SANDY-NEXT: vzeroupper
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_testpd_ymm:			; HASWELL-LABEL: test_testpd_ymm:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: xorl %eax, %eax # sched: [1:0.25]			; HASWELL-NEXT: xorl %eax, %eax # sched: [1:0.25]
	; HASWELL-NEXT: vtestpd %ymm1, %ymm0 # sched: [1:0.33]			; HASWELL-NEXT: vtestpd %ymm1, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: setb %al # sched: [1:0.50]			; HASWELL-NEXT: setb %al # sched: [1:0.50]
	; HASWELL-NEXT: vtestpd (%rdi), %ymm0 # sched: [5:0.50]			; HASWELL-NEXT: vtestpd (%rdi), %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: adcl $0, %eax # sched: [2:0.50]			; HASWELL-NEXT: adcl $0, %eax # sched: [2:0.50]
	; HASWELL-NEXT: vzeroupper # sched: [1:?]			; HASWELL-NEXT: vzeroupper # sched: [4:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_testpd_ymm:			; BTVER2-LABEL: test_testpd_ymm:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: xorl %eax, %eax # sched: [1:0.50]			; BTVER2-NEXT: xorl %eax, %eax # sched: [1:0.50]
	; BTVER2-NEXT: vtestpd %ymm1, %ymm0 # sched: [1:0.50]			; BTVER2-NEXT: vtestpd %ymm1, %ymm0 # sched: [1:0.50]
	; BTVER2-NEXT: setb %al # sched: [1:0.50]			; BTVER2-NEXT: setb %al # sched: [1:0.50]
	; BTVER2-NEXT: vtestpd (%rdi), %ymm0 # sched: [6:1.00]			; BTVER2-NEXT: vtestpd (%rdi), %ymm0 # sched: [6:1.00]
	; BTVER2-NEXT: adcl $0, %eax # sched: [1:0.50]			; BTVER2-NEXT: adcl $0, %eax # sched: [1:0.50]
	Show All 33 Lines
	; SANDY-NEXT: setb %al # sched: [1:0.50]			; SANDY-NEXT: setb %al # sched: [1:0.50]
	; SANDY-NEXT: vtestps (%rdi), %xmm0 # sched: [7:1.00]			; SANDY-NEXT: vtestps (%rdi), %xmm0 # sched: [7:1.00]
	; SANDY-NEXT: adcl $0, %eax # sched: [2:0.67]			; SANDY-NEXT: adcl $0, %eax # sched: [2:0.67]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_testps:			; HASWELL-LABEL: test_testps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: xorl %eax, %eax # sched: [1:0.25]			; HASWELL-NEXT: xorl %eax, %eax # sched: [1:0.25]
	; HASWELL-NEXT: vtestps %xmm1, %xmm0 # sched: [1:0.33]			; HASWELL-NEXT: vtestps %xmm1, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: setb %al # sched: [1:0.50]			; HASWELL-NEXT: setb %al # sched: [1:0.50]
	; HASWELL-NEXT: vtestps (%rdi), %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vtestps (%rdi), %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: adcl $0, %eax # sched: [2:0.50]			; HASWELL-NEXT: adcl $0, %eax # sched: [2:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_testps:			; BTVER2-LABEL: test_testps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: xorl %eax, %eax # sched: [1:0.50]			; BTVER2-NEXT: xorl %eax, %eax # sched: [1:0.50]
	; BTVER2-NEXT: vtestps %xmm1, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vtestps %xmm1, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: setb %al # sched: [1:0.50]			; BTVER2-NEXT: setb %al # sched: [1:0.50]
	; BTVER2-NEXT: vtestps (%rdi), %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vtestps (%rdi), %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: adcl $0, %eax # sched: [1:0.50]			; BTVER2-NEXT: adcl $0, %eax # sched: [1:0.50]
	Show All 34 Lines
	; SANDY-NEXT: vtestps (%rdi), %ymm0 # sched: [8:1.00]			; SANDY-NEXT: vtestps (%rdi), %ymm0 # sched: [8:1.00]
	; SANDY-NEXT: adcl $0, %eax # sched: [2:0.67]			; SANDY-NEXT: adcl $0, %eax # sched: [2:0.67]
	; SANDY-NEXT: vzeroupper			; SANDY-NEXT: vzeroupper
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_testps_ymm:			; HASWELL-LABEL: test_testps_ymm:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: xorl %eax, %eax # sched: [1:0.25]			; HASWELL-NEXT: xorl %eax, %eax # sched: [1:0.25]
	; HASWELL-NEXT: vtestps %ymm1, %ymm0 # sched: [1:0.33]			; HASWELL-NEXT: vtestps %ymm1, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: setb %al # sched: [1:0.50]			; HASWELL-NEXT: setb %al # sched: [1:0.50]
	; HASWELL-NEXT: vtestps (%rdi), %ymm0 # sched: [5:0.50]			; HASWELL-NEXT: vtestps (%rdi), %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: adcl $0, %eax # sched: [2:0.50]			; HASWELL-NEXT: adcl $0, %eax # sched: [2:0.50]
	; HASWELL-NEXT: vzeroupper # sched: [1:?]			; HASWELL-NEXT: vzeroupper # sched: [4:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_testps_ymm:			; BTVER2-LABEL: test_testps_ymm:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: xorl %eax, %eax # sched: [1:0.50]			; BTVER2-NEXT: xorl %eax, %eax # sched: [1:0.50]
	; BTVER2-NEXT: vtestps %ymm1, %ymm0 # sched: [1:0.50]			; BTVER2-NEXT: vtestps %ymm1, %ymm0 # sched: [1:0.50]
	; BTVER2-NEXT: setb %al # sched: [1:0.50]			; BTVER2-NEXT: setb %al # sched: [1:0.50]
	; BTVER2-NEXT: vtestps (%rdi), %ymm0 # sched: [6:1.00]			; BTVER2-NEXT: vtestps (%rdi), %ymm0 # sched: [6:1.00]
	; BTVER2-NEXT: adcl $0, %eax # sched: [1:0.50]			; BTVER2-NEXT: adcl $0, %eax # sched: [1:0.50]
	Show All 29 Lines
	; SANDY-NEXT: vunpckhpd {{.*#+}} ymm0 = ymm0[1],ymm1[1],ymm0[3],ymm1[3] sched: [1:1.00]			; SANDY-NEXT: vunpckhpd {{.*#+}} ymm0 = ymm0[1],ymm1[1],ymm0[3],ymm1[3] sched: [1:1.00]
	; SANDY-NEXT: vunpckhpd {{.*#+}} ymm1 = ymm1[1],mem[1],ymm1[3],mem[3] sched: [8:1.00]			; SANDY-NEXT: vunpckhpd {{.*#+}} ymm1 = ymm1[1],mem[1],ymm1[3],mem[3] sched: [8:1.00]
	; SANDY-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_unpckhpd:			; HASWELL-LABEL: test_unpckhpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vunpckhpd {{.*#+}} ymm0 = ymm0[1],ymm1[1],ymm0[3],ymm1[3] sched: [1:1.00]			; HASWELL-NEXT: vunpckhpd {{.*#+}} ymm0 = ymm0[1],ymm1[1],ymm0[3],ymm1[3] sched: [1:1.00]
	; HASWELL-NEXT: vunpckhpd {{.*#+}} ymm1 = ymm1[1],mem[1],ymm1[3],mem[3] sched: [5:1.00]			; HASWELL-NEXT: vunpckhpd {{.*#+}} ymm1 = ymm1[1],mem[1],ymm1[3],mem[3] sched: [1:1.00]
	; HASWELL-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_unpckhpd:			; BTVER2-LABEL: test_unpckhpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vunpckhpd {{.*#+}} ymm0 = ymm0[1],ymm1[1],ymm0[3],ymm1[3] sched: [1:0.50]			; BTVER2-NEXT: vunpckhpd {{.*#+}} ymm0 = ymm0[1],ymm1[1],ymm0[3],ymm1[3] sched: [1:0.50]
	; BTVER2-NEXT: vunpckhpd {{.*#+}} ymm1 = ymm1[1],mem[1],ymm1[3],mem[3] sched: [6:1.00]			; BTVER2-NEXT: vunpckhpd {{.*#+}} ymm1 = ymm1[1],mem[1],ymm1[3],mem[3] sched: [6:1.00]
	; BTVER2-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 21 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vunpckhps {{.*#+}} ymm0 = ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[6],ymm1[6],ymm0[7],ymm1[7] sched: [1:1.00]			; SANDY-NEXT: vunpckhps {{.*#+}} ymm0 = ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[6],ymm1[6],ymm0[7],ymm1[7] sched: [1:1.00]
	; SANDY-NEXT: vunpckhps {{.*#+}} ymm0 = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]			; SANDY-NEXT: vunpckhps {{.*#+}} ymm0 = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_unpckhps:			; HASWELL-LABEL: test_unpckhps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vunpckhps {{.*#+}} ymm0 = ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[6],ymm1[6],ymm0[7],ymm1[7] sched: [1:1.00]			; HASWELL-NEXT: vunpckhps {{.*#+}} ymm0 = ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[6],ymm1[6],ymm0[7],ymm1[7] sched: [1:1.00]
	; HASWELL-NEXT: vunpckhps {{.*#+}} ymm0 = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [5:1.00]			; HASWELL-NEXT: vunpckhps {{.*#+}} ymm0 = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_unpckhps:			; BTVER2-LABEL: test_unpckhps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vunpckhps {{.*#+}} ymm0 = ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[6],ymm1[6],ymm0[7],ymm1[7] sched: [1:0.50]			; BTVER2-NEXT: vunpckhps {{.*#+}} ymm0 = ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[6],ymm1[6],ymm0[7],ymm1[7] sched: [1:0.50]
	; BTVER2-NEXT: vunpckhps {{.*#+}} ymm0 = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [6:1.00]			; BTVER2-NEXT: vunpckhps {{.*#+}} ymm0 = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_unpckhps:			; ZNVER1-LABEL: test_unpckhps:
	Show All 20 Lines
	; SANDY-NEXT: vunpcklpd {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[2],ymm1[2] sched: [1:1.00]			; SANDY-NEXT: vunpcklpd {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[2],ymm1[2] sched: [1:1.00]
	; SANDY-NEXT: vunpcklpd {{.*#+}} ymm1 = ymm1[0],mem[0],ymm1[2],mem[2] sched: [8:1.00]			; SANDY-NEXT: vunpcklpd {{.*#+}} ymm1 = ymm1[0],mem[0],ymm1[2],mem[2] sched: [8:1.00]
	; SANDY-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_unpcklpd:			; HASWELL-LABEL: test_unpcklpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vunpcklpd {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[2],ymm1[2] sched: [1:1.00]			; HASWELL-NEXT: vunpcklpd {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[2],ymm1[2] sched: [1:1.00]
	; HASWELL-NEXT: vunpcklpd {{.*#+}} ymm1 = ymm1[0],mem[0],ymm1[2],mem[2] sched: [5:1.00]			; HASWELL-NEXT: vunpcklpd {{.*#+}} ymm1 = ymm1[0],mem[0],ymm1[2],mem[2] sched: [1:1.00]
	; HASWELL-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_unpcklpd:			; BTVER2-LABEL: test_unpcklpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vunpcklpd {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[2],ymm1[2] sched: [1:0.50]			; BTVER2-NEXT: vunpcklpd {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[2],ymm1[2] sched: [1:0.50]
	; BTVER2-NEXT: vunpcklpd {{.*#+}} ymm1 = ymm1[0],mem[0],ymm1[2],mem[2] sched: [6:1.00]			; BTVER2-NEXT: vunpcklpd {{.*#+}} ymm1 = ymm1[0],mem[0],ymm1[2],mem[2] sched: [6:1.00]
	; BTVER2-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 21 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vunpcklps {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[4],ymm1[4],ymm0[5],ymm1[5] sched: [1:1.00]			; SANDY-NEXT: vunpcklps {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[4],ymm1[4],ymm0[5],ymm1[5] sched: [1:1.00]
	; SANDY-NEXT: vunpcklps {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]			; SANDY-NEXT: vunpcklps {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_unpcklps:			; HASWELL-LABEL: test_unpcklps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vunpcklps {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[4],ymm1[4],ymm0[5],ymm1[5] sched: [1:1.00]			; HASWELL-NEXT: vunpcklps {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[4],ymm1[4],ymm0[5],ymm1[5] sched: [1:1.00]
	; HASWELL-NEXT: vunpcklps {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [5:1.00]			; HASWELL-NEXT: vunpcklps {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_unpcklps:			; BTVER2-LABEL: test_unpcklps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vunpcklps {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[4],ymm1[4],ymm0[5],ymm1[5] sched: [1:0.50]			; BTVER2-NEXT: vunpcklps {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[4],ymm1[4],ymm0[5],ymm1[5] sched: [1:0.50]
	; BTVER2-NEXT: vunpcklps {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [6:1.00]			; BTVER2-NEXT: vunpcklps {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_unpcklps:			; ZNVER1-LABEL: test_unpcklps:
	Show All 20 Lines
	; SANDY-NEXT: vxorpd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; SANDY-NEXT: vxorpd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; SANDY-NEXT: vxorpd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]			; SANDY-NEXT: vxorpd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
	; SANDY-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_xorpd:			; HASWELL-LABEL: test_xorpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vxorpd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; HASWELL-NEXT: vxorpd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: vxorpd (%rdi), %ymm0, %ymm0 # sched: [5:1.00]			; HASWELL-NEXT: vxorpd (%rdi), %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_xorpd:			; BTVER2-LABEL: test_xorpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vxorpd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; BTVER2-NEXT: vxorpd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; BTVER2-NEXT: vxorpd (%rdi), %ymm0, %ymm0 # sched: [6:1.00]			; BTVER2-NEXT: vxorpd (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
	; BTVER2-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddpd %ymm0, %ymm1, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 27 Lines
	; SANDY-NEXT: vxorps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; SANDY-NEXT: vxorps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; SANDY-NEXT: vxorps (%rdi), %ymm0, %ymm0 # sched: [8:1.00]			; SANDY-NEXT: vxorps (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
	; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_xorps:			; HASWELL-LABEL: test_xorps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vxorps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; HASWELL-NEXT: vxorps %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: vxorps (%rdi), %ymm0, %ymm0 # sched: [5:1.00]			; HASWELL-NEXT: vxorps (%rdi), %ymm0, %ymm0 # sched: [1:1.00]
	; HASWELL-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_xorps:			; BTVER2-LABEL: test_xorps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vxorps %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; BTVER2-NEXT: vxorps %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; BTVER2-NEXT: vxorps (%rdi), %ymm0, %ymm0 # sched: [6:1.00]			; BTVER2-NEXT: vxorps (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
	; BTVER2-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 22 Lines
	;			;
	; SANDY-LABEL: test_zeroall:			; SANDY-LABEL: test_zeroall:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vzeroall			; SANDY-NEXT: vzeroall
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_zeroall:			; HASWELL-LABEL: test_zeroall:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vzeroall # sched: [1:?]			; HASWELL-NEXT: vzeroall # sched: [16:16.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_zeroall:			; BTVER2-LABEL: test_zeroall:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vzeroall # sched: [90:?]			; BTVER2-NEXT: vzeroall # sched: [90:?]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_zeroall:			; ZNVER1-LABEL: test_zeroall:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 12 Lines
	;			;
	; SANDY-LABEL: test_zeroupper:			; SANDY-LABEL: test_zeroupper:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vzeroupper			; SANDY-NEXT: vzeroupper
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_zeroupper:			; HASWELL-LABEL: test_zeroupper:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vzeroupper # sched: [1:?]			; HASWELL-NEXT: vzeroupper # sched: [4:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_zeroupper:			; BTVER2-LABEL: test_zeroupper:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vzeroupper # sched: [46:?]			; BTVER2-NEXT: vzeroupper # sched: [46:?]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_zeroupper:			; ZNVER1-LABEL: test_zeroupper:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: vzeroupper			; ZNVER1-NEXT: vzeroupper
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	call void @llvm.x86.avx.vzeroupper()			call void @llvm.x86.avx.vzeroupper()
	ret void			ret void
	}			}
	declare void @llvm.x86.avx.vzeroupper() nounwind			declare void @llvm.x86.avx.vzeroupper() nounwind

	!0 = !{i32 1}			!0 = !{i32 1}

test/CodeGen/X86/avx2-schedule.ll

	Show All 9 Lines
	; GENERIC-NEXT: vpabsb %ymm0, %ymm0 # sched: [3:1.00]			; GENERIC-NEXT: vpabsb %ymm0, %ymm0 # sched: [3:1.00]
	; GENERIC-NEXT: vpabsb (%rdi), %ymm1 # sched: [7:1.00]			; GENERIC-NEXT: vpabsb (%rdi), %ymm1 # sched: [7:1.00]
	; GENERIC-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; GENERIC-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pabsb:			; HASWELL-LABEL: test_pabsb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpabsb %ymm0, %ymm0 # sched: [1:0.50]			; HASWELL-NEXT: vpabsb %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpabsb (%rdi), %ymm1 # sched: [5:0.50]			; HASWELL-NEXT: vpabsb (%rdi), %ymm1 # sched: [1:0.50]
	; HASWELL-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]			; HASWELL-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_pabsb:			; ZNVER1-LABEL: test_pabsb:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: vpabsb (%rdi), %ymm1 # sched: [8:0.50]			; ZNVER1-NEXT: vpabsb (%rdi), %ymm1 # sched: [8:0.50]
	; ZNVER1-NEXT: vpabsb %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpabsb %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = call <32 x i8> @llvm.x86.avx2.pabs.b(<32 x i8> %a0)			%1 = call <32 x i8> @llvm.x86.avx2.pabs.b(<32 x i8> %a0)
	Show All 10 Lines
	; GENERIC-NEXT: vpabsd %ymm0, %ymm0 # sched: [3:1.00]			; GENERIC-NEXT: vpabsd %ymm0, %ymm0 # sched: [3:1.00]
	; GENERIC-NEXT: vpabsd (%rdi), %ymm1 # sched: [7:1.00]			; GENERIC-NEXT: vpabsd (%rdi), %ymm1 # sched: [7:1.00]
	; GENERIC-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; GENERIC-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pabsd:			; HASWELL-LABEL: test_pabsd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpabsd %ymm0, %ymm0 # sched: [1:0.50]			; HASWELL-NEXT: vpabsd %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpabsd (%rdi), %ymm1 # sched: [5:0.50]			; HASWELL-NEXT: vpabsd (%rdi), %ymm1 # sched: [1:0.50]
	; HASWELL-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]			; HASWELL-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_pabsd:			; ZNVER1-LABEL: test_pabsd:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: vpabsd (%rdi), %ymm1 # sched: [8:0.50]			; ZNVER1-NEXT: vpabsd (%rdi), %ymm1 # sched: [8:0.50]
	; ZNVER1-NEXT: vpabsd %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpabsd %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = call <8 x i32> @llvm.x86.avx2.pabs.d(<8 x i32> %a0)			%1 = call <8 x i32> @llvm.x86.avx2.pabs.d(<8 x i32> %a0)
	Show All 10 Lines
	; GENERIC-NEXT: vpabsw %ymm0, %ymm0 # sched: [3:1.00]			; GENERIC-NEXT: vpabsw %ymm0, %ymm0 # sched: [3:1.00]
	; GENERIC-NEXT: vpabsw (%rdi), %ymm1 # sched: [7:1.00]			; GENERIC-NEXT: vpabsw (%rdi), %ymm1 # sched: [7:1.00]
	; GENERIC-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; GENERIC-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pabsw:			; HASWELL-LABEL: test_pabsw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpabsw %ymm0, %ymm0 # sched: [1:0.50]			; HASWELL-NEXT: vpabsw %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpabsw (%rdi), %ymm1 # sched: [5:0.50]			; HASWELL-NEXT: vpabsw (%rdi), %ymm1 # sched: [1:0.50]
	; HASWELL-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]			; HASWELL-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_pabsw:			; ZNVER1-LABEL: test_pabsw:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: vpabsw (%rdi), %ymm1 # sched: [8:0.50]			; ZNVER1-NEXT: vpabsw (%rdi), %ymm1 # sched: [8:0.50]
	; ZNVER1-NEXT: vpabsw %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpabsw %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = call <16 x i16> @llvm.x86.avx2.pabs.w(<16 x i16> %a0)			%1 = call <16 x i16> @llvm.x86.avx2.pabs.w(<16 x i16> %a0)
	Show All 9 Lines
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: vpaddb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; GENERIC-NEXT: vpaddb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; GENERIC-NEXT: vpaddb (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; GENERIC-NEXT: vpaddb (%rdi), %ymm0, %ymm0 # sched: [7:1.00]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_paddb:			; HASWELL-LABEL: test_paddb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpaddb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddb (%rdi), %ymm0, %ymm0 # sched: [5:0.50]			; HASWELL-NEXT: vpaddb (%rdi), %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_paddb:			; ZNVER1-LABEL: test_paddb:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: vpaddb %ymm1, %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpaddb %ymm1, %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: vpaddb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]			; ZNVER1-NEXT: vpaddb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = add <32 x i8> %a0, %a1			%1 = add <32 x i8> %a0, %a1
	%2 = load <32 x i8>, <32 x i8> *%a2, align 32			%2 = load <32 x i8>, <32 x i8> *%a2, align 32
	%3 = add <32 x i8> %1, %2			%3 = add <32 x i8> %1, %2
	ret <32 x i8> %3			ret <32 x i8> %3
	}			}

	define <8 x i32> @test_paddd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {			define <8 x i32> @test_paddd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
	; GENERIC-LABEL: test_paddd:			; GENERIC-LABEL: test_paddd:
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; GENERIC-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; GENERIC-NEXT: vpaddd (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; GENERIC-NEXT: vpaddd (%rdi), %ymm0, %ymm0 # sched: [7:1.00]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_paddd:			; HASWELL-LABEL: test_paddd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddd (%rdi), %ymm0, %ymm0 # sched: [5:0.50]			; HASWELL-NEXT: vpaddd (%rdi), %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_paddd:			; ZNVER1-LABEL: test_paddd:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: vpaddd (%rdi), %ymm0, %ymm0 # sched: [8:0.50]			; ZNVER1-NEXT: vpaddd (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = add <8 x i32> %a0, %a1			%1 = add <8 x i32> %a0, %a1
	%2 = load <8 x i32>, <8 x i32> *%a2, align 32			%2 = load <8 x i32>, <8 x i32> *%a2, align 32
	%3 = add <8 x i32> %1, %2			%3 = add <8 x i32> %1, %2
	ret <8 x i32> %3			ret <8 x i32> %3
	}			}

	define <4 x i64> @test_paddq(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {			define <4 x i64> @test_paddq(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {
	; GENERIC-LABEL: test_paddq:			; GENERIC-LABEL: test_paddq:
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; GENERIC-NEXT: vpaddq (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; GENERIC-NEXT: vpaddq (%rdi), %ymm0, %ymm0 # sched: [7:1.00]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_paddq:			; HASWELL-LABEL: test_paddq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddq (%rdi), %ymm0, %ymm0 # sched: [5:0.50]			; HASWELL-NEXT: vpaddq (%rdi), %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_paddq:			; ZNVER1-LABEL: test_paddq:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: vpaddq (%rdi), %ymm0, %ymm0 # sched: [8:0.50]			; ZNVER1-NEXT: vpaddq (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = add <4 x i64> %a0, %a1			%1 = add <4 x i64> %a0, %a1
	%2 = load <4 x i64>, <4 x i64> *%a2, align 32			%2 = load <4 x i64>, <4 x i64> *%a2, align 32
	%3 = add <4 x i64> %1, %2			%3 = add <4 x i64> %1, %2
	ret <4 x i64> %3			ret <4 x i64> %3
	}			}

	define <16 x i16> @test_paddw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {			define <16 x i16> @test_paddw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
	; GENERIC-LABEL: test_paddw:			; GENERIC-LABEL: test_paddw:
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; GENERIC-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; GENERIC-NEXT: vpaddw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; GENERIC-NEXT: vpaddw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_paddw:			; HASWELL-LABEL: test_paddw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddw (%rdi), %ymm0, %ymm0 # sched: [5:0.50]			; HASWELL-NEXT: vpaddw (%rdi), %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_paddw:			; ZNVER1-LABEL: test_paddw:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: vpaddw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]			; ZNVER1-NEXT: vpaddw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = add <16 x i16> %a0, %a1			%1 = add <16 x i16> %a0, %a1
	%2 = load <16 x i16>, <16 x i16> *%a2, align 32			%2 = load <16 x i16>, <16 x i16> *%a2, align 32
	%3 = add <16 x i16> %1, %2			%3 = add <16 x i16> %1, %2
	ret <16 x i16> %3			ret <16 x i16> %3
	}			}

	define <4 x i64> @test_pand(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {			define <4 x i64> @test_pand(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {
	; GENERIC-LABEL: test_pand:			; GENERIC-LABEL: test_pand:
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: vpand %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; GENERIC-NEXT: vpand %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; GENERIC-NEXT: vpand (%rdi), %ymm0, %ymm0 # sched: [5:1.00]			; GENERIC-NEXT: vpand (%rdi), %ymm0, %ymm0 # sched: [5:1.00]
	; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pand:			; HASWELL-LABEL: test_pand:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpand %ymm1, %ymm0, %ymm0 # sched: [1:0.33]			; HASWELL-NEXT: vpand %ymm1, %ymm0, %ymm0 # sched: [1:0.33]
	; HASWELL-NEXT: vpand (%rdi), %ymm0, %ymm0 # sched: [5:0.50]			; HASWELL-NEXT: vpand (%rdi), %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_pand:			; ZNVER1-LABEL: test_pand:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: vpand %ymm1, %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpand %ymm1, %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: vpand (%rdi), %ymm0, %ymm0 # sched: [8:0.50]			; ZNVER1-NEXT: vpand (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
	; ZNVER1-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = and <4 x i64> %a0, %a1			%1 = and <4 x i64> %a0, %a1
	Show All 9 Lines
	; GENERIC-NEXT: vpandn %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; GENERIC-NEXT: vpandn %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; GENERIC-NEXT: vpandn (%rdi), %ymm0, %ymm1 # sched: [5:1.00]			; GENERIC-NEXT: vpandn (%rdi), %ymm0, %ymm1 # sched: [5:1.00]
	; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pandn:			; HASWELL-LABEL: test_pandn:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpandn %ymm1, %ymm0, %ymm0 # sched: [1:0.33]			; HASWELL-NEXT: vpandn %ymm1, %ymm0, %ymm0 # sched: [1:0.33]
	; HASWELL-NEXT: vpandn (%rdi), %ymm0, %ymm1 # sched: [5:0.50]			; HASWELL-NEXT: vpandn (%rdi), %ymm0, %ymm1 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_pandn:			; ZNVER1-LABEL: test_pandn:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: vpandn %ymm1, %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpandn %ymm1, %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: vpandn (%rdi), %ymm0, %ymm1 # sched: [8:0.50]			; ZNVER1-NEXT: vpandn (%rdi), %ymm0, %ymm1 # sched: [8:0.50]
	; ZNVER1-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = xor <4 x i64> %a0, <i64 -1, i64 -1, i64 -1, i64 -1>			%1 = xor <4 x i64> %a0, <i64 -1, i64 -1, i64 -1, i64 -1>
	Show All 11 Lines
	; GENERIC-NEXT: vpmulld %ymm1, %ymm0, %ymm0 # sched: [5:1.00]			; GENERIC-NEXT: vpmulld %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
	; GENERIC-NEXT: vpmulld (%rdi), %ymm0, %ymm0 # sched: [9:1.00]			; GENERIC-NEXT: vpmulld (%rdi), %ymm0, %ymm0 # sched: [9:1.00]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmulld:			; HASWELL-LABEL: test_pmulld:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmulld %ymm1, %ymm0, %ymm0 # sched: [10:2.00]			; HASWELL-NEXT: vpmulld %ymm1, %ymm0, %ymm0 # sched: [10:2.00]
	; HASWELL-NEXT: vpmulld (%rdi), %ymm0, %ymm0 # sched: [10:2.00]			; HASWELL-NEXT: vpmulld (%rdi), %ymm0, %ymm0 # sched: [10:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_pmulld:			; ZNVER1-LABEL: test_pmulld:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: vpmulld %ymm1, %ymm0, %ymm0 # sched: [4:1.00]			; ZNVER1-NEXT: vpmulld %ymm1, %ymm0, %ymm0 # sched: [4:1.00]
	; ZNVER1-NEXT: vpmulld (%rdi), %ymm0, %ymm0 # sched: [11:1.00]			; ZNVER1-NEXT: vpmulld (%rdi), %ymm0, %ymm0 # sched: [11:1.00]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = mul <8 x i32> %a0, %a1			%1 = mul <8 x i32> %a0, %a1
	%2 = load <8 x i32>, <8 x i32> *%a2, align 32			%2 = load <8 x i32>, <8 x i32> *%a2, align 32
	%3 = mul <8 x i32> %1, %2			%3 = mul <8 x i32> %1, %2
	ret <8 x i32> %3			ret <8 x i32> %3
	}			}

	define <16 x i16> @test_pmullw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {			define <16 x i16> @test_pmullw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
	; GENERIC-LABEL: test_pmullw:			; GENERIC-LABEL: test_pmullw:
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: vpmullw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]			; GENERIC-NEXT: vpmullw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
	; GENERIC-NEXT: vpmullw (%rdi), %ymm0, %ymm0 # sched: [9:1.00]			; GENERIC-NEXT: vpmullw (%rdi), %ymm0, %ymm0 # sched: [9:1.00]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmullw:			; HASWELL-LABEL: test_pmullw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmullw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]			; HASWELL-NEXT: vpmullw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
	; HASWELL-NEXT: vpmullw (%rdi), %ymm0, %ymm0 # sched: [9:1.00]			; HASWELL-NEXT: vpmullw (%rdi), %ymm0, %ymm0 # sched: [5:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_pmullw:			; ZNVER1-LABEL: test_pmullw:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: vpmullw %ymm1, %ymm0, %ymm0 # sched: [4:1.00]			; ZNVER1-NEXT: vpmullw %ymm1, %ymm0, %ymm0 # sched: [4:1.00]
	; ZNVER1-NEXT: vpmullw (%rdi), %ymm0, %ymm0 # sched: [11:1.00]			; ZNVER1-NEXT: vpmullw (%rdi), %ymm0, %ymm0 # sched: [11:1.00]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = mul <16 x i16> %a0, %a1			%1 = mul <16 x i16> %a0, %a1
	%2 = load <16 x i16>, <16 x i16> *%a2, align 32			%2 = load <16 x i16>, <16 x i16> *%a2, align 32
	%3 = mul <16 x i16> %1, %2			%3 = mul <16 x i16> %1, %2
	ret <16 x i16> %3			ret <16 x i16> %3
	}			}

	define <4 x i64> @test_por(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {			define <4 x i64> @test_por(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {
	; GENERIC-LABEL: test_por:			; GENERIC-LABEL: test_por:
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; GENERIC-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; GENERIC-NEXT: vpor (%rdi), %ymm0, %ymm0 # sched: [5:1.00]			; GENERIC-NEXT: vpor (%rdi), %ymm0, %ymm0 # sched: [5:1.00]
	; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_por:			; HASWELL-LABEL: test_por:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]			; HASWELL-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]
	; HASWELL-NEXT: vpor (%rdi), %ymm0, %ymm0 # sched: [5:0.50]			; HASWELL-NEXT: vpor (%rdi), %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_por:			; ZNVER1-LABEL: test_por:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: vpor (%rdi), %ymm0, %ymm0 # sched: [8:0.50]			; ZNVER1-NEXT: vpor (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
	; ZNVER1-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = or <4 x i64> %a0, %a1			%1 = or <4 x i64> %a0, %a1
	%2 = load <4 x i64>, <4 x i64> *%a2, align 32			%2 = load <4 x i64>, <4 x i64> *%a2, align 32
	%3 = or <4 x i64> %1, %2			%3 = or <4 x i64> %1, %2
	%4 = add <4 x i64> %3, %a1			%4 = add <4 x i64> %3, %a1
	ret <4 x i64> %4			ret <4 x i64> %4
	}			}

	define <32 x i8> @test_psubb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {			define <32 x i8> @test_psubb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
	; GENERIC-LABEL: test_psubb:			; GENERIC-LABEL: test_psubb:
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: vpsubb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; GENERIC-NEXT: vpsubb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; GENERIC-NEXT: vpsubb (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; GENERIC-NEXT: vpsubb (%rdi), %ymm0, %ymm0 # sched: [7:1.00]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psubb:			; HASWELL-LABEL: test_psubb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsubb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; HASWELL-NEXT: vpsubb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpsubb (%rdi), %ymm0, %ymm0 # sched: [5:0.50]			; HASWELL-NEXT: vpsubb (%rdi), %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_psubb:			; ZNVER1-LABEL: test_psubb:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: vpsubb %ymm1, %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpsubb %ymm1, %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: vpsubb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]			; ZNVER1-NEXT: vpsubb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = sub <32 x i8> %a0, %a1			%1 = sub <32 x i8> %a0, %a1
	%2 = load <32 x i8>, <32 x i8> *%a2, align 32			%2 = load <32 x i8>, <32 x i8> *%a2, align 32
	%3 = sub <32 x i8> %1, %2			%3 = sub <32 x i8> %1, %2
	ret <32 x i8> %3			ret <32 x i8> %3
	}			}

	define <8 x i32> @test_psubd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {			define <8 x i32> @test_psubd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
	; GENERIC-LABEL: test_psubd:			; GENERIC-LABEL: test_psubd:
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: vpsubd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; GENERIC-NEXT: vpsubd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; GENERIC-NEXT: vpsubd (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; GENERIC-NEXT: vpsubd (%rdi), %ymm0, %ymm0 # sched: [7:1.00]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psubd:			; HASWELL-LABEL: test_psubd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsubd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; HASWELL-NEXT: vpsubd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpsubd (%rdi), %ymm0, %ymm0 # sched: [5:0.50]			; HASWELL-NEXT: vpsubd (%rdi), %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_psubd:			; ZNVER1-LABEL: test_psubd:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: vpsubd %ymm1, %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpsubd %ymm1, %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: vpsubd (%rdi), %ymm0, %ymm0 # sched: [8:0.50]			; ZNVER1-NEXT: vpsubd (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = sub <8 x i32> %a0, %a1			%1 = sub <8 x i32> %a0, %a1
	%2 = load <8 x i32>, <8 x i32> *%a2, align 32			%2 = load <8 x i32>, <8 x i32> *%a2, align 32
	%3 = sub <8 x i32> %1, %2			%3 = sub <8 x i32> %1, %2
	ret <8 x i32> %3			ret <8 x i32> %3
	}			}

	define <4 x i64> @test_psubq(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {			define <4 x i64> @test_psubq(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {
	; GENERIC-LABEL: test_psubq:			; GENERIC-LABEL: test_psubq:
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: vpsubq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; GENERIC-NEXT: vpsubq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; GENERIC-NEXT: vpsubq (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; GENERIC-NEXT: vpsubq (%rdi), %ymm0, %ymm0 # sched: [7:1.00]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psubq:			; HASWELL-LABEL: test_psubq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsubq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; HASWELL-NEXT: vpsubq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpsubq (%rdi), %ymm0, %ymm0 # sched: [5:0.50]			; HASWELL-NEXT: vpsubq (%rdi), %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_psubq:			; ZNVER1-LABEL: test_psubq:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: vpsubq %ymm1, %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpsubq %ymm1, %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: vpsubq (%rdi), %ymm0, %ymm0 # sched: [8:0.50]			; ZNVER1-NEXT: vpsubq (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = sub <4 x i64> %a0, %a1			%1 = sub <4 x i64> %a0, %a1
	%2 = load <4 x i64>, <4 x i64> *%a2, align 32			%2 = load <4 x i64>, <4 x i64> *%a2, align 32
	%3 = sub <4 x i64> %1, %2			%3 = sub <4 x i64> %1, %2
	ret <4 x i64> %3			ret <4 x i64> %3
	}			}

	define <16 x i16> @test_psubw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {			define <16 x i16> @test_psubw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
	; GENERIC-LABEL: test_psubw:			; GENERIC-LABEL: test_psubw:
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: vpsubw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; GENERIC-NEXT: vpsubw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; GENERIC-NEXT: vpsubw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]			; GENERIC-NEXT: vpsubw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psubw:			; HASWELL-LABEL: test_psubw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsubw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; HASWELL-NEXT: vpsubw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpsubw (%rdi), %ymm0, %ymm0 # sched: [5:0.50]			; HASWELL-NEXT: vpsubw (%rdi), %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_psubw:			; ZNVER1-LABEL: test_psubw:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: vpsubw %ymm1, %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpsubw %ymm1, %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: vpsubw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]			; ZNVER1-NEXT: vpsubw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = sub <16 x i16> %a0, %a1			%1 = sub <16 x i16> %a0, %a1
	%2 = load <16 x i16>, <16 x i16> *%a2, align 32			%2 = load <16 x i16>, <16 x i16> *%a2, align 32
	%3 = sub <16 x i16> %1, %2			%3 = sub <16 x i16> %1, %2
	ret <16 x i16> %3			ret <16 x i16> %3
	}			}

	define <4 x i64> @test_pxor(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {			define <4 x i64> @test_pxor(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {
	; GENERIC-LABEL: test_pxor:			; GENERIC-LABEL: test_pxor:
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: vpxor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]			; GENERIC-NEXT: vpxor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
	; GENERIC-NEXT: vpxor (%rdi), %ymm0, %ymm0 # sched: [5:1.00]			; GENERIC-NEXT: vpxor (%rdi), %ymm0, %ymm0 # sched: [5:1.00]
	; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]			; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pxor:			; HASWELL-LABEL: test_pxor:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpxor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]			; HASWELL-NEXT: vpxor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]
	; HASWELL-NEXT: vpxor (%rdi), %ymm0, %ymm0 # sched: [5:0.50]			; HASWELL-NEXT: vpxor (%rdi), %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_pxor:			; ZNVER1-LABEL: test_pxor:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: vpxor %ymm1, %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpxor %ymm1, %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: vpxor (%rdi), %ymm0, %ymm0 # sched: [8:0.50]			; ZNVER1-NEXT: vpxor (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
	; ZNVER1-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.25]			; ZNVER1-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.25]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = xor <4 x i64> %a0, %a1			%1 = xor <4 x i64> %a0, %a1
	%2 = load <4 x i64>, <4 x i64> *%a2, align 32			%2 = load <4 x i64>, <4 x i64> *%a2, align 32
	%3 = xor <4 x i64> %1, %2			%3 = xor <4 x i64> %1, %2
	%4 = add <4 x i64> %3, %a1			%4 = add <4 x i64> %3, %a1
	ret <4 x i64> %4			ret <4 x i64> %4
	}			}

	!0 = !{i32 1}			!0 = !{i32 1}

test/CodeGen/X86/avx512-cmp.ll

Show First 20 Lines • Show All 120 Lines • ▼ Show 20 Lines	entry:
%0 = fcmp one double %x, %y		%0 = fcmp one double %x, %y
%or = zext i1 %0 to i32		%or = zext i1 %0 to i32
ret i32 %or		ret i32 %or
}		}

define i32 @test8(i32 %a1, i32 %a2, i32 %a3) {		define i32 @test8(i32 %a1, i32 %a2, i32 %a3) {
; ALL-LABEL: test8:		; ALL-LABEL: test8:
; ALL: ## BB#0:		; ALL: ## BB#0:
; ALL-NEXT: notl %edi
; ALL-NEXT: xorl $-2147483648, %esi ## imm = 0x80000000		; ALL-NEXT: xorl $-2147483648, %esi ## imm = 0x80000000
; ALL-NEXT: testl %edx, %edx		; ALL-NEXT: testl %edx, %edx
; ALL-NEXT: movl $1, %eax		; ALL-NEXT: movl $1, %eax
; ALL-NEXT: cmovel %eax, %edx		; ALL-NEXT: cmovel %eax, %edx
		; ALL-NEXT: notl %edi
; ALL-NEXT: orl %edi, %esi		; ALL-NEXT: orl %edi, %esi
; ALL-NEXT: cmovnel %edx, %eax		; ALL-NEXT: cmovnel %edx, %eax
; ALL-NEXT: retq		; ALL-NEXT: retq
%tmp1 = icmp eq i32 %a1, -1		%tmp1 = icmp eq i32 %a1, -1
%tmp2 = icmp eq i32 %a2, -2147483648		%tmp2 = icmp eq i32 %a2, -2147483648
%tmp3 = and i1 %tmp1, %tmp2		%tmp3 = and i1 %tmp1, %tmp2
%tmp4 = icmp eq i32 %a3, 0		%tmp4 = icmp eq i32 %a3, 0
%tmp5 = or i1 %tmp3, %tmp4		%tmp5 = or i1 %tmp3, %tmp4
▲ Show 20 Lines • Show All 53 Lines • Show Last 20 Lines

test/CodeGen/X86/avx512-cvt.ll

	Show First 20 Lines • Show All 1,539 Lines • ▼ Show 20 Lines
	; VL-NEXT: vcvtudq2pd %xmm0, %ymm0			; VL-NEXT: vcvtudq2pd %xmm0, %ymm0
	; VL-NEXT: retq			; VL-NEXT: retq
	%mask = icmp slt <4 x i32> %a, zeroinitializer			%mask = icmp slt <4 x i32> %a, zeroinitializer
	%1 = uitofp <4 x i1> %mask to <4 x double>			%1 = uitofp <4 x i1> %mask to <4 x double>
	ret <4 x double> %1			ret <4 x double> %1
	}			}

	define <2 x float> @uitofp_2i1_float(<2 x i32> %a) {			define <2 x float> @uitofp_2i1_float(<2 x i32> %a) {
	; NOVL-LABEL: uitofp_2i1_float:			; KNL-LABEL: uitofp_2i1_float:
	; NOVL: # BB#0:			; KNL: # BB#0:
	; NOVL-NEXT: vpxor %xmm1, %xmm1, %xmm1			; KNL-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; NOVL-NEXT: vpblendd {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]			; KNL-NEXT: vpblendd {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
	; NOVL-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; KNL-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NOVL-NEXT: vpextrb $8, %xmm0, %eax			; KNL-NEXT: vpextrb $8, %xmm0, %eax
	; NOVL-NEXT: andl $1, %eax			; KNL-NEXT: andl $1, %eax
	; NOVL-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm1			; KNL-NEXT: vpextrb $0, %xmm0, %ecx
	; NOVL-NEXT: vpextrb $0, %xmm0, %eax			; KNL-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm0
	; NOVL-NEXT: andl $1, %eax			; KNL-NEXT: andl $1, %ecx
	; NOVL-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm0			; KNL-NEXT: vcvtsi2ssl %ecx, %xmm2, %xmm1
	; NOVL-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[2,3]			; KNL-NEXT: vinsertps {{.*#+}} xmm0 = xmm1[0],xmm0[0],xmm1[2,3]
	; NOVL-NEXT: retq			; KNL-NEXT: retq
	;			;
	; VL-LABEL: uitofp_2i1_float:			; VL-LABEL: uitofp_2i1_float:
	; VL: # BB#0:			; VL: # BB#0:
	; VL-NEXT: vpxor %xmm1, %xmm1, %xmm1			; VL-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; VL-NEXT: vpblendd {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]			; VL-NEXT: vpblendd {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
	; VL-NEXT: vpcmpltuq %xmm1, %xmm0, %k1			; VL-NEXT: vpcmpltuq %xmm1, %xmm0, %k1
	; VL-NEXT: vpbroadcastd {{.*}}(%rip), %xmm0 {%k1} {z}			; VL-NEXT: vpbroadcastd {{.*}}(%rip), %xmm0 {%k1} {z}
	; VL-NEXT: vcvtudq2ps %xmm0, %xmm0			; VL-NEXT: vcvtudq2ps %xmm0, %xmm0
	; VL-NEXT: retq			; VL-NEXT: retq
				;
				; AVX512DQ-LABEL: uitofp_2i1_float:
				; AVX512DQ: # BB#0:
				; AVX512DQ-NEXT: vpxor %xmm1, %xmm1, %xmm1
				; AVX512DQ-NEXT: vpblendd {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
				; AVX512DQ-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
				; AVX512DQ-NEXT: vpextrb $8, %xmm0, %eax
				; AVX512DQ-NEXT: andl $1, %eax
				; AVX512DQ-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm1
				; AVX512DQ-NEXT: vpextrb $0, %xmm0, %eax
				; AVX512DQ-NEXT: andl $1, %eax
				; AVX512DQ-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm0
				; AVX512DQ-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[2,3]
				; AVX512DQ-NEXT: retq
				;
				; AVX512BW-LABEL: uitofp_2i1_float:
				; AVX512BW: # BB#0:
				; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1
				; AVX512BW-NEXT: vpblendd {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
				; AVX512BW-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
				; AVX512BW-NEXT: vpextrb $8, %xmm0, %eax
				; AVX512BW-NEXT: andl $1, %eax
				; AVX512BW-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm1
				; AVX512BW-NEXT: vpextrb $0, %xmm0, %eax
				; AVX512BW-NEXT: andl $1, %eax
				; AVX512BW-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm0
				; AVX512BW-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[2,3]
				; AVX512BW-NEXT: retq
	%mask = icmp ult <2 x i32> %a, zeroinitializer			%mask = icmp ult <2 x i32> %a, zeroinitializer
	%1 = uitofp <2 x i1> %mask to <2 x float>			%1 = uitofp <2 x i1> %mask to <2 x float>
	ret <2 x float> %1			ret <2 x float> %1
	}			}

	define <2 x double> @uitofp_2i1_double(<2 x i32> %a) {			define <2 x double> @uitofp_2i1_double(<2 x i32> %a) {
	; NOVL-LABEL: uitofp_2i1_double:			; NOVL-LABEL: uitofp_2i1_double:
	; NOVL: # BB#0:			; NOVL: # BB#0:
	Show All 31 Lines

test/CodeGen/X86/avx512-ext.ll

Show First 20 Lines • Show All 42 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq
%ret = select <8 x i1> %mask, <8 x i16> %x, <8 x i16> zeroinitializer		%ret = select <8 x i1> %mask, <8 x i16> %x, <8 x i16> zeroinitializer
ret <8 x i16> %ret		ret <8 x i16> %ret
}		}


define <16 x i16> @zext_16x8mem_to_16x16(<16 x i8> *%i , <16 x i1> %mask) nounwind readnone {		define <16 x i16> @zext_16x8mem_to_16x16(<16 x i8> *%i , <16 x i1> %mask) nounwind readnone {
; KNL-LABEL: zext_16x8mem_to_16x16:		; KNL-LABEL: zext_16x8mem_to_16x16:
; KNL: # BB#0:		; KNL: # BB#0:
; KNL-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero
; KNL-NEXT: vpmovzxbw {{.*#+}} ymm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero,mem[8],zero,mem[9],zero,mem[10],zero,mem[11],zero,mem[12],zero,mem[13],zero,mem[14],zero,mem[15],zero		; KNL-NEXT: vpmovzxbw {{.*#+}} ymm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero,mem[8],zero,mem[9],zero,mem[10],zero,mem[11],zero,mem[12],zero,mem[13],zero,mem[14],zero,mem[15],zero
		; KNL-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero
; KNL-NEXT: vpsllw $15, %ymm0, %ymm0		; KNL-NEXT: vpsllw $15, %ymm0, %ymm0
; KNL-NEXT: vpsraw $15, %ymm0, %ymm0		; KNL-NEXT: vpsraw $15, %ymm0, %ymm0
; KNL-NEXT: vpand %ymm1, %ymm0, %ymm0		; KNL-NEXT: vpand %ymm1, %ymm0, %ymm0
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: zext_16x8mem_to_16x16:		; SKX-LABEL: zext_16x8mem_to_16x16:
; SKX: # BB#0:		; SKX: # BB#0:
; SKX-NEXT: vpsllw $7, %xmm0, %xmm0		; SKX-NEXT: vpsllw $7, %xmm0, %xmm0
; SKX-NEXT: vpmovb2m %xmm0, %k1		; SKX-NEXT: vpmovb2m %xmm0, %k1
; SKX-NEXT: vpmovzxbw {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero,mem[8],zero,mem[9],zero,mem[10],zero,mem[11],zero,mem[12],zero,mem[13],zero,mem[14],zero,mem[15],zero		; SKX-NEXT: vpmovzxbw {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero,mem[8],zero,mem[9],zero,mem[10],zero,mem[11],zero,mem[12],zero,mem[13],zero,mem[14],zero,mem[15],zero
; SKX-NEXT: retq		; SKX-NEXT: retq
%a = load <16 x i8>,<16 x i8> *%i,align 1		%a = load <16 x i8>,<16 x i8> *%i,align 1
%x = zext <16 x i8> %a to <16 x i16>		%x = zext <16 x i8> %a to <16 x i16>
%ret = select <16 x i1> %mask, <16 x i16> %x, <16 x i16> zeroinitializer		%ret = select <16 x i1> %mask, <16 x i16> %x, <16 x i16> zeroinitializer
ret <16 x i16> %ret		ret <16 x i16> %ret
}		}

define <16 x i16> @sext_16x8mem_to_16x16(<16 x i8> *%i , <16 x i1> %mask) nounwind readnone {		define <16 x i16> @sext_16x8mem_to_16x16(<16 x i8> *%i , <16 x i1> %mask) nounwind readnone {
; KNL-LABEL: sext_16x8mem_to_16x16:		; KNL-LABEL: sext_16x8mem_to_16x16:
; KNL: # BB#0:		; KNL: # BB#0:
; KNL-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero
; KNL-NEXT: vpmovsxbw (%rdi), %ymm1		; KNL-NEXT: vpmovsxbw (%rdi), %ymm1
		; KNL-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero
; KNL-NEXT: vpsllw $15, %ymm0, %ymm0		; KNL-NEXT: vpsllw $15, %ymm0, %ymm0
; KNL-NEXT: vpsraw $15, %ymm0, %ymm0		; KNL-NEXT: vpsraw $15, %ymm0, %ymm0
; KNL-NEXT: vpand %ymm1, %ymm0, %ymm0		; KNL-NEXT: vpand %ymm1, %ymm0, %ymm0
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: sext_16x8mem_to_16x16:		; SKX-LABEL: sext_16x8mem_to_16x16:
; SKX: # BB#0:		; SKX: # BB#0:
; SKX-NEXT: vpsllw $7, %xmm0, %xmm0		; SKX-NEXT: vpsllw $7, %xmm0, %xmm0
▲ Show 20 Lines • Show All 1,705 Lines • Show Last 20 Lines

test/CodeGen/X86/avx512-insert-extract.ll

Show First 20 Lines • Show All 968 Lines • ▼ Show 20 Lines
; KNL-NEXT: .cfi_def_cfa_offset 16		; KNL-NEXT: .cfi_def_cfa_offset 16
; KNL-NEXT: Lcfi1:		; KNL-NEXT: Lcfi1:
; KNL-NEXT: .cfi_offset %rbp, -16		; KNL-NEXT: .cfi_offset %rbp, -16
; KNL-NEXT: movq %rsp, %rbp		; KNL-NEXT: movq %rsp, %rbp
; KNL-NEXT: Lcfi2:		; KNL-NEXT: Lcfi2:
; KNL-NEXT: .cfi_def_cfa_register %rbp		; KNL-NEXT: .cfi_def_cfa_register %rbp
; KNL-NEXT: andq $-32, %rsp		; KNL-NEXT: andq $-32, %rsp
; KNL-NEXT: subq $32, %rsp		; KNL-NEXT: subq $32, %rsp
; KNL-NEXT: xorl %eax, %eax
; KNL-NEXT: cmpl %esi, %edi
; KNL-NEXT: setb %al
; KNL-NEXT: vpcmpltud %zmm3, %zmm1, %k0		; KNL-NEXT: vpcmpltud %zmm3, %zmm1, %k0
; KNL-NEXT: kshiftlw $14, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ecx
; KNL-NEXT: kshiftlw $15, %k0, %k1		; KNL-NEXT: kshiftlw $15, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %edx		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vmovd %edx, %xmm1		; KNL-NEXT: kshiftlw $14, %k0, %k1
; KNL-NEXT: vpinsrb $1, %ecx, %xmm1, %xmm1		; KNL-NEXT: kshiftrw $15, %k1, %k1
		; KNL-NEXT: vmovd %eax, %xmm1
		; KNL-NEXT: kmovw %k1, %eax
		; KNL-NEXT: vpinsrb $1, %eax, %xmm1, %xmm1
; KNL-NEXT: kshiftlw $13, %k0, %k1		; KNL-NEXT: kshiftlw $13, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ecx		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $2, %ecx, %xmm1, %xmm1		; KNL-NEXT: vpinsrb $2, %eax, %xmm1, %xmm1
; KNL-NEXT: kshiftlw $12, %k0, %k1		; KNL-NEXT: kshiftlw $12, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ecx		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $3, %ecx, %xmm1, %xmm1		; KNL-NEXT: vpinsrb $3, %eax, %xmm1, %xmm1
; KNL-NEXT: kshiftlw $11, %k0, %k1		; KNL-NEXT: kshiftlw $11, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ecx		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $4, %ecx, %xmm1, %xmm1		; KNL-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
; KNL-NEXT: kshiftlw $10, %k0, %k1		; KNL-NEXT: kshiftlw $10, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ecx		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $5, %ecx, %xmm1, %xmm1		; KNL-NEXT: vpinsrb $5, %eax, %xmm1, %xmm1
; KNL-NEXT: kshiftlw $9, %k0, %k1		; KNL-NEXT: kshiftlw $9, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ecx		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $6, %ecx, %xmm1, %xmm1		; KNL-NEXT: vpinsrb $6, %eax, %xmm1, %xmm1
; KNL-NEXT: kshiftlw $8, %k0, %k1		; KNL-NEXT: kshiftlw $8, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ecx		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $7, %ecx, %xmm1, %xmm1		; KNL-NEXT: vpinsrb $7, %eax, %xmm1, %xmm1
; KNL-NEXT: kshiftlw $7, %k0, %k1		; KNL-NEXT: kshiftlw $7, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ecx		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $8, %ecx, %xmm1, %xmm1		; KNL-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
; KNL-NEXT: kshiftlw $6, %k0, %k1		; KNL-NEXT: kshiftlw $6, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ecx		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $9, %ecx, %xmm1, %xmm1		; KNL-NEXT: vpinsrb $9, %eax, %xmm1, %xmm1
; KNL-NEXT: kshiftlw $5, %k0, %k1		; KNL-NEXT: kshiftlw $5, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ecx		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $10, %ecx, %xmm1, %xmm1		; KNL-NEXT: vpinsrb $10, %eax, %xmm1, %xmm1
; KNL-NEXT: kshiftlw $4, %k0, %k1		; KNL-NEXT: kshiftlw $4, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ecx		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $11, %ecx, %xmm1, %xmm1		; KNL-NEXT: vpinsrb $11, %eax, %xmm1, %xmm1
; KNL-NEXT: kshiftlw $3, %k0, %k1		; KNL-NEXT: kshiftlw $3, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ecx		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $12, %ecx, %xmm1, %xmm1		; KNL-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
; KNL-NEXT: kshiftlw $2, %k0, %k1		; KNL-NEXT: kshiftlw $2, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ecx		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $13, %ecx, %xmm1, %xmm1		; KNL-NEXT: vpinsrb $13, %eax, %xmm1, %xmm1
; KNL-NEXT: kshiftlw $1, %k0, %k1		; KNL-NEXT: kshiftlw $1, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ecx		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $14, %ecx, %xmm1, %xmm1		; KNL-NEXT: vpinsrb $14, %eax, %xmm1, %xmm1
		; KNL-NEXT: xorl %eax, %eax
		; KNL-NEXT: cmpl %esi, %edi
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %ecx		; KNL-NEXT: kmovw %k0, %ecx
; KNL-NEXT: vpinsrb $15, %ecx, %xmm1, %xmm1		; KNL-NEXT: vpinsrb $15, %ecx, %xmm1, %xmm1
		; KNL-NEXT: setb %al
; KNL-NEXT: vpcmpltud %zmm2, %zmm0, %k0		; KNL-NEXT: vpcmpltud %zmm2, %zmm0, %k0
; KNL-NEXT: kshiftlw $14, %k0, %k1		; KNL-NEXT: kshiftlw $14, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ecx		; KNL-NEXT: kmovw %k1, %ecx
; KNL-NEXT: kshiftlw $15, %k0, %k1		; KNL-NEXT: kshiftlw $15, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %edx		; KNL-NEXT: kmovw %k1, %edx
; KNL-NEXT: vmovd %edx, %xmm0		; KNL-NEXT: vmovd %edx, %xmm0
▲ Show 20 Lines • Show All 102 Lines • ▼ Show 20 Lines
; KNL-NEXT: cmpl %esi, %edi		; KNL-NEXT: cmpl %esi, %edi
; KNL-NEXT: setb %al		; KNL-NEXT: setb %al
; KNL-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]		; KNL-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]
; KNL-NEXT: vpxor %xmm2, %xmm0, %xmm0		; KNL-NEXT: vpxor %xmm2, %xmm0, %xmm0
; KNL-NEXT: vpxor %xmm2, %xmm1, %xmm1		; KNL-NEXT: vpxor %xmm2, %xmm1, %xmm1
; KNL-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0		; KNL-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
; KNL-NEXT: vpextrb $4, %xmm0, %ecx		; KNL-NEXT: vpextrb $4, %xmm0, %ecx
; KNL-NEXT: kmovw %ecx, %k1		; KNL-NEXT: kmovw %ecx, %k1
; KNL-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
; KNL-NEXT: vpextrb $0, %xmm0, %ecx		; KNL-NEXT: vpextrb $0, %xmm0, %ecx
		; KNL-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
; KNL-NEXT: kmovw %ecx, %k1		; KNL-NEXT: kmovw %ecx, %k1
; KNL-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}		; KNL-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
; KNL-NEXT: vmovdqa64 {{.*#+}} zmm3 = [0,8,2,3,4,5,6,7]		; KNL-NEXT: vmovdqa64 {{.*#+}} zmm3 = [0,8,2,3,4,5,6,7]
; KNL-NEXT: vpermi2q %zmm1, %zmm2, %zmm3		; KNL-NEXT: vpermi2q %zmm1, %zmm2, %zmm3
; KNL-NEXT: vpsllq $63, %zmm3, %zmm1		; KNL-NEXT: vpsllq $63, %zmm3, %zmm1
; KNL-NEXT: vptestmq %zmm1, %zmm1, %k1		; KNL-NEXT: vptestmq %zmm1, %zmm1, %k1
; KNL-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}		; KNL-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
; KNL-NEXT: kmovw %eax, %k1		; KNL-NEXT: kmovw %eax, %k1
▲ Show 20 Lines • Show All 765 Lines • ▼ Show 20 Lines
; SKX-NEXT: popq %rbp		; SKX-NEXT: popq %rbp
; SKX-NEXT: vzeroupper		; SKX-NEXT: vzeroupper
; SKX-NEXT: retq		; SKX-NEXT: retq
%t2 = extractelement <32 x i16> %t1, i32 %index		%t2 = extractelement <32 x i16> %t1, i32 %index
ret i16 %t2		ret i16 %t2
}		}

define i8 @test_extractelement_variable_v16i8(<16 x i8> %t1, i32 %index) {		define i8 @test_extractelement_variable_v16i8(<16 x i8> %t1, i32 %index) {
; CHECK-LABEL: test_extractelement_variable_v16i8:		; KNL-LABEL: test_extractelement_variable_v16i8:
; CHECK: ## BB#0:		; KNL: ## BB#0:
; CHECK-NEXT: ## kill: %EDI<def> %EDI<kill> %RDI<def>		; KNL-NEXT: vmovaps %xmm0, -{{[0-9]+}}(%rsp)
; CHECK-NEXT: vmovaps %xmm0, -{{[0-9]+}}(%rsp)		; KNL-NEXT: ## kill: %EDI<def> %EDI<kill> %RDI<def>
; CHECK-NEXT: andl $15, %edi		; KNL-NEXT: andl $15, %edi
; CHECK-NEXT: leaq -{{[0-9]+}}(%rsp), %rax		; KNL-NEXT: leaq -{{[0-9]+}}(%rsp), %rax
; CHECK-NEXT: movb (%rdi,%rax), %al		; KNL-NEXT: movb (%rdi,%rax), %al
; CHECK-NEXT: retq		; KNL-NEXT: retq
		;
		; SKX-LABEL: test_extractelement_variable_v16i8:
		; SKX: ## BB#0:
		; SKX-NEXT: ## kill: %EDI<def> %EDI<kill> %RDI<def>
		; SKX-NEXT: vmovaps %xmm0, -{{[0-9]+}}(%rsp)
		; SKX-NEXT: andl $15, %edi
		; SKX-NEXT: leaq -{{[0-9]+}}(%rsp), %rax
		; SKX-NEXT: movb (%rdi,%rax), %al
		; SKX-NEXT: retq
%t2 = extractelement <16 x i8> %t1, i32 %index		%t2 = extractelement <16 x i8> %t1, i32 %index
ret i8 %t2		ret i8 %t2
}		}

define i8 @test_extractelement_variable_v32i8(<32 x i8> %t1, i32 %index) {		define i8 @test_extractelement_variable_v32i8(<32 x i8> %t1, i32 %index) {
; KNL-LABEL: test_extractelement_variable_v32i8:		; KNL-LABEL: test_extractelement_variable_v32i8:
; KNL: ## BB#0:		; KNL: ## BB#0:
; KNL-NEXT: pushq %rbp		; KNL-NEXT: pushq %rbp
; KNL-NEXT: Lcfi33:		; KNL-NEXT: Lcfi33:
; KNL-NEXT: .cfi_def_cfa_offset 16		; KNL-NEXT: .cfi_def_cfa_offset 16
; KNL-NEXT: Lcfi34:		; KNL-NEXT: Lcfi34:
; KNL-NEXT: .cfi_offset %rbp, -16		; KNL-NEXT: .cfi_offset %rbp, -16
; KNL-NEXT: movq %rsp, %rbp		; KNL-NEXT: movq %rsp, %rbp
; KNL-NEXT: Lcfi35:		; KNL-NEXT: Lcfi35:
; KNL-NEXT: .cfi_def_cfa_register %rbp		; KNL-NEXT: .cfi_def_cfa_register %rbp
; KNL-NEXT: andq $-32, %rsp		; KNL-NEXT: andq $-32, %rsp
; KNL-NEXT: subq $64, %rsp		; KNL-NEXT: subq $64, %rsp
; KNL-NEXT: ## kill: %EDI<def> %EDI<kill> %RDI<def>
; KNL-NEXT: vmovaps %ymm0, (%rsp)		; KNL-NEXT: vmovaps %ymm0, (%rsp)
		; KNL-NEXT: ## kill: %EDI<def> %EDI<kill> %RDI<def>
; KNL-NEXT: andl $31, %edi		; KNL-NEXT: andl $31, %edi
; KNL-NEXT: movq %rsp, %rax		; KNL-NEXT: movq %rsp, %rax
; KNL-NEXT: movb (%rdi,%rax), %al		; KNL-NEXT: movb (%rdi,%rax), %al
; KNL-NEXT: movq %rbp, %rsp		; KNL-NEXT: movq %rbp, %rsp
; KNL-NEXT: popq %rbp		; KNL-NEXT: popq %rbp
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_extractelement_variable_v32i8:		; SKX-LABEL: test_extractelement_variable_v32i8:
Show All 30 Lines
; KNL-NEXT: .cfi_def_cfa_offset 16		; KNL-NEXT: .cfi_def_cfa_offset 16
; KNL-NEXT: Lcfi37:		; KNL-NEXT: Lcfi37:
; KNL-NEXT: .cfi_offset %rbp, -16		; KNL-NEXT: .cfi_offset %rbp, -16
; KNL-NEXT: movq %rsp, %rbp		; KNL-NEXT: movq %rsp, %rbp
; KNL-NEXT: Lcfi38:		; KNL-NEXT: Lcfi38:
; KNL-NEXT: .cfi_def_cfa_register %rbp		; KNL-NEXT: .cfi_def_cfa_register %rbp
; KNL-NEXT: andq $-64, %rsp		; KNL-NEXT: andq $-64, %rsp
; KNL-NEXT: subq $128, %rsp		; KNL-NEXT: subq $128, %rsp
; KNL-NEXT: ## kill: %EDI<def> %EDI<kill> %RDI<def>
; KNL-NEXT: vmovaps %ymm1, {{[0-9]+}}(%rsp)		; KNL-NEXT: vmovaps %ymm1, {{[0-9]+}}(%rsp)
; KNL-NEXT: vmovaps %ymm0, (%rsp)		; KNL-NEXT: vmovaps %ymm0, (%rsp)
		; KNL-NEXT: ## kill: %EDI<def> %EDI<kill> %RDI<def>
; KNL-NEXT: andl $63, %edi		; KNL-NEXT: andl $63, %edi
; KNL-NEXT: movq %rsp, %rax		; KNL-NEXT: movq %rsp, %rax
; KNL-NEXT: movb (%rdi,%rax), %al		; KNL-NEXT: movb (%rdi,%rax), %al
; KNL-NEXT: movq %rbp, %rsp		; KNL-NEXT: movq %rbp, %rsp
; KNL-NEXT: popq %rbp		; KNL-NEXT: popq %rbp
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_extractelement_variable_v64i8:		; SKX-LABEL: test_extractelement_variable_v64i8:
▲ Show 20 Lines • Show All 72 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq
%i = add i8 %index, %index		%i = add i8 %index, %index
%t2 = extractelement <64 x i8> %t1, i8 %i		%t2 = extractelement <64 x i8> %t1, i8 %i
ret i8 %t2		ret i8 %t2
}		}

define zeroext i8 @test_extractelement_varible_v2i1(<2 x i64> %a, <2 x i64> %b, i32 %index) {		define zeroext i8 @test_extractelement_varible_v2i1(<2 x i64> %a, <2 x i64> %b, i32 %index) {
; KNL-LABEL: test_extractelement_varible_v2i1:		; KNL-LABEL: test_extractelement_varible_v2i1:
; KNL: ## BB#0:		; KNL: ## BB#0:
; KNL-NEXT: ## kill: %EDI<def> %EDI<kill> %RDI<def>
; KNL-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]		; KNL-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
; KNL-NEXT: vpxor %xmm2, %xmm1, %xmm1		; KNL-NEXT: vpxor %xmm2, %xmm1, %xmm1
; KNL-NEXT: vpxor %xmm2, %xmm0, %xmm0		; KNL-NEXT: vpxor %xmm2, %xmm0, %xmm0
; KNL-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0		; KNL-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
; KNL-NEXT: vmovdqa %xmm0, -{{[0-9]+}}(%rsp)		; KNL-NEXT: vmovdqa %xmm0, -{{[0-9]+}}(%rsp)
		; KNL-NEXT: ## kill: %EDI<def> %EDI<kill> %RDI<def>
; KNL-NEXT: andl $1, %edi		; KNL-NEXT: andl $1, %edi
; KNL-NEXT: movl -24(%rsp,%rdi,8), %eax		; KNL-NEXT: movl -24(%rsp,%rdi,8), %eax
; KNL-NEXT: andl $1, %eax		; KNL-NEXT: andl $1, %eax
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_extractelement_varible_v2i1:		; SKX-LABEL: test_extractelement_varible_v2i1:
; SKX: ## BB#0:		; SKX: ## BB#0:
; SKX-NEXT: ## kill: %EDI<def> %EDI<kill> %RDI<def>		; SKX-NEXT: ## kill: %EDI<def> %EDI<kill> %RDI<def>
; SKX-NEXT: vpcmpnleuq %xmm1, %xmm0, %k0		; SKX-NEXT: vpcmpnleuq %xmm1, %xmm0, %k0
; SKX-NEXT: vpmovm2q %k0, %xmm0		; SKX-NEXT: vpmovm2q %k0, %xmm0
; SKX-NEXT: vmovdqa %xmm0, -{{[0-9]+}}(%rsp)		; SKX-NEXT: vmovdqa %xmm0, -{{[0-9]+}}(%rsp)
; SKX-NEXT: andl $1, %edi		; SKX-NEXT: andl $1, %edi
; SKX-NEXT: movzbl -24(%rsp,%rdi,8), %eax		; SKX-NEXT: movzbl -24(%rsp,%rdi,8), %eax
; SKX-NEXT: andl $1, %eax		; SKX-NEXT: andl $1, %eax
; SKX-NEXT: retq		; SKX-NEXT: retq
%t1 = icmp ugt <2 x i64> %a, %b		%t1 = icmp ugt <2 x i64> %a, %b
%t2 = extractelement <2 x i1> %t1, i32 %index		%t2 = extractelement <2 x i1> %t1, i32 %index
%res = zext i1 %t2 to i8		%res = zext i1 %t2 to i8
ret i8 %res		ret i8 %res
}		}

define zeroext i8 @test_extractelement_varible_v4i1(<4 x i32> %a, <4 x i32> %b, i32 %index) {		define zeroext i8 @test_extractelement_varible_v4i1(<4 x i32> %a, <4 x i32> %b, i32 %index) {
; KNL-LABEL: test_extractelement_varible_v4i1:		; KNL-LABEL: test_extractelement_varible_v4i1:
; KNL: ## BB#0:		; KNL: ## BB#0:
; KNL-NEXT: ## kill: %EDI<def> %EDI<kill> %RDI<def>
; KNL-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]		; KNL-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]
; KNL-NEXT: vpxor %xmm2, %xmm1, %xmm1		; KNL-NEXT: vpxor %xmm2, %xmm1, %xmm1
; KNL-NEXT: vpxor %xmm2, %xmm0, %xmm0		; KNL-NEXT: vpxor %xmm2, %xmm0, %xmm0
; KNL-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0		; KNL-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0
; KNL-NEXT: vmovdqa %xmm0, -{{[0-9]+}}(%rsp)		; KNL-NEXT: vmovdqa %xmm0, -{{[0-9]+}}(%rsp)
		; KNL-NEXT: ## kill: %EDI<def> %EDI<kill> %RDI<def>
; KNL-NEXT: andl $3, %edi		; KNL-NEXT: andl $3, %edi
; KNL-NEXT: movl -24(%rsp,%rdi,4), %eax		; KNL-NEXT: movl -24(%rsp,%rdi,4), %eax
; KNL-NEXT: andl $1, %eax		; KNL-NEXT: andl $1, %eax
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_extractelement_varible_v4i1:		; SKX-LABEL: test_extractelement_varible_v4i1:
; SKX: ## BB#0:		; SKX: ## BB#0:
; SKX-NEXT: ## kill: %EDI<def> %EDI<kill> %RDI<def>		; SKX-NEXT: ## kill: %EDI<def> %EDI<kill> %RDI<def>
▲ Show 20 Lines • Show All 177 Lines • Show Last 20 Lines

test/CodeGen/X86/avx512-intrinsics-upgrade.ll

Show First 20 Lines • Show All 2,874 Lines • ▼ Show 20 Lines	; CHECK-NEXT: retq
ret < 8 x i64> %res		ret < 8 x i64> %res
}		}

declare <8 x i64> @llvm.x86.avx512.mask.pmulu.dq.512(<16 x i32>, <16 x i32>, <8 x i64>, i8)		declare <8 x i64> @llvm.x86.avx512.mask.pmulu.dq.512(<16 x i32>, <16 x i32>, <8 x i64>, i8)

define <4 x float> @test_mask_vextractf32x4(<4 x float> %b, <16 x float> %a, i8 %mask) {		define <4 x float> @test_mask_vextractf32x4(<4 x float> %b, <16 x float> %a, i8 %mask) {
; CHECK-LABEL: test_mask_vextractf32x4:		; CHECK-LABEL: test_mask_vextractf32x4:
; CHECK: ## BB#0:		; CHECK: ## BB#0:
; CHECK-NEXT: vextractf32x4 $2, %zmm1, %xmm1
; CHECK-NEXT: kmovw %edi, %k0		; CHECK-NEXT: kmovw %edi, %k0
; CHECK-NEXT: kshiftlw $12, %k0, %k1		; CHECK-NEXT: kshiftlw $12, %k0, %k1
; CHECK-NEXT: kshiftrw $15, %k1, %k1		; CHECK-NEXT: kshiftrw $15, %k1, %k1
; CHECK-NEXT: kshiftlw $13, %k0, %k2		; CHECK-NEXT: kshiftlw $13, %k0, %k2
; CHECK-NEXT: kshiftrw $15, %k2, %k2		; CHECK-NEXT: kshiftrw $15, %k2, %k2
; CHECK-NEXT: kshiftlw $15, %k0, %k3		; CHECK-NEXT: kshiftlw $15, %k0, %k3
; CHECK-NEXT: kshiftrw $15, %k3, %k3		; CHECK-NEXT: kshiftrw $15, %k3, %k3
; CHECK-NEXT: kshiftlw $14, %k0, %k0		; CHECK-NEXT: kshiftlw $14, %k0, %k0
; CHECK-NEXT: kshiftrw $15, %k0, %k0		; CHECK-NEXT: kshiftrw $15, %k0, %k0
; CHECK-NEXT: kmovw %k0, %eax		; CHECK-NEXT: kmovw %k0, %eax
; CHECK-NEXT: kmovw %k3, %ecx		; CHECK-NEXT: kmovw %k3, %ecx
; CHECK-NEXT: vmovd %ecx, %xmm2		; CHECK-NEXT: vmovd %ecx, %xmm2
; CHECK-NEXT: vpinsrb $4, %eax, %xmm2, %xmm2		; CHECK-NEXT: vpinsrb $4, %eax, %xmm2, %xmm2
; CHECK-NEXT: kmovw %k2, %eax		; CHECK-NEXT: kmovw %k2, %eax
; CHECK-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2		; CHECK-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
; CHECK-NEXT: kmovw %k1, %eax		; CHECK-NEXT: kmovw %k1, %eax
; CHECK-NEXT: vpinsrb $12, %eax, %xmm2, %xmm2		; CHECK-NEXT: vpinsrb $12, %eax, %xmm2, %xmm2
		; CHECK-NEXT: vextractf32x4 $2, %zmm1, %xmm1
; CHECK-NEXT: vpslld $31, %xmm2, %xmm2		; CHECK-NEXT: vpslld $31, %xmm2, %xmm2
; CHECK-NEXT: vblendvps %xmm2, %xmm1, %xmm0, %xmm0		; CHECK-NEXT: vblendvps %xmm2, %xmm1, %xmm0, %xmm0
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%res = call <4 x float> @llvm.x86.avx512.mask.vextractf32x4.512(<16 x float> %a, i32 2, <4 x float> %b, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.vextractf32x4.512(<16 x float> %a, i32 2, <4 x float> %b, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

declare <4 x float> @llvm.x86.avx512.mask.vextractf32x4.512(<16 x float>, i32, <4 x float>, i8)		declare <4 x float> @llvm.x86.avx512.mask.vextractf32x4.512(<16 x float>, i32, <4 x float>, i8)
Show All 27 Lines	; CHECK-NEXT: retq
ret <4 x i64> %res		ret <4 x i64> %res
}		}

declare <4 x i64> @llvm.x86.avx512.mask.vextracti64x4.512(<8 x i64>, i32, <4 x i64>, i8)		declare <4 x i64> @llvm.x86.avx512.mask.vextracti64x4.512(<8 x i64>, i32, <4 x i64>, i8)

define <4 x i32> @test_maskz_vextracti32x4(<16 x i32> %a, i8 %mask) {		define <4 x i32> @test_maskz_vextracti32x4(<16 x i32> %a, i8 %mask) {
; CHECK-LABEL: test_maskz_vextracti32x4:		; CHECK-LABEL: test_maskz_vextracti32x4:
; CHECK: ## BB#0:		; CHECK: ## BB#0:
; CHECK-NEXT: vextracti32x4 $2, %zmm0, %xmm0
; CHECK-NEXT: kmovw %edi, %k0		; CHECK-NEXT: kmovw %edi, %k0
; CHECK-NEXT: kshiftlw $12, %k0, %k1		; CHECK-NEXT: kshiftlw $12, %k0, %k1
; CHECK-NEXT: kshiftrw $15, %k1, %k1		; CHECK-NEXT: kshiftrw $15, %k1, %k1
; CHECK-NEXT: kshiftlw $13, %k0, %k2		; CHECK-NEXT: kshiftlw $13, %k0, %k2
; CHECK-NEXT: kshiftrw $15, %k2, %k2		; CHECK-NEXT: kshiftrw $15, %k2, %k2
; CHECK-NEXT: kshiftlw $15, %k0, %k3		; CHECK-NEXT: kshiftlw $15, %k0, %k3
; CHECK-NEXT: kshiftrw $15, %k3, %k3		; CHECK-NEXT: kshiftrw $15, %k3, %k3
; CHECK-NEXT: kshiftlw $14, %k0, %k0		; CHECK-NEXT: kshiftlw $14, %k0, %k0
; CHECK-NEXT: kshiftrw $15, %k0, %k0		; CHECK-NEXT: kshiftrw $15, %k0, %k0
; CHECK-NEXT: kmovw %k0, %eax		; CHECK-NEXT: kmovw %k0, %eax
; CHECK-NEXT: kmovw %k3, %ecx		; CHECK-NEXT: kmovw %k3, %ecx
; CHECK-NEXT: vmovd %ecx, %xmm1		; CHECK-NEXT: vmovd %ecx, %xmm1
; CHECK-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1		; CHECK-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
; CHECK-NEXT: kmovw %k2, %eax		; CHECK-NEXT: kmovw %k2, %eax
; CHECK-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1		; CHECK-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
; CHECK-NEXT: kmovw %k1, %eax		; CHECK-NEXT: kmovw %k1, %eax
; CHECK-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1		; CHECK-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
		; CHECK-NEXT: vextracti32x4 $2, %zmm0, %xmm0
; CHECK-NEXT: vpslld $31, %xmm1, %xmm1		; CHECK-NEXT: vpslld $31, %xmm1, %xmm1
; CHECK-NEXT: vpsrad $31, %xmm1, %xmm1		; CHECK-NEXT: vpsrad $31, %xmm1, %xmm1
; CHECK-NEXT: vpand %xmm0, %xmm1, %xmm0		; CHECK-NEXT: vpand %xmm0, %xmm1, %xmm0
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%res = call <4 x i32> @llvm.x86.avx512.mask.vextracti32x4.512(<16 x i32> %a, i32 2, <4 x i32> zeroinitializer, i8 %mask)		%res = call <4 x i32> @llvm.x86.avx512.mask.vextracti32x4.512(<16 x i32> %a, i32 2, <4 x i32> zeroinitializer, i8 %mask)
ret <4 x i32> %res		ret <4 x i32> %res
}		}

▲ Show 20 Lines • Show All 614 Lines • Show Last 20 Lines

test/CodeGen/X86/avx512-mask-op.ll

Show First 20 Lines • Show All 1,829 Lines • ▼ Show 20 Lines
; KNL-NEXT: .cfi_def_cfa_offset 16		; KNL-NEXT: .cfi_def_cfa_offset 16
; KNL-NEXT: Lcfi7:		; KNL-NEXT: Lcfi7:
; KNL-NEXT: .cfi_offset %rbp, -16		; KNL-NEXT: .cfi_offset %rbp, -16
; KNL-NEXT: movq %rsp, %rbp		; KNL-NEXT: movq %rsp, %rbp
; KNL-NEXT: Lcfi8:		; KNL-NEXT: Lcfi8:
; KNL-NEXT: .cfi_def_cfa_register %rbp		; KNL-NEXT: .cfi_def_cfa_register %rbp
; KNL-NEXT: andq $-32, %rsp		; KNL-NEXT: andq $-32, %rsp
; KNL-NEXT: subq $32, %rsp		; KNL-NEXT: subq $32, %rsp
; KNL-NEXT: vmovups (%rdi), %zmm2		; KNL-NEXT: vmovups 64(%rdi), %zmm2
; KNL-NEXT: vmovups 64(%rdi), %zmm3		; KNL-NEXT: vcmpltps %zmm1, %zmm2, %k2
; KNL-NEXT: vcmpltps %zmm1, %zmm3, %k1
; KNL-NEXT: kshiftlw $14, %k1, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: kshiftlw $15, %k1, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %ecx
; KNL-NEXT: vmovd %ecx, %xmm3
; KNL-NEXT: vpinsrb $1, %eax, %xmm3, %xmm3
; KNL-NEXT: kshiftlw $13, %k1, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $2, %eax, %xmm3, %xmm3
; KNL-NEXT: kshiftlw $12, %k1, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $3, %eax, %xmm3, %xmm3
; KNL-NEXT: kshiftlw $11, %k1, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $4, %eax, %xmm3, %xmm3
; KNL-NEXT: kshiftlw $10, %k1, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $5, %eax, %xmm3, %xmm3
; KNL-NEXT: kshiftlw $9, %k1, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $6, %eax, %xmm3, %xmm3
; KNL-NEXT: kshiftlw $8, %k1, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $7, %eax, %xmm3, %xmm3
; KNL-NEXT: kshiftlw $7, %k1, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $8, %eax, %xmm3, %xmm3
; KNL-NEXT: kshiftlw $6, %k1, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $9, %eax, %xmm3, %xmm3
; KNL-NEXT: kshiftlw $5, %k1, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $10, %eax, %xmm3, %xmm3
; KNL-NEXT: kshiftlw $4, %k1, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $11, %eax, %xmm3, %xmm3
; KNL-NEXT: kshiftlw $3, %k1, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $12, %eax, %xmm3, %xmm3
; KNL-NEXT: kshiftlw $2, %k1, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $13, %eax, %xmm3, %xmm3
; KNL-NEXT: kshiftlw $1, %k1, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $14, %eax, %xmm3, %xmm3
; KNL-NEXT: kshiftrw $15, %k1, %k0
; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $15, %eax, %xmm3, %xmm3
; KNL-NEXT: vcmpltps %zmm0, %zmm2, %k2
; KNL-NEXT: kshiftlw $14, %k2, %k0		; KNL-NEXT: kshiftlw $14, %k2, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %eax		; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: kshiftlw $15, %k2, %k0		; KNL-NEXT: kshiftlw $15, %k2, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %ecx		; KNL-NEXT: kmovw %k0, %ecx
; KNL-NEXT: vmovd %ecx, %xmm2		; KNL-NEXT: vmovd %ecx, %xmm2
; KNL-NEXT: vpinsrb $1, %eax, %xmm2, %xmm2		; KNL-NEXT: vpinsrb $1, %eax, %xmm2, %xmm2
▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
; KNL-NEXT: vpinsrb $13, %eax, %xmm2, %xmm2		; KNL-NEXT: vpinsrb $13, %eax, %xmm2, %xmm2
; KNL-NEXT: kshiftlw $1, %k2, %k0		; KNL-NEXT: kshiftlw $1, %k2, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %eax		; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $14, %eax, %xmm2, %xmm2		; KNL-NEXT: vpinsrb $14, %eax, %xmm2, %xmm2
; KNL-NEXT: kshiftrw $15, %k2, %k0		; KNL-NEXT: kshiftrw $15, %k2, %k0
; KNL-NEXT: kmovw %k0, %eax		; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $15, %eax, %xmm2, %xmm2		; KNL-NEXT: vpinsrb $15, %eax, %xmm2, %xmm2
; KNL-NEXT: vinserti128 $1, %xmm3, %ymm2, %ymm2		; KNL-NEXT: vmovups (%rdi), %zmm3
; KNL-NEXT: vmovups 4(%rdi), %zmm3 {%k2} {z}		; KNL-NEXT: vcmpltps %zmm0, %zmm3, %k1
; KNL-NEXT: vmovups 68(%rdi), %zmm4 {%k1} {z}		; KNL-NEXT: kshiftlw $14, %k1, %k0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: kshiftlw $15, %k1, %k0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %ecx
		; KNL-NEXT: vmovd %ecx, %xmm3
		; KNL-NEXT: vpinsrb $1, %eax, %xmm3, %xmm3
		; KNL-NEXT: kshiftlw $13, %k1, %k0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: vpinsrb $2, %eax, %xmm3, %xmm3
		; KNL-NEXT: kshiftlw $12, %k1, %k0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: vpinsrb $3, %eax, %xmm3, %xmm3
		; KNL-NEXT: kshiftlw $11, %k1, %k0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: vpinsrb $4, %eax, %xmm3, %xmm3
		; KNL-NEXT: kshiftlw $10, %k1, %k0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: vpinsrb $5, %eax, %xmm3, %xmm3
		; KNL-NEXT: kshiftlw $9, %k1, %k0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: vpinsrb $6, %eax, %xmm3, %xmm3
		; KNL-NEXT: kshiftlw $8, %k1, %k0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: vpinsrb $7, %eax, %xmm3, %xmm3
		; KNL-NEXT: kshiftlw $7, %k1, %k0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: vpinsrb $8, %eax, %xmm3, %xmm3
		; KNL-NEXT: kshiftlw $6, %k1, %k0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: vpinsrb $9, %eax, %xmm3, %xmm3
		; KNL-NEXT: kshiftlw $5, %k1, %k0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: vpinsrb $10, %eax, %xmm3, %xmm3
		; KNL-NEXT: kshiftlw $4, %k1, %k0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: vpinsrb $11, %eax, %xmm3, %xmm3
		; KNL-NEXT: kshiftlw $3, %k1, %k0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: vpinsrb $12, %eax, %xmm3, %xmm3
		; KNL-NEXT: kshiftlw $2, %k1, %k0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: vpinsrb $13, %eax, %xmm3, %xmm3
		; KNL-NEXT: kshiftlw $1, %k1, %k0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: vpinsrb $14, %eax, %xmm3, %xmm3
		; KNL-NEXT: kshiftrw $15, %k1, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: vpinsrb $15, %eax, %xmm3, %xmm3
		; KNL-NEXT: vmovups 68(%rdi), %zmm4 {%k2} {z}
; KNL-NEXT: vcmpltps %zmm4, %zmm1, %k0		; KNL-NEXT: vcmpltps %zmm4, %zmm1, %k0
; KNL-NEXT: kshiftlw $14, %k0, %k1		; KNL-NEXT: kshiftlw $14, %k0, %k2
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k2, %k2
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k2, %eax
; KNL-NEXT: kshiftlw $15, %k0, %k1		; KNL-NEXT: kshiftlw $15, %k0, %k2
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k2, %k2
; KNL-NEXT: kmovw %k1, %ecx		; KNL-NEXT: kmovw %k2, %ecx
; KNL-NEXT: vmovd %ecx, %xmm4		; KNL-NEXT: vmovd %ecx, %xmm4
; KNL-NEXT: vpinsrb $1, %eax, %xmm4, %xmm4		; KNL-NEXT: vpinsrb $1, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $13, %k0, %k1		; KNL-NEXT: kshiftlw $13, %k0, %k2
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k2, %k2
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k2, %eax
; KNL-NEXT: vpinsrb $2, %eax, %xmm4, %xmm4		; KNL-NEXT: vpinsrb $2, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $12, %k0, %k1		; KNL-NEXT: kshiftlw $12, %k0, %k2
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k2, %k2
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k2, %eax
; KNL-NEXT: vpinsrb $3, %eax, %xmm4, %xmm4		; KNL-NEXT: vpinsrb $3, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $11, %k0, %k1		; KNL-NEXT: kshiftlw $11, %k0, %k2
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k2, %k2
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k2, %eax
; KNL-NEXT: vpinsrb $4, %eax, %xmm4, %xmm4		; KNL-NEXT: vpinsrb $4, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $10, %k0, %k1		; KNL-NEXT: kshiftlw $10, %k0, %k2
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k2, %k2
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k2, %eax
; KNL-NEXT: vpinsrb $5, %eax, %xmm4, %xmm4		; KNL-NEXT: vpinsrb $5, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $9, %k0, %k1		; KNL-NEXT: kshiftlw $9, %k0, %k2
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k2, %k2
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k2, %eax
; KNL-NEXT: vpinsrb $6, %eax, %xmm4, %xmm4		; KNL-NEXT: vpinsrb $6, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $8, %k0, %k1		; KNL-NEXT: kshiftlw $8, %k0, %k2
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k2, %k2
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k2, %eax
; KNL-NEXT: vpinsrb $7, %eax, %xmm4, %xmm4		; KNL-NEXT: vpinsrb $7, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $7, %k0, %k1		; KNL-NEXT: kshiftlw $7, %k0, %k2
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k2, %k2
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k2, %eax
; KNL-NEXT: vpinsrb $8, %eax, %xmm4, %xmm4		; KNL-NEXT: vpinsrb $8, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $6, %k0, %k1		; KNL-NEXT: kshiftlw $6, %k0, %k2
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k2, %k2
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k2, %eax
; KNL-NEXT: vpinsrb $9, %eax, %xmm4, %xmm4		; KNL-NEXT: vpinsrb $9, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $5, %k0, %k1		; KNL-NEXT: kshiftlw $5, %k0, %k2
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k2, %k2
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k2, %eax
; KNL-NEXT: vpinsrb $10, %eax, %xmm4, %xmm4		; KNL-NEXT: vpinsrb $10, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $4, %k0, %k1		; KNL-NEXT: kshiftlw $4, %k0, %k2
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k2, %k2
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k2, %eax
; KNL-NEXT: vpinsrb $11, %eax, %xmm4, %xmm4		; KNL-NEXT: vpinsrb $11, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $3, %k0, %k1		; KNL-NEXT: kshiftlw $3, %k0, %k2
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k2, %k2
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k2, %eax
; KNL-NEXT: vpinsrb $12, %eax, %xmm4, %xmm4		; KNL-NEXT: vpinsrb $12, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $2, %k0, %k1		; KNL-NEXT: kshiftlw $2, %k0, %k2
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k2, %k2
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k2, %eax
; KNL-NEXT: vpinsrb $13, %eax, %xmm4, %xmm4		; KNL-NEXT: vpinsrb $13, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $1, %k0, %k1		; KNL-NEXT: kshiftlw $1, %k0, %k2
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k2, %k2
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k2, %eax
; KNL-NEXT: vpinsrb $14, %eax, %xmm4, %xmm4		; KNL-NEXT: vpinsrb $14, %eax, %xmm4, %xmm4
		; KNL-NEXT: vinserti128 $1, %xmm2, %ymm3, %ymm2
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %eax		; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $15, %eax, %xmm4, %xmm4		; KNL-NEXT: vpinsrb $15, %eax, %xmm4, %xmm3
; KNL-NEXT: vcmpltps %zmm3, %zmm0, %k0		; KNL-NEXT: vmovups 4(%rdi), %zmm4 {%k1} {z}
		; KNL-NEXT: vcmpltps %zmm4, %zmm0, %k0
; KNL-NEXT: kshiftlw $14, %k0, %k1		; KNL-NEXT: kshiftlw $14, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: kshiftlw $15, %k0, %k1		; KNL-NEXT: kshiftlw $15, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ecx		; KNL-NEXT: kmovw %k1, %ecx
; KNL-NEXT: vmovd %ecx, %xmm3		; KNL-NEXT: vmovd %ecx, %xmm4
; KNL-NEXT: vpinsrb $1, %eax, %xmm3, %xmm3		; KNL-NEXT: vpinsrb $1, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $13, %k0, %k1		; KNL-NEXT: kshiftlw $13, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $2, %eax, %xmm3, %xmm3		; KNL-NEXT: vpinsrb $2, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $12, %k0, %k1		; KNL-NEXT: kshiftlw $12, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $3, %eax, %xmm3, %xmm3		; KNL-NEXT: vpinsrb $3, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $11, %k0, %k1		; KNL-NEXT: kshiftlw $11, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $4, %eax, %xmm3, %xmm3		; KNL-NEXT: vpinsrb $4, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $10, %k0, %k1		; KNL-NEXT: kshiftlw $10, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $5, %eax, %xmm3, %xmm3		; KNL-NEXT: vpinsrb $5, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $9, %k0, %k1		; KNL-NEXT: kshiftlw $9, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $6, %eax, %xmm3, %xmm3		; KNL-NEXT: vpinsrb $6, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $8, %k0, %k1		; KNL-NEXT: kshiftlw $8, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $7, %eax, %xmm3, %xmm3		; KNL-NEXT: vpinsrb $7, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $7, %k0, %k1		; KNL-NEXT: kshiftlw $7, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $8, %eax, %xmm3, %xmm3		; KNL-NEXT: vpinsrb $8, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $6, %k0, %k1		; KNL-NEXT: kshiftlw $6, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $9, %eax, %xmm3, %xmm3		; KNL-NEXT: vpinsrb $9, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $5, %k0, %k1		; KNL-NEXT: kshiftlw $5, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $10, %eax, %xmm3, %xmm3		; KNL-NEXT: vpinsrb $10, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $4, %k0, %k1		; KNL-NEXT: kshiftlw $4, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $11, %eax, %xmm3, %xmm3		; KNL-NEXT: vpinsrb $11, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $3, %k0, %k1		; KNL-NEXT: kshiftlw $3, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $12, %eax, %xmm3, %xmm3		; KNL-NEXT: vpinsrb $12, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $2, %k0, %k1		; KNL-NEXT: kshiftlw $2, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $13, %eax, %xmm3, %xmm3		; KNL-NEXT: vpinsrb $13, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftlw $1, %k0, %k1		; KNL-NEXT: kshiftlw $1, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $14, %eax, %xmm3, %xmm3		; KNL-NEXT: vpinsrb $14, %eax, %xmm4, %xmm4
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %eax		; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $15, %eax, %xmm3, %xmm3		; KNL-NEXT: vpinsrb $15, %eax, %xmm4, %xmm4
; KNL-NEXT: vinserti128 $1, %xmm4, %ymm3, %ymm3		; KNL-NEXT: vinserti128 $1, %xmm3, %ymm4, %ymm3
; KNL-NEXT: vpor %ymm3, %ymm2, %ymm2		; KNL-NEXT: vpor %ymm3, %ymm2, %ymm2
; KNL-NEXT: vextracti128 $1, %ymm2, %xmm3		; KNL-NEXT: vextracti128 $1, %ymm2, %xmm3
; KNL-NEXT: vpmovsxbd %xmm3, %zmm3		; KNL-NEXT: vpmovsxbd %xmm3, %zmm3
; KNL-NEXT: vpslld $31, %zmm3, %zmm3		; KNL-NEXT: vpslld $31, %zmm3, %zmm3
; KNL-NEXT: vptestmd %zmm3, %zmm3, %k0		; KNL-NEXT: vptestmd %zmm3, %zmm3, %k0
; KNL-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)		; KNL-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
; KNL-NEXT: vpmovsxbd %xmm2, %zmm2		; KNL-NEXT: vpmovsxbd %xmm2, %zmm2
; KNL-NEXT: vpslld $31, %zmm2, %zmm2		; KNL-NEXT: vpslld $31, %zmm2, %zmm2
▲ Show 20 Lines • Show All 828 Lines • ▼ Show 20 Lines	; AVX512DQ-NEXT: retq
ret void		ret void
}		}


define void @store_64i1(<64 x i1>* %a, <64 x i1> %v) {		define void @store_64i1(<64 x i1>* %a, <64 x i1> %v) {
;		;
; KNL-LABEL: store_64i1:		; KNL-LABEL: store_64i1:
; KNL: ## BB#0:		; KNL: ## BB#0:
; KNL-NEXT: pushq %rbp
; KNL-NEXT: Lcfi9:
; KNL-NEXT: .cfi_def_cfa_offset 16
; KNL-NEXT: pushq %r15
; KNL-NEXT: Lcfi10:
; KNL-NEXT: .cfi_def_cfa_offset 24
; KNL-NEXT: pushq %r14
; KNL-NEXT: Lcfi11:
; KNL-NEXT: .cfi_def_cfa_offset 32
; KNL-NEXT: pushq %r13
; KNL-NEXT: Lcfi12:
; KNL-NEXT: .cfi_def_cfa_offset 40
; KNL-NEXT: pushq %r12
; KNL-NEXT: Lcfi13:
; KNL-NEXT: .cfi_def_cfa_offset 48
; KNL-NEXT: pushq %rbx
; KNL-NEXT: Lcfi14:
; KNL-NEXT: .cfi_def_cfa_offset 56
; KNL-NEXT: Lcfi15:
; KNL-NEXT: .cfi_offset %rbx, -56
; KNL-NEXT: Lcfi16:
; KNL-NEXT: .cfi_offset %r12, -48
; KNL-NEXT: Lcfi17:
; KNL-NEXT: .cfi_offset %r13, -40
; KNL-NEXT: Lcfi18:
; KNL-NEXT: .cfi_offset %r14, -32
; KNL-NEXT: Lcfi19:
; KNL-NEXT: .cfi_offset %r15, -24
; KNL-NEXT: Lcfi20:
; KNL-NEXT: .cfi_offset %rbp, -16
; KNL-NEXT: vpmovsxbd %xmm0, %zmm0		; KNL-NEXT: vpmovsxbd %xmm0, %zmm0
; KNL-NEXT: vpslld $31, %zmm0, %zmm0		; KNL-NEXT: vpslld $31, %zmm0, %zmm0
; KNL-NEXT: vpmovsxbd %xmm1, %zmm1		; KNL-NEXT: vpmovsxbd %xmm1, %zmm1
; KNL-NEXT: vpslld $31, %zmm1, %zmm1		; KNL-NEXT: vpslld $31, %zmm1, %zmm1
; KNL-NEXT: vpmovsxbd %xmm2, %zmm2		; KNL-NEXT: vpmovsxbd %xmm2, %zmm2
; KNL-NEXT: vpslld $31, %zmm2, %zmm2		; KNL-NEXT: vpslld $31, %zmm2, %zmm2
; KNL-NEXT: vpmovsxbd %xmm3, %zmm3		; KNL-NEXT: vpmovsxbd %xmm3, %zmm3
; KNL-NEXT: vpslld $31, %zmm3, %zmm3		; KNL-NEXT: vpslld $31, %zmm3, %zmm3
; KNL-NEXT: vptestmd %zmm3, %zmm3, %k0		; KNL-NEXT: vptestmd %zmm3, %zmm3, %k0
; KNL-NEXT: kshiftlw $14, %k0, %k1		; KNL-NEXT: kshiftlw $14, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %r8d		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: kshiftlw $15, %k0, %k1		; KNL-NEXT: kshiftlw $15, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %r9d		; KNL-NEXT: kmovw %k1, %ecx
; KNL-NEXT: kshiftlw $13, %k0, %k1		; KNL-NEXT: kshiftlw $13, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %r10d		; KNL-NEXT: vmovd %ecx, %xmm3
		; KNL-NEXT: kmovw %k1, %ecx
; KNL-NEXT: kshiftlw $12, %k0, %k1		; KNL-NEXT: kshiftlw $12, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %r11d		; KNL-NEXT: vpinsrb $1, %eax, %xmm3, %xmm3
		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: kshiftlw $11, %k0, %k1		; KNL-NEXT: kshiftlw $11, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %r14d		; KNL-NEXT: vpinsrb $2, %ecx, %xmm3, %xmm3
		; KNL-NEXT: kmovw %k1, %ecx
; KNL-NEXT: kshiftlw $10, %k0, %k1		; KNL-NEXT: kshiftlw $10, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %r15d		; KNL-NEXT: vpinsrb $3, %eax, %xmm3, %xmm3
		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: kshiftlw $9, %k0, %k1		; KNL-NEXT: kshiftlw $9, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %r12d		; KNL-NEXT: vpinsrb $4, %ecx, %xmm3, %xmm3
		; KNL-NEXT: kmovw %k1, %ecx
; KNL-NEXT: kshiftlw $8, %k0, %k1		; KNL-NEXT: kshiftlw $8, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %r13d		; KNL-NEXT: vpinsrb $5, %eax, %xmm3, %xmm3
		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: kshiftlw $7, %k0, %k1		; KNL-NEXT: kshiftlw $7, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ebx		; KNL-NEXT: vpinsrb $6, %ecx, %xmm3, %xmm3
		; KNL-NEXT: kmovw %k1, %ecx
; KNL-NEXT: kshiftlw $6, %k0, %k1		; KNL-NEXT: kshiftlw $6, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ebp		; KNL-NEXT: vpinsrb $7, %eax, %xmm3, %xmm3
		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: kshiftlw $5, %k0, %k1		; KNL-NEXT: kshiftlw $5, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: vpinsrb $8, %ecx, %xmm3, %xmm3
		; KNL-NEXT: kmovw %k1, %ecx
; KNL-NEXT: kshiftlw $4, %k0, %k1		; KNL-NEXT: kshiftlw $4, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ecx		; KNL-NEXT: vpinsrb $9, %eax, %xmm3, %xmm3
		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: kshiftlw $3, %k0, %k1		; KNL-NEXT: kshiftlw $3, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %edx		; KNL-NEXT: vpinsrb $10, %ecx, %xmm3, %xmm3
		; KNL-NEXT: kmovw %k1, %ecx
; KNL-NEXT: kshiftlw $2, %k0, %k1		; KNL-NEXT: kshiftlw $2, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %esi		; KNL-NEXT: vpinsrb $11, %eax, %xmm3, %xmm3
		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: kshiftlw $1, %k0, %k1		; KNL-NEXT: kshiftlw $1, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: vmovd %r9d, %xmm3		; KNL-NEXT: vpinsrb $12, %ecx, %xmm3, %xmm3
; KNL-NEXT: kmovw %k1, %r9d		; KNL-NEXT: kmovw %k1, %ecx
; KNL-NEXT: vptestmd %zmm2, %zmm2, %k2		; KNL-NEXT: vptestmd %zmm2, %zmm2, %k1
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: vpinsrb $1, %r8d, %xmm3, %xmm2
; KNL-NEXT: vpinsrb $2, %r10d, %xmm2, %xmm2
; KNL-NEXT: vpinsrb $3, %r11d, %xmm2, %xmm2
; KNL-NEXT: vpinsrb $4, %r14d, %xmm2, %xmm2
; KNL-NEXT: vpinsrb $5, %r15d, %xmm2, %xmm2
; KNL-NEXT: vpinsrb $6, %r12d, %xmm2, %xmm2
; KNL-NEXT: vpinsrb $7, %r13d, %xmm2, %xmm2
; KNL-NEXT: vpinsrb $8, %ebx, %xmm2, %xmm2
; KNL-NEXT: vpinsrb $9, %ebp, %xmm2, %xmm2
; KNL-NEXT: vpinsrb $10, %eax, %xmm2, %xmm2
; KNL-NEXT: vpinsrb $11, %ecx, %xmm2, %xmm2
; KNL-NEXT: vpinsrb $12, %edx, %xmm2, %xmm2
; KNL-NEXT: vpinsrb $13, %esi, %xmm2, %xmm2
; KNL-NEXT: vpinsrb $14, %r9d, %xmm2, %xmm2
; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $15, %eax, %xmm2, %xmm2
; KNL-NEXT: vpmovsxbd %xmm2, %zmm2
; KNL-NEXT: vpslld $31, %zmm2, %zmm2
; KNL-NEXT: vptestmd %zmm2, %zmm2, %k0
; KNL-NEXT: kmovw %k0, 6(%rdi)
; KNL-NEXT: kshiftlw $14, %k2, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %r8d
; KNL-NEXT: kshiftlw $15, %k2, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %r10d
; KNL-NEXT: kshiftlw $13, %k2, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %r9d
; KNL-NEXT: kshiftlw $12, %k2, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %r11d
; KNL-NEXT: kshiftlw $11, %k2, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %r14d
; KNL-NEXT: kshiftlw $10, %k2, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %r15d
; KNL-NEXT: kshiftlw $9, %k2, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %r12d
; KNL-NEXT: kshiftlw $8, %k2, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %r13d
; KNL-NEXT: kshiftlw $7, %k2, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %ecx
; KNL-NEXT: kshiftlw $6, %k2, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %esi
; KNL-NEXT: kshiftlw $5, %k2, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %ebp
; KNL-NEXT: kshiftlw $4, %k2, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %ebx
; KNL-NEXT: kshiftlw $3, %k2, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: kshiftlw $2, %k2, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %edx
; KNL-NEXT: kshiftlw $1, %k2, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: vmovd %r10d, %xmm2		; KNL-NEXT: vpinsrb $13, %eax, %xmm3, %xmm2
; KNL-NEXT: kmovw %k0, %r10d
; KNL-NEXT: vptestmd %zmm1, %zmm1, %k1
; KNL-NEXT: kshiftrw $15, %k2, %k0
; KNL-NEXT: vpinsrb $1, %r8d, %xmm2, %xmm1
; KNL-NEXT: vpinsrb $2, %r9d, %xmm1, %xmm1
; KNL-NEXT: vpinsrb $3, %r11d, %xmm1, %xmm1
; KNL-NEXT: vpinsrb $4, %r14d, %xmm1, %xmm1
; KNL-NEXT: vpinsrb $5, %r15d, %xmm1, %xmm1
; KNL-NEXT: vpinsrb $6, %r12d, %xmm1, %xmm1
; KNL-NEXT: vpinsrb $7, %r13d, %xmm1, %xmm1
; KNL-NEXT: vpinsrb $8, %ecx, %xmm1, %xmm1
; KNL-NEXT: vpinsrb $9, %esi, %xmm1, %xmm1
; KNL-NEXT: vpinsrb $10, %ebp, %xmm1, %xmm1
; KNL-NEXT: vpinsrb $11, %ebx, %xmm1, %xmm1
; KNL-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
; KNL-NEXT: vpinsrb $13, %edx, %xmm1, %xmm1
; KNL-NEXT: vpinsrb $14, %r10d, %xmm1, %xmm1
; KNL-NEXT: kmovw %k0, %eax		; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $15, %eax, %xmm1, %xmm1
; KNL-NEXT: vpmovsxbd %xmm1, %zmm1
; KNL-NEXT: vpslld $31, %zmm1, %zmm1
; KNL-NEXT: vptestmd %zmm1, %zmm1, %k0
; KNL-NEXT: kmovw %k0, 4(%rdi)
; KNL-NEXT: kshiftlw $14, %k1, %k0		; KNL-NEXT: kshiftlw $14, %k1, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %r8d		; KNL-NEXT: vpinsrb $14, %ecx, %xmm2, %xmm2
		; KNL-NEXT: kmovw %k0, %ecx
; KNL-NEXT: kshiftlw $15, %k1, %k0		; KNL-NEXT: kshiftlw $15, %k1, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %r10d		; KNL-NEXT: vpinsrb $15, %eax, %xmm2, %xmm2
		; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: kshiftlw $13, %k1, %k0		; KNL-NEXT: kshiftlw $13, %k1, %k0
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %r9d		; KNL-NEXT: vmovd %eax, %xmm3
		; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: kshiftlw $12, %k1, %k0		; KNL-NEXT: kshiftlw $12, %k1, %k0
		; KNL-NEXT: vpinsrb $1, %ecx, %xmm3, %xmm3
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %r11d		; KNL-NEXT: kmovw %k0, %ecx
; KNL-NEXT: kshiftlw $11, %k1, %k0		; KNL-NEXT: kshiftlw $11, %k1, %k0
		; KNL-NEXT: vpinsrb $2, %eax, %xmm3, %xmm3
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %r14d		; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: kshiftlw $10, %k1, %k0		; KNL-NEXT: kshiftlw $10, %k1, %k0
		; KNL-NEXT: vpinsrb $3, %ecx, %xmm3, %xmm3
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %r15d		; KNL-NEXT: kmovw %k0, %ecx
; KNL-NEXT: kshiftlw $9, %k1, %k0		; KNL-NEXT: kshiftlw $9, %k1, %k0
		; KNL-NEXT: vpinsrb $4, %eax, %xmm3, %xmm3
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %r12d		; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: kshiftlw $8, %k1, %k0		; KNL-NEXT: kshiftlw $8, %k1, %k0
		; KNL-NEXT: vpinsrb $5, %ecx, %xmm3, %xmm3
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %r13d		; KNL-NEXT: kmovw %k0, %ecx
; KNL-NEXT: kshiftlw $7, %k1, %k0		; KNL-NEXT: kshiftlw $7, %k1, %k0
		; KNL-NEXT: vpinsrb $6, %eax, %xmm3, %xmm3
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %ecx		; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: kshiftlw $6, %k1, %k0		; KNL-NEXT: kshiftlw $6, %k1, %k0
		; KNL-NEXT: vpinsrb $7, %ecx, %xmm3, %xmm3
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %esi		; KNL-NEXT: kmovw %k0, %ecx
; KNL-NEXT: kshiftlw $5, %k1, %k0		; KNL-NEXT: kshiftlw $5, %k1, %k0
		; KNL-NEXT: vpinsrb $8, %eax, %xmm3, %xmm3
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %ebp		; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: kshiftlw $4, %k1, %k0		; KNL-NEXT: kshiftlw $4, %k1, %k0
		; KNL-NEXT: vpinsrb $9, %ecx, %xmm3, %xmm3
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %ebx		; KNL-NEXT: kmovw %k0, %ecx
; KNL-NEXT: kshiftlw $3, %k1, %k0		; KNL-NEXT: kshiftlw $3, %k1, %k0
		; KNL-NEXT: vpinsrb $10, %eax, %xmm3, %xmm3
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %eax		; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: kshiftlw $2, %k1, %k0		; KNL-NEXT: kshiftlw $2, %k1, %k0
		; KNL-NEXT: vpinsrb $11, %ecx, %xmm3, %xmm3
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: kmovw %k0, %edx		; KNL-NEXT: kmovw %k0, %ecx
; KNL-NEXT: kshiftlw $1, %k1, %k0		; KNL-NEXT: kshiftlw $1, %k1, %k0
		; KNL-NEXT: vpinsrb $12, %eax, %xmm3, %xmm3
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: vmovd %r10d, %xmm1		; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: kmovw %k0, %r10d		; KNL-NEXT: vptestmd %zmm1, %zmm1, %k0
; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: vpinsrb $1, %r8d, %xmm1, %xmm0		; KNL-NEXT: vpmovsxbd %xmm2, %zmm1
; KNL-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0		; KNL-NEXT: vpslld $31, %zmm1, %zmm1
; KNL-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0		; KNL-NEXT: vpinsrb $13, %ecx, %xmm3, %xmm2
; KNL-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0		; KNL-NEXT: kmovw %k1, %ecx
; KNL-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0		; KNL-NEXT: vptestmd %zmm1, %zmm1, %k1
; KNL-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0		; KNL-NEXT: vpinsrb $14, %eax, %xmm2, %xmm1
; KNL-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0		; KNL-NEXT: vpinsrb $15, %ecx, %xmm1, %xmm1
; KNL-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0		; KNL-NEXT: kmovw %k1, 6(%rdi)
; KNL-NEXT: vpinsrb $9, %esi, %xmm0, %xmm0		; KNL-NEXT: vpmovsxbd %xmm1, %zmm1
; KNL-NEXT: vpinsrb $10, %ebp, %xmm0, %xmm0		; KNL-NEXT: vpslld $31, %zmm1, %zmm1
; KNL-NEXT: vpinsrb $11, %ebx, %xmm0, %xmm0		; KNL-NEXT: vptestmd %zmm1, %zmm1, %k1
; KNL-NEXT: vpinsrb $12, %eax, %xmm0, %xmm0		; KNL-NEXT: kmovw %k1, 4(%rdi)
; KNL-NEXT: vpinsrb $13, %edx, %xmm0, %xmm0
; KNL-NEXT: vpinsrb $14, %r10d, %xmm0, %xmm0
; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
; KNL-NEXT: vpmovsxbd %xmm0, %zmm0
; KNL-NEXT: vpslld $31, %zmm0, %zmm0
; KNL-NEXT: vptestmd %zmm0, %zmm0, %k1
; KNL-NEXT: kmovw %k1, 2(%rdi)
; KNL-NEXT: kshiftlw $14, %k0, %k1		; KNL-NEXT: kshiftlw $14, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %r8d		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: kshiftlw $15, %k0, %k1		; KNL-NEXT: kshiftlw $15, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %r9d		; KNL-NEXT: kmovw %k1, %ecx
; KNL-NEXT: kshiftlw $13, %k0, %k1		; KNL-NEXT: kshiftlw $13, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %r10d		; KNL-NEXT: vmovd %ecx, %xmm1
		; KNL-NEXT: kmovw %k1, %ecx
; KNL-NEXT: kshiftlw $12, %k0, %k1		; KNL-NEXT: kshiftlw $12, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %r11d		; KNL-NEXT: vpinsrb $1, %eax, %xmm1, %xmm1
		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: kshiftlw $11, %k0, %k1		; KNL-NEXT: kshiftlw $11, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %r14d		; KNL-NEXT: vpinsrb $2, %ecx, %xmm1, %xmm1
		; KNL-NEXT: kmovw %k1, %ecx
; KNL-NEXT: kshiftlw $10, %k0, %k1		; KNL-NEXT: kshiftlw $10, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %r15d		; KNL-NEXT: vpinsrb $3, %eax, %xmm1, %xmm1
		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: kshiftlw $9, %k0, %k1		; KNL-NEXT: kshiftlw $9, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %r12d		; KNL-NEXT: vpinsrb $4, %ecx, %xmm1, %xmm1
		; KNL-NEXT: kmovw %k1, %ecx
; KNL-NEXT: kshiftlw $8, %k0, %k1		; KNL-NEXT: kshiftlw $8, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %r13d		; KNL-NEXT: vpinsrb $5, %eax, %xmm1, %xmm1
		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: kshiftlw $7, %k0, %k1		; KNL-NEXT: kshiftlw $7, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %edx		; KNL-NEXT: vpinsrb $6, %ecx, %xmm1, %xmm1
		; KNL-NEXT: kmovw %k1, %ecx
; KNL-NEXT: kshiftlw $6, %k0, %k1		; KNL-NEXT: kshiftlw $6, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %esi		; KNL-NEXT: vpinsrb $7, %eax, %xmm1, %xmm1
		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: kshiftlw $5, %k0, %k1		; KNL-NEXT: kshiftlw $5, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ebp		; KNL-NEXT: vpinsrb $8, %ecx, %xmm1, %xmm1
		; KNL-NEXT: kmovw %k1, %ecx
; KNL-NEXT: kshiftlw $4, %k0, %k1		; KNL-NEXT: kshiftlw $4, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ebx		; KNL-NEXT: vpinsrb $9, %eax, %xmm1, %xmm1
		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: kshiftlw $3, %k0, %k1		; KNL-NEXT: kshiftlw $3, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %eax		; KNL-NEXT: vpinsrb $10, %ecx, %xmm1, %xmm1
		; KNL-NEXT: kmovw %k1, %ecx
; KNL-NEXT: kshiftlw $2, %k0, %k1		; KNL-NEXT: kshiftlw $2, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: kmovw %k1, %ecx		; KNL-NEXT: vpinsrb $11, %eax, %xmm1, %xmm1
		; KNL-NEXT: kmovw %k1, %eax
; KNL-NEXT: kshiftlw $1, %k0, %k1		; KNL-NEXT: kshiftlw $1, %k0, %k1
; KNL-NEXT: kshiftrw $15, %k1, %k1		; KNL-NEXT: kshiftrw $15, %k1, %k1
; KNL-NEXT: vmovd %r9d, %xmm0		; KNL-NEXT: vpinsrb $12, %ecx, %xmm1, %xmm1
; KNL-NEXT: kmovw %k1, %r9d		; KNL-NEXT: kmovw %k1, %ecx
; KNL-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0		; KNL-NEXT: vptestmd %zmm0, %zmm0, %k1
; KNL-NEXT: vpinsrb $2, %r10d, %xmm0, %xmm0		; KNL-NEXT: vpinsrb $13, %eax, %xmm1, %xmm0
; KNL-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0		; KNL-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
; KNL-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
; KNL-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
; KNL-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
; KNL-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
; KNL-NEXT: vpinsrb $8, %edx, %xmm0, %xmm0
; KNL-NEXT: vpinsrb $9, %esi, %xmm0, %xmm0
; KNL-NEXT: vpinsrb $10, %ebp, %xmm0, %xmm0
; KNL-NEXT: vpinsrb $11, %ebx, %xmm0, %xmm0
; KNL-NEXT: vpinsrb $12, %eax, %xmm0, %xmm0
; KNL-NEXT: kshiftrw $15, %k0, %k0		; KNL-NEXT: kshiftrw $15, %k0, %k0
; KNL-NEXT: vpinsrb $13, %ecx, %xmm0, %xmm0		; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $14, %r9d, %xmm0, %xmm0		; KNL-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
		; KNL-NEXT: vpmovsxbd %xmm0, %zmm0
		; KNL-NEXT: vpslld $31, %zmm0, %zmm0
		; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0
		; KNL-NEXT: kmovw %k0, 2(%rdi)
		; KNL-NEXT: kshiftlw $14, %k1, %k0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: kshiftlw $15, %k1, %k0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %ecx
		; KNL-NEXT: kshiftlw $13, %k1, %k0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: vmovd %ecx, %xmm0
		; KNL-NEXT: kmovw %k0, %ecx
		; KNL-NEXT: kshiftlw $12, %k1, %k0
		; KNL-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: kshiftlw $11, %k1, %k0
		; KNL-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %ecx
		; KNL-NEXT: kshiftlw $10, %k1, %k0
		; KNL-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: kshiftlw $9, %k1, %k0
		; KNL-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %ecx
		; KNL-NEXT: kshiftlw $8, %k1, %k0
		; KNL-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: kshiftlw $7, %k1, %k0
		; KNL-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %ecx
		; KNL-NEXT: kshiftlw $6, %k1, %k0
		; KNL-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: kshiftlw $5, %k1, %k0
		; KNL-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %ecx
		; KNL-NEXT: kshiftlw $4, %k1, %k0
		; KNL-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: kshiftlw $3, %k1, %k0
		; KNL-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %ecx
		; KNL-NEXT: kshiftlw $2, %k1, %k0
		; KNL-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %eax
		; KNL-NEXT: kshiftlw $1, %k1, %k0
		; KNL-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
		; KNL-NEXT: kshiftrw $15, %k0, %k0
		; KNL-NEXT: kmovw %k0, %ecx
		; KNL-NEXT: kshiftrw $15, %k1, %k0
		; KNL-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
		; KNL-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
; KNL-NEXT: kmovw %k0, %eax		; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0		; KNL-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
; KNL-NEXT: vpmovsxbd %xmm0, %zmm0		; KNL-NEXT: vpmovsxbd %xmm0, %zmm0
; KNL-NEXT: vpslld $31, %zmm0, %zmm0		; KNL-NEXT: vpslld $31, %zmm0, %zmm0
; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0		; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0
; KNL-NEXT: kmovw %k0, (%rdi)		; KNL-NEXT: kmovw %k0, (%rdi)
; KNL-NEXT: popq %rbx
; KNL-NEXT: popq %r12
; KNL-NEXT: popq %r13
; KNL-NEXT: popq %r14
; KNL-NEXT: popq %r15
; KNL-NEXT: popq %rbp
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: store_64i1:		; SKX-LABEL: store_64i1:
; SKX: ## BB#0:		; SKX: ## BB#0:
; SKX-NEXT: vpsllw $7, %zmm0, %zmm0		; SKX-NEXT: vpsllw $7, %zmm0, %zmm0
; SKX-NEXT: vpmovb2m %zmm0, %k0		; SKX-NEXT: vpmovb2m %zmm0, %k0
; SKX-NEXT: kmovq %k0, (%rdi)		; SKX-NEXT: kmovq %k0, (%rdi)
; SKX-NEXT: vzeroupper		; SKX-NEXT: vzeroupper
▲ Show 20 Lines • Show All 678 Lines • Show Last 20 Lines

test/CodeGen/X86/avx512-vec-cmp.ll

	Show First 20 Lines • Show All 571 Lines • ▼ Show 20 Lines
	; KNL-NEXT: kshiftrw $15, %k1, %k1			; KNL-NEXT: kshiftrw $15, %k1, %k1
	; KNL-NEXT: kmovw %k1, %eax			; KNL-NEXT: kmovw %k1, %eax
	; KNL-NEXT: vpinsrb $14, %eax, %xmm0, %xmm0			; KNL-NEXT: vpinsrb $14, %eax, %xmm0, %xmm0
	; KNL-NEXT: kshiftrw $15, %k0, %k0			; KNL-NEXT: kshiftrw $15, %k0, %k0
	; KNL-NEXT: kmovw %k0, %eax			; KNL-NEXT: kmovw %k0, %eax
	; KNL-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; KNL-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; KNL-NEXT: vpmovsxbd %xmm0, %zmm0			; KNL-NEXT: vpmovsxbd %xmm0, %zmm0
	; KNL-NEXT: vpslld $31, %zmm0, %zmm0			; KNL-NEXT: vpslld $31, %zmm0, %zmm0
	; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0			; KNL-NEXT: vpcmpeqw %ymm6, %ymm2, %ymm1
	; KNL-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; KNL-NEXT: vpmovsxwd %ymm1, %zmm1
	; KNL-NEXT: vpcmpeqw %ymm6, %ymm2, %ymm0			; KNL-NEXT: vpslld $31, %zmm1, %zmm1
	; KNL-NEXT: vpmovsxwd %ymm0, %zmm0			; KNL-NEXT: vptestmd %zmm1, %zmm1, %k0
	; KNL-NEXT: vpslld $31, %zmm0, %zmm0
	; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0
	; KNL-NEXT: kshiftlw $14, %k0, %k1			; KNL-NEXT: kshiftlw $14, %k0, %k1
	; KNL-NEXT: kshiftrw $15, %k1, %k1			; KNL-NEXT: kshiftrw $15, %k1, %k1
	; KNL-NEXT: kmovw %k1, %eax			; KNL-NEXT: kmovw %k1, %eax
	; KNL-NEXT: kshiftlw $15, %k0, %k1			; KNL-NEXT: kshiftlw $15, %k0, %k1
	; KNL-NEXT: kshiftrw $15, %k1, %k1			; KNL-NEXT: kshiftrw $15, %k1, %k1
	; KNL-NEXT: kmovw %k1, %ecx			; KNL-NEXT: kmovw %k1, %ecx
	; KNL-NEXT: vmovd %ecx, %xmm0			; KNL-NEXT: vmovd %ecx, %xmm1
	; KNL-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0			; KNL-NEXT: vpinsrb $1, %eax, %xmm1, %xmm1
	; KNL-NEXT: kshiftlw $13, %k0, %k1			; KNL-NEXT: kshiftlw $13, %k0, %k1
	; KNL-NEXT: kshiftrw $15, %k1, %k1			; KNL-NEXT: kshiftrw $15, %k1, %k1
	; KNL-NEXT: kmovw %k1, %eax			; KNL-NEXT: kmovw %k1, %eax
	; KNL-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0			; KNL-NEXT: vpinsrb $2, %eax, %xmm1, %xmm1
	; KNL-NEXT: kshiftlw $12, %k0, %k1			; KNL-NEXT: kshiftlw $12, %k0, %k1
	; KNL-NEXT: kshiftrw $15, %k1, %k1			; KNL-NEXT: kshiftrw $15, %k1, %k1
	; KNL-NEXT: kmovw %k1, %eax			; KNL-NEXT: kmovw %k1, %eax
	; KNL-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0			; KNL-NEXT: vpinsrb $3, %eax, %xmm1, %xmm1
	; KNL-NEXT: kshiftlw $11, %k0, %k1			; KNL-NEXT: kshiftlw $11, %k0, %k1
	; KNL-NEXT: kshiftrw $15, %k1, %k1			; KNL-NEXT: kshiftrw $15, %k1, %k1
	; KNL-NEXT: kmovw %k1, %eax			; KNL-NEXT: kmovw %k1, %eax
	; KNL-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0			; KNL-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; KNL-NEXT: kshiftlw $10, %k0, %k1			; KNL-NEXT: kshiftlw $10, %k0, %k1
	; KNL-NEXT: kshiftrw $15, %k1, %k1			; KNL-NEXT: kshiftrw $15, %k1, %k1
	; KNL-NEXT: kmovw %k1, %eax			; KNL-NEXT: kmovw %k1, %eax
	; KNL-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; KNL-NEXT: vpinsrb $5, %eax, %xmm1, %xmm1
	; KNL-NEXT: kshiftlw $9, %k0, %k1			; KNL-NEXT: kshiftlw $9, %k0, %k1
	; KNL-NEXT: kshiftrw $15, %k1, %k1			; KNL-NEXT: kshiftrw $15, %k1, %k1
	; KNL-NEXT: kmovw %k1, %eax			; KNL-NEXT: kmovw %k1, %eax
	; KNL-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0			; KNL-NEXT: vpinsrb $6, %eax, %xmm1, %xmm1
	; KNL-NEXT: kshiftlw $8, %k0, %k1			; KNL-NEXT: kshiftlw $8, %k0, %k1
	; KNL-NEXT: kshiftrw $15, %k1, %k1			; KNL-NEXT: kshiftrw $15, %k1, %k1
	; KNL-NEXT: kmovw %k1, %eax			; KNL-NEXT: kmovw %k1, %eax
	; KNL-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; KNL-NEXT: vpinsrb $7, %eax, %xmm1, %xmm1
	; KNL-NEXT: kshiftlw $7, %k0, %k1			; KNL-NEXT: kshiftlw $7, %k0, %k1
	; KNL-NEXT: kshiftrw $15, %k1, %k1			; KNL-NEXT: kshiftrw $15, %k1, %k1
	; KNL-NEXT: kmovw %k1, %eax			; KNL-NEXT: kmovw %k1, %eax
	; KNL-NEXT: vpinsrb $8, %eax, %xmm0, %xmm0			; KNL-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; KNL-NEXT: kshiftlw $6, %k0, %k1			; KNL-NEXT: kshiftlw $6, %k0, %k1
	; KNL-NEXT: kshiftrw $15, %k1, %k1			; KNL-NEXT: kshiftrw $15, %k1, %k1
	; KNL-NEXT: kmovw %k1, %eax			; KNL-NEXT: kmovw %k1, %eax
	; KNL-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0			; KNL-NEXT: vpinsrb $9, %eax, %xmm1, %xmm1
	; KNL-NEXT: kshiftlw $5, %k0, %k1			; KNL-NEXT: kshiftlw $5, %k0, %k1
	; KNL-NEXT: kshiftrw $15, %k1, %k1			; KNL-NEXT: kshiftrw $15, %k1, %k1
	; KNL-NEXT: kmovw %k1, %eax			; KNL-NEXT: kmovw %k1, %eax
	; KNL-NEXT: vpinsrb $10, %eax, %xmm0, %xmm0			; KNL-NEXT: vpinsrb $10, %eax, %xmm1, %xmm1
	; KNL-NEXT: kshiftlw $4, %k0, %k1			; KNL-NEXT: kshiftlw $4, %k0, %k1
	; KNL-NEXT: kshiftrw $15, %k1, %k1			; KNL-NEXT: kshiftrw $15, %k1, %k1
	; KNL-NEXT: kmovw %k1, %eax			; KNL-NEXT: kmovw %k1, %eax
	; KNL-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; KNL-NEXT: vpinsrb $11, %eax, %xmm1, %xmm1
	; KNL-NEXT: kshiftlw $3, %k0, %k1			; KNL-NEXT: kshiftlw $3, %k0, %k1
	; KNL-NEXT: kshiftrw $15, %k1, %k1			; KNL-NEXT: kshiftrw $15, %k1, %k1
	; KNL-NEXT: kmovw %k1, %eax			; KNL-NEXT: kmovw %k1, %eax
	; KNL-NEXT: vpinsrb $12, %eax, %xmm0, %xmm0			; KNL-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; KNL-NEXT: kshiftlw $2, %k0, %k1			; KNL-NEXT: kshiftlw $2, %k0, %k1
	; KNL-NEXT: kshiftrw $15, %k1, %k1			; KNL-NEXT: kshiftrw $15, %k1, %k1
	; KNL-NEXT: kmovw %k1, %eax			; KNL-NEXT: kmovw %k1, %eax
	; KNL-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; KNL-NEXT: kshiftlw $1, %k0, %k1			; KNL-NEXT: kshiftlw $1, %k0, %k1
	; KNL-NEXT: kshiftrw $15, %k1, %k1			; KNL-NEXT: kshiftrw $15, %k1, %k1
	; KNL-NEXT: kmovw %k1, %eax			; KNL-NEXT: kmovw %k1, %ecx
	; KNL-NEXT: vpinsrb $14, %eax, %xmm0, %xmm0			; KNL-NEXT: vptestmd %zmm0, %zmm0, %k1
				; KNL-NEXT: vpinsrb $13, %eax, %xmm1, %xmm0
				; KNL-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; KNL-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; KNL-NEXT: kshiftrw $15, %k0, %k0			; KNL-NEXT: kshiftrw $15, %k0, %k0
	; KNL-NEXT: kmovw %k0, %eax			; KNL-NEXT: kmovw %k0, %eax
	; KNL-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; KNL-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; KNL-NEXT: vpmovsxbd %xmm0, %zmm0			; KNL-NEXT: vpmovsxbd %xmm0, %zmm0
	; KNL-NEXT: vpslld $31, %zmm0, %zmm0			; KNL-NEXT: vpslld $31, %zmm0, %zmm0
	; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0			; KNL-NEXT: vptestmd %zmm0, %zmm0, %k0
	; KNL-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; KNL-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; KNL-NEXT: movl (%rsp), %ecx			; KNL-NEXT: movl (%rsp), %ecx
	▲ Show 20 Lines • Show All 655 Lines • Show Last 20 Lines

test/CodeGen/X86/avx512bw-intrinsics-upgrade.ll

	Show First 20 Lines • Show All 1,679 Lines • ▼ Show 20 Lines
	; AVX512F-32-NEXT: .cfi_def_cfa_offset 12			; AVX512F-32-NEXT: .cfi_def_cfa_offset 12
	; AVX512F-32-NEXT: subl $60, %esp			; AVX512F-32-NEXT: subl $60, %esp
	; AVX512F-32-NEXT: .Lcfi7:			; AVX512F-32-NEXT: .Lcfi7:
	; AVX512F-32-NEXT: .cfi_def_cfa_offset 72			; AVX512F-32-NEXT: .cfi_def_cfa_offset 72
	; AVX512F-32-NEXT: .Lcfi8:			; AVX512F-32-NEXT: .Lcfi8:
	; AVX512F-32-NEXT: .cfi_offset %esi, -12			; AVX512F-32-NEXT: .cfi_offset %esi, -12
	; AVX512F-32-NEXT: .Lcfi9:			; AVX512F-32-NEXT: .Lcfi9:
	; AVX512F-32-NEXT: .cfi_offset %ebx, -8			; AVX512F-32-NEXT: .cfi_offset %ebx, -8
	; AVX512F-32-NEXT: vmovdqa64 %zmm1, %zmm6
	; AVX512F-32-NEXT: vmovdqa64 %zmm0, %zmm5
	; AVX512F-32-NEXT: movl {{[0-9]+}}(%esp), %ecx			; AVX512F-32-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; AVX512F-32-NEXT: movb %cl, %al			; AVX512F-32-NEXT: movb %cl, %al
	; AVX512F-32-NEXT: shrb $5, %al			; AVX512F-32-NEXT: shrb $5, %al
	; AVX512F-32-NEXT: andb $1, %al			; AVX512F-32-NEXT: andb $1, %al
	; AVX512F-32-NEXT: movb %cl, %bl			; AVX512F-32-NEXT: movb %cl, %bl
	; AVX512F-32-NEXT: andb $15, %bl			; AVX512F-32-NEXT: andb $15, %bl
	; AVX512F-32-NEXT: movb %cl, %dl			; AVX512F-32-NEXT: movb %cl, %dl
	; AVX512F-32-NEXT: andb $2, %dl			; AVX512F-32-NEXT: andb $2, %dl
	; AVX512F-32-NEXT: shrb %dl			; AVX512F-32-NEXT: shrb %dl
	; AVX512F-32-NEXT: kmovd %edx, %k0			; AVX512F-32-NEXT: kmovd %edx, %k0
	; AVX512F-32-NEXT: movb %bl, %dl			; AVX512F-32-NEXT: movb %bl, %dl
	; AVX512F-32-NEXT: shrb $2, %bl			; AVX512F-32-NEXT: shrb $2, %bl
	; AVX512F-32-NEXT: kmovd %ebx, %k1			; AVX512F-32-NEXT: kmovd %ebx, %k1
	; AVX512F-32-NEXT: movb %cl, %bl			; AVX512F-32-NEXT: movb %cl, %bl
	; AVX512F-32-NEXT: shrb $4, %bl			; AVX512F-32-NEXT: shrb $4, %bl
	; AVX512F-32-NEXT: shrb $3, %dl			; AVX512F-32-NEXT: shrb $3, %dl
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: vpsllw $8, %xmm2, %xmm2			; AVX512F-32-NEXT: vpsllw $8, %xmm2, %xmm2
	; AVX512F-32-NEXT: kmovd %ecx, %k0			; AVX512F-32-NEXT: kmovd %ecx, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm3
	; AVX512F-32-NEXT: vpbroadcastw %xmm3, %xmm3			; AVX512F-32-NEXT: vpbroadcastw %xmm3, %xmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm2, %ymm3, %ymm3			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm2, %ymm3, %ymm3
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm3[0,1,2,3],zmm2[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm3[0,1,2,3],zmm2[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: kmovd %edx, %k0			; AVX512F-32-NEXT: kmovd %edx, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vpslld $24, %xmm3, %xmm3			; AVX512F-32-NEXT: vpslld $24, %xmm3, %xmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm2, %ymm3, %ymm3			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm2, %ymm3, %ymm3
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm3[0,1,2,3],zmm2[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm3[0,1,2,3],zmm2[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: kmovd %ebx, %k0			; AVX512F-32-NEXT: kmovd %ebx, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vpbroadcastd %xmm3, %xmm3			; AVX512F-32-NEXT: vpbroadcastd %xmm3, %xmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm2, %ymm3, %ymm3			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm2, %ymm3, %ymm3
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm3[0,1,2,3],zmm2[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm3[0,1,2,3],zmm2[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: kmovd %eax, %k0			; AVX512F-32-NEXT: kmovd %eax, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vpsllq $40, %xmm3, %xmm3			; AVX512F-32-NEXT: vpsllq $40, %xmm3, %xmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm2, %ymm3, %ymm3			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm2, %ymm3, %ymm3
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm3[0,1,2,3],zmm2[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm3[0,1,2,3],zmm2[4,5,6,7]
	; AVX512F-32-NEXT: movb %cl, %al			; AVX512F-32-NEXT: movb %cl, %al
	; AVX512F-32-NEXT: shrb $6, %al			; AVX512F-32-NEXT: shrb $6, %al
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %cl, %al			; AVX512F-32-NEXT: movb %cl, %al
	; AVX512F-32-NEXT: shrb $7, %al			; AVX512F-32-NEXT: shrb $7, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpsllq $56, %xmm2, %xmm2			; AVX512F-32-NEXT: vpsllq $56, %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %ch, %al			; AVX512F-32-NEXT: movb %ch, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastq %xmm2, %xmm2			; AVX512F-32-NEXT: vpbroadcastq %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: andb $2, %al			; AVX512F-32-NEXT: andb $2, %al
	; AVX512F-32-NEXT: shrb %al			; AVX512F-32-NEXT: shrb %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4,5,6]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4,5,6]
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %ch, %dl			; AVX512F-32-NEXT: movb %ch, %dl
	; AVX512F-32-NEXT: andb $15, %dl			; AVX512F-32-NEXT: andb $15, %dl
	; AVX512F-32-NEXT: movb %dl, %al			; AVX512F-32-NEXT: movb %dl, %al
	; AVX512F-32-NEXT: shrb $2, %dl			; AVX512F-32-NEXT: shrb $2, %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: shrb $3, %al			; AVX512F-32-NEXT: shrb $3, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4]
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: andl $61440, %eax # imm = 0xF000			; AVX512F-32-NEXT: andl $61440, %eax # imm = 0xF000
	; AVX512F-32-NEXT: shrl $12, %eax			; AVX512F-32-NEXT: shrl $12, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastd %xmm2, %xmm2			; AVX512F-32-NEXT: vpbroadcastd %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: shrl $13, %eax			; AVX512F-32-NEXT: shrl $13, %eax
	; AVX512F-32-NEXT: andb $1, %al			; AVX512F-32-NEXT: andb $1, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2]
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: andl $49152, %eax # imm = 0xC000			; AVX512F-32-NEXT: andl $49152, %eax # imm = 0xC000
	; AVX512F-32-NEXT: shrl $14, %eax			; AVX512F-32-NEXT: shrl $14, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: andl $32768, %eax # imm = 0x8000			; AVX512F-32-NEXT: andl $32768, %eax # imm = 0x8000
	; AVX512F-32-NEXT: shrl $15, %eax			; AVX512F-32-NEXT: shrl $15, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0]
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: shrl $16, %eax			; AVX512F-32-NEXT: shrl $16, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %al, %dl			; AVX512F-32-NEXT: movb %al, %dl
	; AVX512F-32-NEXT: andb $2, %dl			; AVX512F-32-NEXT: andb $2, %dl
	; AVX512F-32-NEXT: shrb %dl			; AVX512F-32-NEXT: shrb %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpsllw $8, %xmm2, %xmm2			; AVX512F-32-NEXT: vpsllw $8, %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %al, %bl			; AVX512F-32-NEXT: movb %al, %bl
	; AVX512F-32-NEXT: andb $15, %bl			; AVX512F-32-NEXT: andb $15, %bl
	; AVX512F-32-NEXT: movb %bl, %dl			; AVX512F-32-NEXT: movb %bl, %dl
	; AVX512F-32-NEXT: shrb $2, %bl			; AVX512F-32-NEXT: shrb $2, %bl
	; AVX512F-32-NEXT: kmovd %ebx, %k1			; AVX512F-32-NEXT: kmovd %ebx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: shrb $3, %dl			; AVX512F-32-NEXT: shrb $3, %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslld $24, %xmm2, %xmm2			; AVX512F-32-NEXT: vpslld $24, %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %al, %dl			; AVX512F-32-NEXT: movb %al, %dl
	; AVX512F-32-NEXT: shrb $4, %dl			; AVX512F-32-NEXT: shrb $4, %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastd %xmm2, %xmm2			; AVX512F-32-NEXT: vpbroadcastd %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %al, %dl			; AVX512F-32-NEXT: movb %al, %dl
	; AVX512F-32-NEXT: shrb $5, %dl			; AVX512F-32-NEXT: shrb $5, %dl
	; AVX512F-32-NEXT: andb $1, %dl			; AVX512F-32-NEXT: andb $1, %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpsllq $40, %xmm2, %xmm2			; AVX512F-32-NEXT: vpsllq $40, %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %al, %dl			; AVX512F-32-NEXT: movb %al, %dl
	; AVX512F-32-NEXT: shrb $6, %dl			; AVX512F-32-NEXT: shrb $6, %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill> %EAX<def>			; AVX512F-32-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill> %EAX<def>
	; AVX512F-32-NEXT: shrb $7, %al			; AVX512F-32-NEXT: shrb $7, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpsllq $56, %xmm2, %xmm2			; AVX512F-32-NEXT: vpsllq $56, %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: shrl $24, %eax			; AVX512F-32-NEXT: shrl $24, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastq %xmm2, %ymm2			; AVX512F-32-NEXT: vpbroadcastq %xmm2, %ymm3
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm2 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm2, %ymm4, %ymm3, %ymm3
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm3 = zmm3[0,1,2,3],zmm4[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm3, %k0
	; AVX512F-32-NEXT: movb %al, %dl			; AVX512F-32-NEXT: movb %al, %dl
	; AVX512F-32-NEXT: andb $2, %dl			; AVX512F-32-NEXT: andb $2, %dl
	; AVX512F-32-NEXT: shrb %dl			; AVX512F-32-NEXT: shrb %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm3
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4,5,6]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm3 = zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm3[0,1,2,3,4,5,6]
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm3, %ymm0, %ymm4
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm5
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm2 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm2, %ymm5, %ymm4, %ymm4
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm4 = zmm4[0,1,2,3],zmm5[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm4, %k0
	; AVX512F-32-NEXT: movb %al, %dl			; AVX512F-32-NEXT: movb %al, %dl
	; AVX512F-32-NEXT: andb $15, %dl			; AVX512F-32-NEXT: andb $15, %dl
	; AVX512F-32-NEXT: movb %dl, %al			; AVX512F-32-NEXT: movb %dl, %al
	; AVX512F-32-NEXT: shrb $2, %dl			; AVX512F-32-NEXT: shrb $2, %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm4
	; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2			; AVX512F-32-NEXT: vpbroadcastw %xmm4, %xmm4
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm4, %ymm0, %ymm5
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm6
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm2 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm2, %ymm6, %ymm5, %ymm5
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm5 = zmm5[0,1,2,3],zmm6[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm5, %k0
	; AVX512F-32-NEXT: shrb $3, %al			; AVX512F-32-NEXT: shrb $3, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm5
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm5 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm5[0,1,2,3,4]
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm5, %ymm0, %ymm5
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm4			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm7
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm3 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm6 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm3, %ymm4, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm6, %ymm7, %ymm5, %ymm5
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm4[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm5 = zmm5[0,1,2,3],zmm7[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm5, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: shrl $28, %eax			; AVX512F-32-NEXT: shrl $28, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm5
	; AVX512F-32-NEXT: vpbroadcastd %xmm2, %xmm2			; AVX512F-32-NEXT: vpbroadcastd %xmm5, %xmm5
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm5, %ymm0, %ymm5
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm4			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm7
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm2 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm4, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm2, %ymm7, %ymm5, %ymm5
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm4[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm5 = zmm5[0,1,2,3],zmm7[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm5, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: movl %ecx, %esi			; AVX512F-32-NEXT: movl %ecx, %esi
	; AVX512F-32-NEXT: shrl $29, %eax			; AVX512F-32-NEXT: shrl $29, %eax
	; AVX512F-32-NEXT: andb $1, %al			; AVX512F-32-NEXT: andb $1, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm5
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm5 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm5[0,1,2]
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm5, %ymm0, %ymm7
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm1 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm3 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm1, %ymm0, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm3, %ymm2, %ymm7, %ymm7
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm0 = zmm2[0,1,2,3],zmm0[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm7[0,1,2,3],zmm2[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %esi, %eax			; AVX512F-32-NEXT: movl %esi, %eax
	; AVX512F-32-NEXT: shrl $30, %eax			; AVX512F-32-NEXT: shrl $30, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm1			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm2 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255]
	; AVX512F-32-NEXT: vpblendvb %ymm2, %ymm0, %ymm1, %ymm1			; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm0 = zmm1[0,1,2,3],zmm0[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %esi, %eax			; AVX512F-32-NEXT: movl %esi, %eax
	; AVX512F-32-NEXT: shrl $31, %eax			; AVX512F-32-NEXT: shrl $31, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm0[0]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0]
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm1, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm0 = zmm0[0,1,2,3],zmm1[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl {{[0-9]+}}(%esp), %ecx			; AVX512F-32-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; AVX512F-32-NEXT: kmovd %ecx, %k1			; AVX512F-32-NEXT: kmovd %ecx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm2, %ymm3
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm7			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm1, %ymm7, %ymm1			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm3, %ymm4, %ymm3
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm3, %zmm2, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %cl, %al			; AVX512F-32-NEXT: movb %cl, %al
	; AVX512F-32-NEXT: andb $2, %al			; AVX512F-32-NEXT: andb $2, %al
	; AVX512F-32-NEXT: shrb %al			; AVX512F-32-NEXT: shrb %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpsllw $8, %xmm0, %xmm0			; AVX512F-32-NEXT: vpsllw $8, %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %cl, %dl			; AVX512F-32-NEXT: movb %cl, %dl
	; AVX512F-32-NEXT: andb $15, %dl			; AVX512F-32-NEXT: andb $15, %dl
	; AVX512F-32-NEXT: movb %dl, %al			; AVX512F-32-NEXT: movb %dl, %al
	; AVX512F-32-NEXT: shrb $2, %dl			; AVX512F-32-NEXT: shrb $2, %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: shrb $3, %al			; AVX512F-32-NEXT: shrb $3, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslld $24, %xmm0, %xmm0			; AVX512F-32-NEXT: vpslld $24, %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %cl, %al			; AVX512F-32-NEXT: movb %cl, %al
	; AVX512F-32-NEXT: shrb $4, %al			; AVX512F-32-NEXT: shrb $4, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastd %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastd %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %cl, %al			; AVX512F-32-NEXT: movb %cl, %al
	; AVX512F-32-NEXT: shrb $5, %al			; AVX512F-32-NEXT: shrb $5, %al
	; AVX512F-32-NEXT: andb $1, %al			; AVX512F-32-NEXT: andb $1, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpsllq $40, %xmm0, %xmm0			; AVX512F-32-NEXT: vpsllq $40, %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %cl, %al			; AVX512F-32-NEXT: movb %cl, %al
	; AVX512F-32-NEXT: shrb $6, %al			; AVX512F-32-NEXT: shrb $6, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %cl, %al			; AVX512F-32-NEXT: movb %cl, %al
	; AVX512F-32-NEXT: shrb $7, %al			; AVX512F-32-NEXT: shrb $7, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpsllq $56, %xmm0, %xmm0			; AVX512F-32-NEXT: vpsllq $56, %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %ch, %al			; AVX512F-32-NEXT: movb %ch, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastq %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastq %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: andb $2, %al			; AVX512F-32-NEXT: andb $2, %al
	; AVX512F-32-NEXT: shrb %al			; AVX512F-32-NEXT: shrb %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4,5,6]
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %ch, %dl			; AVX512F-32-NEXT: movb %ch, %dl
	; AVX512F-32-NEXT: andb $15, %dl			; AVX512F-32-NEXT: andb $15, %dl
	; AVX512F-32-NEXT: movb %dl, %al			; AVX512F-32-NEXT: movb %dl, %al
	; AVX512F-32-NEXT: shrb $2, %dl			; AVX512F-32-NEXT: shrb $2, %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: shrb $3, %al			; AVX512F-32-NEXT: shrb $3, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm0[0,1,2,3,4]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4]
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: andl $61440, %eax # imm = 0xF000			; AVX512F-32-NEXT: andl $61440, %eax # imm = 0xF000
	; AVX512F-32-NEXT: shrl $12, %eax			; AVX512F-32-NEXT: shrl $12, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastd %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastd %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: shrl $13, %eax			; AVX512F-32-NEXT: shrl $13, %eax
	; AVX512F-32-NEXT: andb $1, %al			; AVX512F-32-NEXT: andb $1, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm0[0,1,2]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2]
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: andl $49152, %eax # imm = 0xC000			; AVX512F-32-NEXT: andl $49152, %eax # imm = 0xC000
	; AVX512F-32-NEXT: shrl $14, %eax			; AVX512F-32-NEXT: shrl $14, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: andl $32768, %eax # imm = 0x8000			; AVX512F-32-NEXT: andl $32768, %eax # imm = 0x8000
	; AVX512F-32-NEXT: shrl $15, %eax			; AVX512F-32-NEXT: shrl $15, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm0[0]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0]
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %ebx			; AVX512F-32-NEXT: movl %ecx, %ebx
	; AVX512F-32-NEXT: shrl $16, %ebx			; AVX512F-32-NEXT: shrl $16, %ebx
	; AVX512F-32-NEXT: kmovd %ebx, %k1			; AVX512F-32-NEXT: kmovd %ebx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %bl, %dl			; AVX512F-32-NEXT: movb %bl, %dl
	; AVX512F-32-NEXT: andb $2, %dl			; AVX512F-32-NEXT: andb $2, %dl
	; AVX512F-32-NEXT: shrb %dl			; AVX512F-32-NEXT: shrb %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpsllw $8, %xmm0, %xmm0			; AVX512F-32-NEXT: vpsllw $8, %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: movb %bl, %al			; AVX512F-32-NEXT: movb %bl, %al
	; AVX512F-32-NEXT: andb $15, %al			; AVX512F-32-NEXT: andb $15, %al
	; AVX512F-32-NEXT: movb %al, %dl			; AVX512F-32-NEXT: movb %al, %dl
	; AVX512F-32-NEXT: shrb $2, %al			; AVX512F-32-NEXT: shrb $2, %al
	; AVX512F-32-NEXT: kmovd %eax, %k0			; AVX512F-32-NEXT: kmovd %eax, %k0
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k1			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k1
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: shrb $3, %dl			; AVX512F-32-NEXT: shrb $3, %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslld $24, %xmm0, %xmm0			; AVX512F-32-NEXT: vpslld $24, %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %bl, %al			; AVX512F-32-NEXT: movb %bl, %al
	; AVX512F-32-NEXT: shrb $4, %al			; AVX512F-32-NEXT: shrb $4, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastd %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastd %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %bl, %al			; AVX512F-32-NEXT: movb %bl, %al
	; AVX512F-32-NEXT: shrb $5, %al			; AVX512F-32-NEXT: shrb $5, %al
	; AVX512F-32-NEXT: andb $1, %al			; AVX512F-32-NEXT: andb $1, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpsllq $40, %xmm0, %xmm0			; AVX512F-32-NEXT: vpsllq $40, %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %bl, %al			; AVX512F-32-NEXT: movb %bl, %al
	; AVX512F-32-NEXT: shrb $6, %al			; AVX512F-32-NEXT: shrb $6, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: # kill: %BL<def> %BL<kill> %EBX<kill> %EBX<def>			; AVX512F-32-NEXT: # kill: %BL<def> %BL<kill> %EBX<kill> %EBX<def>
	; AVX512F-32-NEXT: shrb $7, %bl			; AVX512F-32-NEXT: shrb $7, %bl
	; AVX512F-32-NEXT: kmovd %ebx, %k1			; AVX512F-32-NEXT: kmovd %ebx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpsllq $56, %xmm0, %xmm0			; AVX512F-32-NEXT: vpsllq $56, %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: shrl $24, %eax			; AVX512F-32-NEXT: shrl $24, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastq %xmm0, %ymm0			; AVX512F-32-NEXT: vpbroadcastq %xmm2, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %al, %dl			; AVX512F-32-NEXT: movb %al, %dl
	; AVX512F-32-NEXT: andb $2, %dl			; AVX512F-32-NEXT: andb $2, %dl
	; AVX512F-32-NEXT: shrb %dl			; AVX512F-32-NEXT: shrb %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4,5,6]
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: movb %al, %dl			; AVX512F-32-NEXT: movb %al, %dl
	; AVX512F-32-NEXT: andb $15, %dl			; AVX512F-32-NEXT: andb $15, %dl
	; AVX512F-32-NEXT: movb %dl, %al			; AVX512F-32-NEXT: movb %dl, %al
	; AVX512F-32-NEXT: shrb $2, %dl			; AVX512F-32-NEXT: shrb $2, %dl
	; AVX512F-32-NEXT: kmovd %edx, %k0			; AVX512F-32-NEXT: kmovd %edx, %k0
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k1			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k1
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: shrb $3, %al			; AVX512F-32-NEXT: shrb $3, %al
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: kmovd %eax, %k0			; AVX512F-32-NEXT: kmovd %eax, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm1 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm1[0,1,2,3,4]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm3 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm3[0,1,2,3,4]
	; AVX512F-32-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm1			; AVX512F-32-NEXT: vinserti128 $1, %xmm3, %ymm0, %ymm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm0, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm2, %ymm4
	; AVX512F-32-NEXT: vpblendvb %ymm3, %ymm4, %ymm1, %ymm1			; AVX512F-32-NEXT: vpblendvb %ymm6, %ymm4, %ymm3, %ymm3
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: shrl $29, %eax			; AVX512F-32-NEXT: shrl $29, %eax
	; AVX512F-32-NEXT: andb $1, %al			; AVX512F-32-NEXT: andb $1, %al
	; AVX512F-32-NEXT: kmovd %eax, %k0			; AVX512F-32-NEXT: kmovd %eax, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: shrl $28, %eax			; AVX512F-32-NEXT: shrl $28, %eax
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm3, %zmm2, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k1			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm2, %ymm3
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm4
	; AVX512F-32-NEXT: vpbroadcastd %xmm3, %xmm3			; AVX512F-32-NEXT: vpbroadcastd %xmm4, %xmm4
	; AVX512F-32-NEXT: vinserti128 $1, %xmm3, %ymm0, %ymm3			; AVX512F-32-NEXT: vinserti128 $1, %xmm4, %ymm0, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm1, %ymm3, %ymm1			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm3, %ymm4, %ymm3
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm3, %zmm2, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k1			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm2, %ymm3
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm4
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm3 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm3[0,1,2]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm4 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm4[0,1,2]
	; AVX512F-32-NEXT: vinserti128 $1, %xmm3, %ymm0, %ymm3			; AVX512F-32-NEXT: vinserti128 $1, %xmm4, %ymm0, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm1, %ymm3, %ymm1			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm3, %ymm4, %ymm3
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: shrl $30, %eax			; AVX512F-32-NEXT: shrl $30, %eax
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm3, %zmm2, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm2, %ymm3
	; AVX512F-32-NEXT: kmovd %eax, %k0			; AVX512F-32-NEXT: kmovd %eax, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm4
	; AVX512F-32-NEXT: vpbroadcastw %xmm3, %xmm3			; AVX512F-32-NEXT: vpbroadcastw %xmm4, %xmm4
	; AVX512F-32-NEXT: vinserti128 $1, %xmm3, %ymm0, %ymm3			; AVX512F-32-NEXT: vinserti128 $1, %xmm4, %ymm0, %ymm4
	; AVX512F-32-NEXT: vpblendvb %ymm2, %ymm1, %ymm3, %ymm1			; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm3, %ymm4, %ymm3
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm3, %zmm2, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: shrl $31, %eax			; AVX512F-32-NEXT: shrl $31, %eax
	; AVX512F-32-NEXT: kshiftlq $1, %k0, %k0			; AVX512F-32-NEXT: kshiftlq $1, %k0, %k0
	; AVX512F-32-NEXT: kshiftrq $1, %k0, %k0			; AVX512F-32-NEXT: kshiftrq $1, %k0, %k0
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: kshiftlq $63, %k1, %k1			; AVX512F-32-NEXT: kshiftlq $63, %k1, %k1
	; AVX512F-32-NEXT: korq %k1, %k0, %k1			; AVX512F-32-NEXT: korq %k1, %k0, %k1
	; AVX512F-32-NEXT: vpcmpeqb %zmm6, %zmm5, %k0 {%k1}			; AVX512F-32-NEXT: vpcmpeqb %zmm1, %zmm0, %k0 {%k1}
	; AVX512F-32-NEXT: vpcmpgtb %zmm5, %zmm6, %k2 {%k1}
	; AVX512F-32-NEXT: vpcmpleb %zmm6, %zmm5, %k3 {%k1}
	; AVX512F-32-NEXT: vpcmpneqb %zmm6, %zmm5, %k4 {%k1}
	; AVX512F-32-NEXT: vpcmpleb %zmm5, %zmm6, %k5 {%k1}
	; AVX512F-32-NEXT: vpcmpgtb %zmm6, %zmm5, %k1 {%k1}
	; AVX512F-32-NEXT: kmovq %k0, (%esp)			; AVX512F-32-NEXT: kmovq %k0, (%esp)
	; AVX512F-32-NEXT: movl (%esp), %eax			; AVX512F-32-NEXT: movl (%esp), %eax
	; AVX512F-32-NEXT: movl {{[0-9]+}}(%esp), %edx			; AVX512F-32-NEXT: movl {{[0-9]+}}(%esp), %edx
	; AVX512F-32-NEXT: kmovq %k2, {{[0-9]+}}(%esp)			; AVX512F-32-NEXT: vpcmpgtb %zmm0, %zmm1, %k0 {%k1}
				; AVX512F-32-NEXT: kmovq %k0, {{[0-9]+}}(%esp)
	; AVX512F-32-NEXT: addl {{[0-9]+}}(%esp), %eax			; AVX512F-32-NEXT: addl {{[0-9]+}}(%esp), %eax
	; AVX512F-32-NEXT: adcxl {{[0-9]+}}(%esp), %edx			; AVX512F-32-NEXT: adcxl {{[0-9]+}}(%esp), %edx
	; AVX512F-32-NEXT: kmovq %k3, {{[0-9]+}}(%esp)			; AVX512F-32-NEXT: vpcmpleb %zmm1, %zmm0, %k0 {%k1}
				; AVX512F-32-NEXT: kmovq %k0, {{[0-9]+}}(%esp)
	; AVX512F-32-NEXT: addl {{[0-9]+}}(%esp), %eax			; AVX512F-32-NEXT: addl {{[0-9]+}}(%esp), %eax
	; AVX512F-32-NEXT: adcxl {{[0-9]+}}(%esp), %edx			; AVX512F-32-NEXT: adcxl {{[0-9]+}}(%esp), %edx
	; AVX512F-32-NEXT: kxorq %k0, %k0, %k0			; AVX512F-32-NEXT: kxorq %k0, %k0, %k0
	; AVX512F-32-NEXT: kmovq %k0, {{[0-9]+}}(%esp)			; AVX512F-32-NEXT: kmovq %k0, {{[0-9]+}}(%esp)
	; AVX512F-32-NEXT: orl {{[0-9]+}}(%esp), %edx			; AVX512F-32-NEXT: orl {{[0-9]+}}(%esp), %edx
	; AVX512F-32-NEXT: orl {{[0-9]+}}(%esp), %eax			; AVX512F-32-NEXT: orl {{[0-9]+}}(%esp), %eax
	; AVX512F-32-NEXT: kmovq %k4, {{[0-9]+}}(%esp)			; AVX512F-32-NEXT: vpcmpneqb %zmm1, %zmm0, %k0 {%k1}
				; AVX512F-32-NEXT: vpcmpleb %zmm0, %zmm1, %k2 {%k1}
				; AVX512F-32-NEXT: vpcmpgtb %zmm1, %zmm0, %k1 {%k1}
				; AVX512F-32-NEXT: kmovq %k0, {{[0-9]+}}(%esp)
	; AVX512F-32-NEXT: addl {{[0-9]+}}(%esp), %eax			; AVX512F-32-NEXT: addl {{[0-9]+}}(%esp), %eax
	; AVX512F-32-NEXT: adcxl {{[0-9]+}}(%esp), %edx			; AVX512F-32-NEXT: adcxl {{[0-9]+}}(%esp), %edx
	; AVX512F-32-NEXT: kmovq %k5, {{[0-9]+}}(%esp)			; AVX512F-32-NEXT: kmovq %k2, {{[0-9]+}}(%esp)
	; AVX512F-32-NEXT: addl {{[0-9]+}}(%esp), %eax			; AVX512F-32-NEXT: addl {{[0-9]+}}(%esp), %eax
	; AVX512F-32-NEXT: adcxl {{[0-9]+}}(%esp), %edx			; AVX512F-32-NEXT: adcxl {{[0-9]+}}(%esp), %edx
	; AVX512F-32-NEXT: kmovq %k1, {{[0-9]+}}(%esp)			; AVX512F-32-NEXT: kmovq %k1, {{[0-9]+}}(%esp)
	; AVX512F-32-NEXT: addl {{[0-9]+}}(%esp), %eax			; AVX512F-32-NEXT: addl {{[0-9]+}}(%esp), %eax
	; AVX512F-32-NEXT: adcxl {{[0-9]+}}(%esp), %edx			; AVX512F-32-NEXT: adcxl {{[0-9]+}}(%esp), %edx
	; AVX512F-32-NEXT: addl %esi, %eax			; AVX512F-32-NEXT: addl %esi, %eax
	; AVX512F-32-NEXT: adcxl %ecx, %edx			; AVX512F-32-NEXT: adcxl %ecx, %edx
	; AVX512F-32-NEXT: addl $60, %esp			; AVX512F-32-NEXT: addl $60, %esp
	▲ Show 20 Lines • Show All 135 Lines • ▼ Show 20 Lines
	; AVX512F-32-NEXT: .cfi_def_cfa_offset 12			; AVX512F-32-NEXT: .cfi_def_cfa_offset 12
	; AVX512F-32-NEXT: subl $60, %esp			; AVX512F-32-NEXT: subl $60, %esp
	; AVX512F-32-NEXT: .Lcfi13:			; AVX512F-32-NEXT: .Lcfi13:
	; AVX512F-32-NEXT: .cfi_def_cfa_offset 72			; AVX512F-32-NEXT: .cfi_def_cfa_offset 72
	; AVX512F-32-NEXT: .Lcfi14:			; AVX512F-32-NEXT: .Lcfi14:
	; AVX512F-32-NEXT: .cfi_offset %esi, -12			; AVX512F-32-NEXT: .cfi_offset %esi, -12
	; AVX512F-32-NEXT: .Lcfi15:			; AVX512F-32-NEXT: .Lcfi15:
	; AVX512F-32-NEXT: .cfi_offset %ebx, -8			; AVX512F-32-NEXT: .cfi_offset %ebx, -8
	; AVX512F-32-NEXT: vmovdqa64 %zmm1, %zmm6
	; AVX512F-32-NEXT: vmovdqa64 %zmm0, %zmm5
	; AVX512F-32-NEXT: movl {{[0-9]+}}(%esp), %ecx			; AVX512F-32-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; AVX512F-32-NEXT: movb %cl, %al			; AVX512F-32-NEXT: movb %cl, %al
	; AVX512F-32-NEXT: shrb $5, %al			; AVX512F-32-NEXT: shrb $5, %al
	; AVX512F-32-NEXT: andb $1, %al			; AVX512F-32-NEXT: andb $1, %al
	; AVX512F-32-NEXT: movb %cl, %bl			; AVX512F-32-NEXT: movb %cl, %bl
	; AVX512F-32-NEXT: andb $15, %bl			; AVX512F-32-NEXT: andb $15, %bl
	; AVX512F-32-NEXT: movb %cl, %dl			; AVX512F-32-NEXT: movb %cl, %dl
	; AVX512F-32-NEXT: andb $2, %dl			; AVX512F-32-NEXT: andb $2, %dl
	; AVX512F-32-NEXT: shrb %dl			; AVX512F-32-NEXT: shrb %dl
	; AVX512F-32-NEXT: kmovd %edx, %k0			; AVX512F-32-NEXT: kmovd %edx, %k0
	; AVX512F-32-NEXT: movb %bl, %dl			; AVX512F-32-NEXT: movb %bl, %dl
	; AVX512F-32-NEXT: shrb $2, %bl			; AVX512F-32-NEXT: shrb $2, %bl
	; AVX512F-32-NEXT: kmovd %ebx, %k1			; AVX512F-32-NEXT: kmovd %ebx, %k1
	; AVX512F-32-NEXT: movb %cl, %bl			; AVX512F-32-NEXT: movb %cl, %bl
	; AVX512F-32-NEXT: shrb $4, %bl			; AVX512F-32-NEXT: shrb $4, %bl
	; AVX512F-32-NEXT: shrb $3, %dl			; AVX512F-32-NEXT: shrb $3, %dl
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: vpsllw $8, %xmm2, %xmm2			; AVX512F-32-NEXT: vpsllw $8, %xmm2, %xmm2
	; AVX512F-32-NEXT: kmovd %ecx, %k0			; AVX512F-32-NEXT: kmovd %ecx, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm3
	; AVX512F-32-NEXT: vpbroadcastw %xmm3, %xmm3			; AVX512F-32-NEXT: vpbroadcastw %xmm3, %xmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm2, %ymm3, %ymm3			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm2, %ymm3, %ymm3
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm3[0,1,2,3],zmm2[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm3[0,1,2,3],zmm2[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: kmovd %edx, %k0			; AVX512F-32-NEXT: kmovd %edx, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vpslld $24, %xmm3, %xmm3			; AVX512F-32-NEXT: vpslld $24, %xmm3, %xmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm2, %ymm3, %ymm3			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm2, %ymm3, %ymm3
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm3[0,1,2,3],zmm2[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm3[0,1,2,3],zmm2[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: kmovd %ebx, %k0			; AVX512F-32-NEXT: kmovd %ebx, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vpbroadcastd %xmm3, %xmm3			; AVX512F-32-NEXT: vpbroadcastd %xmm3, %xmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm2, %ymm3, %ymm3			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm2, %ymm3, %ymm3
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm3[0,1,2,3],zmm2[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm3[0,1,2,3],zmm2[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: kmovd %eax, %k0			; AVX512F-32-NEXT: kmovd %eax, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vpsllq $40, %xmm3, %xmm3			; AVX512F-32-NEXT: vpsllq $40, %xmm3, %xmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm2, %ymm3, %ymm3			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm2, %ymm3, %ymm3
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm3[0,1,2,3],zmm2[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm3[0,1,2,3],zmm2[4,5,6,7]
	; AVX512F-32-NEXT: movb %cl, %al			; AVX512F-32-NEXT: movb %cl, %al
	; AVX512F-32-NEXT: shrb $6, %al			; AVX512F-32-NEXT: shrb $6, %al
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %cl, %al			; AVX512F-32-NEXT: movb %cl, %al
	; AVX512F-32-NEXT: shrb $7, %al			; AVX512F-32-NEXT: shrb $7, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpsllq $56, %xmm2, %xmm2			; AVX512F-32-NEXT: vpsllq $56, %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %ch, %al			; AVX512F-32-NEXT: movb %ch, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastq %xmm2, %xmm2			; AVX512F-32-NEXT: vpbroadcastq %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: andb $2, %al			; AVX512F-32-NEXT: andb $2, %al
	; AVX512F-32-NEXT: shrb %al			; AVX512F-32-NEXT: shrb %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4,5,6]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4,5,6]
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %ch, %dl			; AVX512F-32-NEXT: movb %ch, %dl
	; AVX512F-32-NEXT: andb $15, %dl			; AVX512F-32-NEXT: andb $15, %dl
	; AVX512F-32-NEXT: movb %dl, %al			; AVX512F-32-NEXT: movb %dl, %al
	; AVX512F-32-NEXT: shrb $2, %dl			; AVX512F-32-NEXT: shrb $2, %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: shrb $3, %al			; AVX512F-32-NEXT: shrb $3, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4]
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: andl $61440, %eax # imm = 0xF000			; AVX512F-32-NEXT: andl $61440, %eax # imm = 0xF000
	; AVX512F-32-NEXT: shrl $12, %eax			; AVX512F-32-NEXT: shrl $12, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastd %xmm2, %xmm2			; AVX512F-32-NEXT: vpbroadcastd %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: shrl $13, %eax			; AVX512F-32-NEXT: shrl $13, %eax
	; AVX512F-32-NEXT: andb $1, %al			; AVX512F-32-NEXT: andb $1, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2]
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: andl $49152, %eax # imm = 0xC000			; AVX512F-32-NEXT: andl $49152, %eax # imm = 0xC000
	; AVX512F-32-NEXT: shrl $14, %eax			; AVX512F-32-NEXT: shrl $14, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: andl $32768, %eax # imm = 0x8000			; AVX512F-32-NEXT: andl $32768, %eax # imm = 0x8000
	; AVX512F-32-NEXT: shrl $15, %eax			; AVX512F-32-NEXT: shrl $15, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0]
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: shrl $16, %eax			; AVX512F-32-NEXT: shrl $16, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %al, %dl			; AVX512F-32-NEXT: movb %al, %dl
	; AVX512F-32-NEXT: andb $2, %dl			; AVX512F-32-NEXT: andb $2, %dl
	; AVX512F-32-NEXT: shrb %dl			; AVX512F-32-NEXT: shrb %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpsllw $8, %xmm2, %xmm2			; AVX512F-32-NEXT: vpsllw $8, %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %al, %bl			; AVX512F-32-NEXT: movb %al, %bl
	; AVX512F-32-NEXT: andb $15, %bl			; AVX512F-32-NEXT: andb $15, %bl
	; AVX512F-32-NEXT: movb %bl, %dl			; AVX512F-32-NEXT: movb %bl, %dl
	; AVX512F-32-NEXT: shrb $2, %bl			; AVX512F-32-NEXT: shrb $2, %bl
	; AVX512F-32-NEXT: kmovd %ebx, %k1			; AVX512F-32-NEXT: kmovd %ebx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: shrb $3, %dl			; AVX512F-32-NEXT: shrb $3, %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslld $24, %xmm2, %xmm2			; AVX512F-32-NEXT: vpslld $24, %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %al, %dl			; AVX512F-32-NEXT: movb %al, %dl
	; AVX512F-32-NEXT: shrb $4, %dl			; AVX512F-32-NEXT: shrb $4, %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastd %xmm2, %xmm2			; AVX512F-32-NEXT: vpbroadcastd %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %al, %dl			; AVX512F-32-NEXT: movb %al, %dl
	; AVX512F-32-NEXT: shrb $5, %dl			; AVX512F-32-NEXT: shrb $5, %dl
	; AVX512F-32-NEXT: andb $1, %dl			; AVX512F-32-NEXT: andb $1, %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpsllq $40, %xmm2, %xmm2			; AVX512F-32-NEXT: vpsllq $40, %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %al, %dl			; AVX512F-32-NEXT: movb %al, %dl
	; AVX512F-32-NEXT: shrb $6, %dl			; AVX512F-32-NEXT: shrb $6, %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill> %EAX<def>			; AVX512F-32-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill> %EAX<def>
	; AVX512F-32-NEXT: shrb $7, %al			; AVX512F-32-NEXT: shrb $7, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpsllq $56, %xmm2, %xmm2			; AVX512F-32-NEXT: vpsllq $56, %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: shrl $24, %eax			; AVX512F-32-NEXT: shrl $24, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastq %xmm2, %ymm2			; AVX512F-32-NEXT: vpbroadcastq %xmm2, %ymm3
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm2 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm2, %ymm4, %ymm3, %ymm3
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm3 = zmm3[0,1,2,3],zmm4[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm3, %k0
	; AVX512F-32-NEXT: movb %al, %dl			; AVX512F-32-NEXT: movb %al, %dl
	; AVX512F-32-NEXT: andb $2, %dl			; AVX512F-32-NEXT: andb $2, %dl
	; AVX512F-32-NEXT: shrb %dl			; AVX512F-32-NEXT: shrb %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm3
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4,5,6]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm3 = zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm3[0,1,2,3,4,5,6]
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm3, %ymm0, %ymm4
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm5
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm2 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm2, %ymm5, %ymm4, %ymm4
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm4 = zmm4[0,1,2,3],zmm5[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm4, %k0
	; AVX512F-32-NEXT: movb %al, %dl			; AVX512F-32-NEXT: movb %al, %dl
	; AVX512F-32-NEXT: andb $15, %dl			; AVX512F-32-NEXT: andb $15, %dl
	; AVX512F-32-NEXT: movb %dl, %al			; AVX512F-32-NEXT: movb %dl, %al
	; AVX512F-32-NEXT: shrb $2, %dl			; AVX512F-32-NEXT: shrb $2, %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm4
	; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2			; AVX512F-32-NEXT: vpbroadcastw %xmm4, %xmm4
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm4, %ymm0, %ymm5
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm6
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm2 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm2, %ymm6, %ymm5, %ymm5
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm5 = zmm5[0,1,2,3],zmm6[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm5, %k0
	; AVX512F-32-NEXT: shrb $3, %al			; AVX512F-32-NEXT: shrb $3, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm5
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm5 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm5[0,1,2,3,4]
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm5, %ymm0, %ymm5
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm4			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm7
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm3 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm6 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm3, %ymm4, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm6, %ymm7, %ymm5, %ymm5
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm4[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm5 = zmm5[0,1,2,3],zmm7[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm5, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: shrl $28, %eax			; AVX512F-32-NEXT: shrl $28, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm5
	; AVX512F-32-NEXT: vpbroadcastd %xmm2, %xmm2			; AVX512F-32-NEXT: vpbroadcastd %xmm5, %xmm5
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm5, %ymm0, %ymm5
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm4			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm7
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm0 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm2 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm0, %ymm4, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm2, %ymm7, %ymm5, %ymm5
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm4[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm5 = zmm5[0,1,2,3],zmm7[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm5, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: movl %ecx, %esi			; AVX512F-32-NEXT: movl %ecx, %esi
	; AVX512F-32-NEXT: shrl $29, %eax			; AVX512F-32-NEXT: shrl $29, %eax
	; AVX512F-32-NEXT: andb $1, %al			; AVX512F-32-NEXT: andb $1, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm5
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm5 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm5[0,1,2]
	; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2			; AVX512F-32-NEXT: vinserti128 $1, %xmm5, %ymm0, %ymm7
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm1 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm3 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm1, %ymm0, %ymm2, %ymm2			; AVX512F-32-NEXT: vpblendvb %ymm3, %ymm2, %ymm7, %ymm7
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm0 = zmm2[0,1,2,3],zmm0[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm7[0,1,2,3],zmm2[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %esi, %eax			; AVX512F-32-NEXT: movl %esi, %eax
	; AVX512F-32-NEXT: shrl $30, %eax			; AVX512F-32-NEXT: shrl $30, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm1			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm2 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255]
	; AVX512F-32-NEXT: vpblendvb %ymm2, %ymm0, %ymm1, %ymm1			; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm0 = zmm1[0,1,2,3],zmm0[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %esi, %eax			; AVX512F-32-NEXT: movl %esi, %eax
	; AVX512F-32-NEXT: shrl $31, %eax			; AVX512F-32-NEXT: shrl $31, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm0[0]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0]
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm1, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm3, %ymm2, %ymm2
	; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm0 = zmm0[0,1,2,3],zmm1[4,5,6,7]			; AVX512F-32-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2[0,1,2,3],zmm3[4,5,6,7]
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl {{[0-9]+}}(%esp), %ecx			; AVX512F-32-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; AVX512F-32-NEXT: kmovd %ecx, %k1			; AVX512F-32-NEXT: kmovd %ecx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm2, %ymm3
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm7			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm1, %ymm7, %ymm1			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm3, %ymm4, %ymm3
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm3, %zmm2, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %cl, %al			; AVX512F-32-NEXT: movb %cl, %al
	; AVX512F-32-NEXT: andb $2, %al			; AVX512F-32-NEXT: andb $2, %al
	; AVX512F-32-NEXT: shrb %al			; AVX512F-32-NEXT: shrb %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpsllw $8, %xmm0, %xmm0			; AVX512F-32-NEXT: vpsllw $8, %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %cl, %dl			; AVX512F-32-NEXT: movb %cl, %dl
	; AVX512F-32-NEXT: andb $15, %dl			; AVX512F-32-NEXT: andb $15, %dl
	; AVX512F-32-NEXT: movb %dl, %al			; AVX512F-32-NEXT: movb %dl, %al
	; AVX512F-32-NEXT: shrb $2, %dl			; AVX512F-32-NEXT: shrb $2, %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: shrb $3, %al			; AVX512F-32-NEXT: shrb $3, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslld $24, %xmm0, %xmm0			; AVX512F-32-NEXT: vpslld $24, %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %cl, %al			; AVX512F-32-NEXT: movb %cl, %al
	; AVX512F-32-NEXT: shrb $4, %al			; AVX512F-32-NEXT: shrb $4, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastd %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastd %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %cl, %al			; AVX512F-32-NEXT: movb %cl, %al
	; AVX512F-32-NEXT: shrb $5, %al			; AVX512F-32-NEXT: shrb $5, %al
	; AVX512F-32-NEXT: andb $1, %al			; AVX512F-32-NEXT: andb $1, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpsllq $40, %xmm0, %xmm0			; AVX512F-32-NEXT: vpsllq $40, %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %cl, %al			; AVX512F-32-NEXT: movb %cl, %al
	; AVX512F-32-NEXT: shrb $6, %al			; AVX512F-32-NEXT: shrb $6, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %cl, %al			; AVX512F-32-NEXT: movb %cl, %al
	; AVX512F-32-NEXT: shrb $7, %al			; AVX512F-32-NEXT: shrb $7, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpsllq $56, %xmm0, %xmm0			; AVX512F-32-NEXT: vpsllq $56, %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %ch, %al			; AVX512F-32-NEXT: movb %ch, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastq %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastq %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: andb $2, %al			; AVX512F-32-NEXT: andb $2, %al
	; AVX512F-32-NEXT: shrb %al			; AVX512F-32-NEXT: shrb %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4,5,6]
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %ch, %dl			; AVX512F-32-NEXT: movb %ch, %dl
	; AVX512F-32-NEXT: andb $15, %dl			; AVX512F-32-NEXT: andb $15, %dl
	; AVX512F-32-NEXT: movb %dl, %al			; AVX512F-32-NEXT: movb %dl, %al
	; AVX512F-32-NEXT: shrb $2, %dl			; AVX512F-32-NEXT: shrb $2, %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: shrb $3, %al			; AVX512F-32-NEXT: shrb $3, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm0[0,1,2,3,4]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4]
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: andl $61440, %eax # imm = 0xF000			; AVX512F-32-NEXT: andl $61440, %eax # imm = 0xF000
	; AVX512F-32-NEXT: shrl $12, %eax			; AVX512F-32-NEXT: shrl $12, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastd %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastd %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: shrl $13, %eax			; AVX512F-32-NEXT: shrl $13, %eax
	; AVX512F-32-NEXT: andb $1, %al			; AVX512F-32-NEXT: andb $1, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm0[0,1,2]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2]
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: andl $49152, %eax # imm = 0xC000			; AVX512F-32-NEXT: andl $49152, %eax # imm = 0xC000
	; AVX512F-32-NEXT: shrl $14, %eax			; AVX512F-32-NEXT: shrl $14, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: andl $32768, %eax # imm = 0x8000			; AVX512F-32-NEXT: andl $32768, %eax # imm = 0x8000
	; AVX512F-32-NEXT: shrl $15, %eax			; AVX512F-32-NEXT: shrl $15, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm0[0]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0]
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %ebx			; AVX512F-32-NEXT: movl %ecx, %ebx
	; AVX512F-32-NEXT: shrl $16, %ebx			; AVX512F-32-NEXT: shrl $16, %ebx
	; AVX512F-32-NEXT: kmovd %ebx, %k1			; AVX512F-32-NEXT: kmovd %ebx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %bl, %dl			; AVX512F-32-NEXT: movb %bl, %dl
	; AVX512F-32-NEXT: andb $2, %dl			; AVX512F-32-NEXT: andb $2, %dl
	; AVX512F-32-NEXT: shrb %dl			; AVX512F-32-NEXT: shrb %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpsllw $8, %xmm0, %xmm0			; AVX512F-32-NEXT: vpsllw $8, %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: movb %bl, %al			; AVX512F-32-NEXT: movb %bl, %al
	; AVX512F-32-NEXT: andb $15, %al			; AVX512F-32-NEXT: andb $15, %al
	; AVX512F-32-NEXT: movb %al, %dl			; AVX512F-32-NEXT: movb %al, %dl
	; AVX512F-32-NEXT: shrb $2, %al			; AVX512F-32-NEXT: shrb $2, %al
	; AVX512F-32-NEXT: kmovd %eax, %k0			; AVX512F-32-NEXT: kmovd %eax, %k0
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k1			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k1
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: shrb $3, %dl			; AVX512F-32-NEXT: shrb $3, %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslld $24, %xmm0, %xmm0			; AVX512F-32-NEXT: vpslld $24, %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %bl, %al			; AVX512F-32-NEXT: movb %bl, %al
	; AVX512F-32-NEXT: shrb $4, %al			; AVX512F-32-NEXT: shrb $4, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastd %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastd %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %bl, %al			; AVX512F-32-NEXT: movb %bl, %al
	; AVX512F-32-NEXT: shrb $5, %al			; AVX512F-32-NEXT: shrb $5, %al
	; AVX512F-32-NEXT: andb $1, %al			; AVX512F-32-NEXT: andb $1, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpsllq $40, %xmm0, %xmm0			; AVX512F-32-NEXT: vpsllq $40, %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %bl, %al			; AVX512F-32-NEXT: movb %bl, %al
	; AVX512F-32-NEXT: shrb $6, %al			; AVX512F-32-NEXT: shrb $6, %al
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: # kill: %BL<def> %BL<kill> %EBX<kill> %EBX<def>			; AVX512F-32-NEXT: # kill: %BL<def> %BL<kill> %EBX<kill> %EBX<def>
	; AVX512F-32-NEXT: shrb $7, %bl			; AVX512F-32-NEXT: shrb $7, %bl
	; AVX512F-32-NEXT: kmovd %ebx, %k1			; AVX512F-32-NEXT: kmovd %ebx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpsllq $56, %xmm0, %xmm0			; AVX512F-32-NEXT: vpsllq $56, %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: shrl $24, %eax			; AVX512F-32-NEXT: shrl $24, %eax
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpbroadcastq %xmm0, %ymm0			; AVX512F-32-NEXT: vpbroadcastq %xmm2, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movb %al, %dl			; AVX512F-32-NEXT: movb %al, %dl
	; AVX512F-32-NEXT: andb $2, %dl			; AVX512F-32-NEXT: andb $2, %dl
	; AVX512F-32-NEXT: shrb %dl			; AVX512F-32-NEXT: shrb %dl
	; AVX512F-32-NEXT: kmovd %edx, %k1			; AVX512F-32-NEXT: kmovd %edx, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4,5,6]
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: movb %al, %dl			; AVX512F-32-NEXT: movb %al, %dl
	; AVX512F-32-NEXT: andb $15, %dl			; AVX512F-32-NEXT: andb $15, %dl
	; AVX512F-32-NEXT: movb %dl, %al			; AVX512F-32-NEXT: movb %dl, %al
	; AVX512F-32-NEXT: shrb $2, %dl			; AVX512F-32-NEXT: shrb $2, %dl
	; AVX512F-32-NEXT: kmovd %edx, %k0			; AVX512F-32-NEXT: kmovd %edx, %k0
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k1			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k1
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: vpbroadcastw %xmm0, %xmm0			; AVX512F-32-NEXT: vpbroadcastw %xmm2, %xmm2
	; AVX512F-32-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; AVX512F-32-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm2
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm1, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm3, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm7 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm4, %ymm0, %ymm0			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm4, %ymm2, %ymm2
	; AVX512F-32-NEXT: shrb $3, %al			; AVX512F-32-NEXT: shrb $3, %al
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm2, %zmm3, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: kmovd %eax, %k0			; AVX512F-32-NEXT: kmovd %eax, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm1			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm1 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm1[0,1,2,3,4]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm3 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm3[0,1,2,3,4]
	; AVX512F-32-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm1			; AVX512F-32-NEXT: vinserti128 $1, %xmm3, %ymm0, %ymm3
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm0, %ymm4			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm2, %ymm4
	; AVX512F-32-NEXT: vpblendvb %ymm3, %ymm4, %ymm1, %ymm1			; AVX512F-32-NEXT: vpblendvb %ymm6, %ymm4, %ymm3, %ymm3
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: shrl $29, %eax			; AVX512F-32-NEXT: shrl $29, %eax
	; AVX512F-32-NEXT: andb $1, %al			; AVX512F-32-NEXT: andb $1, %al
	; AVX512F-32-NEXT: kmovd %eax, %k0			; AVX512F-32-NEXT: kmovd %eax, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: shrl $28, %eax			; AVX512F-32-NEXT: shrl $28, %eax
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm3, %zmm2, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k1			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm2, %ymm3
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm4
	; AVX512F-32-NEXT: vpbroadcastd %xmm3, %xmm3			; AVX512F-32-NEXT: vpbroadcastd %xmm4, %xmm4
	; AVX512F-32-NEXT: vinserti128 $1, %xmm3, %ymm0, %ymm3			; AVX512F-32-NEXT: vinserti128 $1, %xmm4, %ymm0, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm1, %ymm3, %ymm1			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm3, %ymm4, %ymm3
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm3, %zmm2, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k1			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k1
	; AVX512F-32-NEXT: vpmovm2b %k1, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k1, %zmm2
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm2, %ymm3
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm4
	; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm3 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm3[0,1,2]			; AVX512F-32-NEXT: vpslldq {{.*#+}} xmm4 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm4[0,1,2]
	; AVX512F-32-NEXT: vinserti128 $1, %xmm3, %ymm0, %ymm3			; AVX512F-32-NEXT: vinserti128 $1, %xmm4, %ymm0, %ymm4
	; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255]			; AVX512F-32-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,255,255]
	; AVX512F-32-NEXT: vpblendvb %ymm4, %ymm1, %ymm3, %ymm1			; AVX512F-32-NEXT: vpblendvb %ymm5, %ymm3, %ymm4, %ymm3
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: shrl $30, %eax			; AVX512F-32-NEXT: shrl $30, %eax
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm3, %zmm2, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm0			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm2
	; AVX512F-32-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512F-32-NEXT: vextracti64x4 $1, %zmm2, %ymm3
	; AVX512F-32-NEXT: kmovd %eax, %k0			; AVX512F-32-NEXT: kmovd %eax, %k0
	; AVX512F-32-NEXT: vpmovm2b %k0, %zmm3			; AVX512F-32-NEXT: vpmovm2b %k0, %zmm4
	; AVX512F-32-NEXT: vpbroadcastw %xmm3, %xmm3			; AVX512F-32-NEXT: vpbroadcastw %xmm4, %xmm4
	; AVX512F-32-NEXT: vinserti128 $1, %xmm3, %ymm0, %ymm3			; AVX512F-32-NEXT: vinserti128 $1, %xmm4, %ymm0, %ymm4
	; AVX512F-32-NEXT: vpblendvb %ymm2, %ymm1, %ymm3, %ymm1			; AVX512F-32-NEXT: vpblendvb %ymm7, %ymm3, %ymm4, %ymm3
	; AVX512F-32-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0			; AVX512F-32-NEXT: vinserti64x4 $1, %ymm3, %zmm2, %zmm2
	; AVX512F-32-NEXT: vpmovb2m %zmm0, %k0			; AVX512F-32-NEXT: vpmovb2m %zmm2, %k0
	; AVX512F-32-NEXT: movl %ecx, %eax			; AVX512F-32-NEXT: movl %ecx, %eax
	; AVX512F-32-NEXT: shrl $31, %eax			; AVX512F-32-NEXT: shrl $31, %eax
	; AVX512F-32-NEXT: kshiftlq $1, %k0, %k0			; AVX512F-32-NEXT: kshiftlq $1, %k0, %k0
	; AVX512F-32-NEXT: kshiftrq $1, %k0, %k0			; AVX512F-32-NEXT: kshiftrq $1, %k0, %k0
	; AVX512F-32-NEXT: kmovd %eax, %k1			; AVX512F-32-NEXT: kmovd %eax, %k1
	; AVX512F-32-NEXT: kshiftlq $63, %k1, %k1			; AVX512F-32-NEXT: kshiftlq $63, %k1, %k1
	; AVX512F-32-NEXT: korq %k1, %k0, %k1			; AVX512F-32-NEXT: korq %k1, %k0, %k1
	; AVX512F-32-NEXT: vpcmpeqb %zmm6, %zmm5, %k0 {%k1}			; AVX512F-32-NEXT: vpcmpeqb %zmm1, %zmm0, %k0 {%k1}
	; AVX512F-32-NEXT: vpcmpltub %zmm6, %zmm5, %k2 {%k1}
	; AVX512F-32-NEXT: vpcmpleub %zmm6, %zmm5, %k3 {%k1}
	; AVX512F-32-NEXT: vpcmpneqb %zmm6, %zmm5, %k4 {%k1}
	; AVX512F-32-NEXT: vpcmpnltub %zmm6, %zmm5, %k5 {%k1}
	; AVX512F-32-NEXT: vpcmpnleub %zmm6, %zmm5, %k1 {%k1}
	; AVX512F-32-NEXT: kmovq %k0, (%esp)			; AVX512F-32-NEXT: kmovq %k0, (%esp)
	; AVX512F-32-NEXT: movl (%esp), %eax			; AVX512F-32-NEXT: movl (%esp), %eax
	; AVX512F-32-NEXT: movl {{[0-9]+}}(%esp), %edx			; AVX512F-32-NEXT: movl {{[0-9]+}}(%esp), %edx
	; AVX512F-32-NEXT: kmovq %k2, {{[0-9]+}}(%esp)			; AVX512F-32-NEXT: vpcmpltub %zmm1, %zmm0, %k0 {%k1}
				; AVX512F-32-NEXT: kmovq %k0, {{[0-9]+}}(%esp)
	; AVX512F-32-NEXT: addl {{[0-9]+}}(%esp), %eax			; AVX512F-32-NEXT: addl {{[0-9]+}}(%esp), %eax
	; AVX512F-32-NEXT: adcxl {{[0-9]+}}(%esp), %edx			; AVX512F-32-NEXT: adcxl {{[0-9]+}}(%esp), %edx
	; AVX512F-32-NEXT: kmovq %k3, {{[0-9]+}}(%esp)			; AVX512F-32-NEXT: vpcmpleub %zmm1, %zmm0, %k0 {%k1}
				; AVX512F-32-NEXT: kmovq %k0, {{[0-9]+}}(%esp)
	; AVX512F-32-NEXT: addl {{[0-9]+}}(%esp), %eax			; AVX512F-32-NEXT: addl {{[0-9]+}}(%esp), %eax
	; AVX512F-32-NEXT: adcxl {{[0-9]+}}(%esp), %edx			; AVX512F-32-NEXT: adcxl {{[0-9]+}}(%esp), %edx
	; AVX512F-32-NEXT: kxorq %k0, %k0, %k0			; AVX512F-32-NEXT: kxorq %k0, %k0, %k0
	; AVX512F-32-NEXT: kmovq %k0, {{[0-9]+}}(%esp)			; AVX512F-32-NEXT: kmovq %k0, {{[0-9]+}}(%esp)
	; AVX512F-32-NEXT: orl {{[0-9]+}}(%esp), %edx			; AVX512F-32-NEXT: orl {{[0-9]+}}(%esp), %edx
	; AVX512F-32-NEXT: orl {{[0-9]+}}(%esp), %eax			; AVX512F-32-NEXT: orl {{[0-9]+}}(%esp), %eax
	; AVX512F-32-NEXT: kmovq %k4, {{[0-9]+}}(%esp)			; AVX512F-32-NEXT: vpcmpneqb %zmm1, %zmm0, %k0 {%k1}
				; AVX512F-32-NEXT: vpcmpnltub %zmm1, %zmm0, %k2 {%k1}
				; AVX512F-32-NEXT: vpcmpnleub %zmm1, %zmm0, %k1 {%k1}
				; AVX512F-32-NEXT: kmovq %k0, {{[0-9]+}}(%esp)
	; AVX512F-32-NEXT: addl {{[0-9]+}}(%esp), %eax			; AVX512F-32-NEXT: addl {{[0-9]+}}(%esp), %eax
	; AVX512F-32-NEXT: adcxl {{[0-9]+}}(%esp), %edx			; AVX512F-32-NEXT: adcxl {{[0-9]+}}(%esp), %edx
	; AVX512F-32-NEXT: kmovq %k5, {{[0-9]+}}(%esp)			; AVX512F-32-NEXT: kmovq %k2, {{[0-9]+}}(%esp)
	; AVX512F-32-NEXT: addl {{[0-9]+}}(%esp), %eax			; AVX512F-32-NEXT: addl {{[0-9]+}}(%esp), %eax
	; AVX512F-32-NEXT: adcxl {{[0-9]+}}(%esp), %edx			; AVX512F-32-NEXT: adcxl {{[0-9]+}}(%esp), %edx
	; AVX512F-32-NEXT: kmovq %k1, {{[0-9]+}}(%esp)			; AVX512F-32-NEXT: kmovq %k1, {{[0-9]+}}(%esp)
	; AVX512F-32-NEXT: addl {{[0-9]+}}(%esp), %eax			; AVX512F-32-NEXT: addl {{[0-9]+}}(%esp), %eax
	; AVX512F-32-NEXT: adcxl {{[0-9]+}}(%esp), %edx			; AVX512F-32-NEXT: adcxl {{[0-9]+}}(%esp), %edx
	; AVX512F-32-NEXT: addl %esi, %eax			; AVX512F-32-NEXT: addl %esi, %eax
	; AVX512F-32-NEXT: adcxl %ecx, %edx			; AVX512F-32-NEXT: adcxl %ecx, %edx
	; AVX512F-32-NEXT: addl $60, %esp			; AVX512F-32-NEXT: addl $60, %esp
	▲ Show 20 Lines • Show All 300 Lines • Show Last 20 Lines

test/CodeGen/X86/avx512bwvl-intrinsics-upgrade.ll

Show First 20 Lines • Show All 2,689 Lines • ▼ Show 20 Lines	; CHECK-NEXT: retq ## encoding: [0xc3]
ret <32 x i8> %res		ret <32 x i8> %res
}		}

declare <32 x i8> @llvm.x86.avx512.mask.packuswb.256(<16 x i16>, <16 x i16>, <32 x i8>, i32)		declare <32 x i8> @llvm.x86.avx512.mask.packuswb.256(<16 x i16>, <16 x i16>, <32 x i8>, i32)

define <8 x i32> @test_cmp_b_256(<32 x i8> %a0, <32 x i8> %a1) {		define <8 x i32> @test_cmp_b_256(<32 x i8> %a0, <32 x i8> %a1) {
; CHECK-LABEL: test_cmp_b_256:		; CHECK-LABEL: test_cmp_b_256:
; CHECK: ## BB#0:		; CHECK: ## BB#0:
; CHECK-NEXT: vpcmpeqb %ymm1, %ymm0, %k0 ## encoding: [0x62,0xf1,0x7d,0x28,0x74,0xc1]
; CHECK-NEXT: kmovd %k0, %r8d ## encoding: [0xc5,0x7b,0x93,0xc0]
; CHECK-NEXT: vpcmpgtb %ymm0, %ymm1, %k0 ## encoding: [0x62,0xf1,0x75,0x28,0x64,0xc0]
; CHECK-NEXT: kmovd %k0, %ecx ## encoding: [0xc5,0xfb,0x93,0xc8]
; CHECK-NEXT: vpcmpleb %ymm1, %ymm0, %k0 ## encoding: [0x62,0xf3,0x7d,0x28,0x3f,0xc1,0x02]
; CHECK-NEXT: kmovd %k0, %edx ## encoding: [0xc5,0xfb,0x93,0xd0]
; CHECK-NEXT: vpcmpneqb %ymm1, %ymm0, %k0 ## encoding: [0x62,0xf3,0x7d,0x28,0x3f,0xc1,0x04]		; CHECK-NEXT: vpcmpneqb %ymm1, %ymm0, %k0 ## encoding: [0x62,0xf3,0x7d,0x28,0x3f,0xc1,0x04]
; CHECK-NEXT: kmovd %k0, %esi ## encoding: [0xc5,0xfb,0x93,0xf0]		; CHECK-NEXT: kmovd %k0, %eax ## encoding: [0xc5,0xfb,0x93,0xc0]
; CHECK-NEXT: vpcmpleb %ymm0, %ymm1, %k0 ## encoding: [0x62,0xf3,0x75,0x28,0x3f,0xc0,0x02]		; CHECK-NEXT: vpcmpleb %ymm0, %ymm1, %k0 ## encoding: [0x62,0xf3,0x75,0x28,0x3f,0xc0,0x02]
; CHECK-NEXT: kmovd %k0, %edi ## encoding: [0xc5,0xfb,0x93,0xf8]		; CHECK-NEXT: kmovd %k0, %ecx ## encoding: [0xc5,0xfb,0x93,0xc8]
; CHECK-NEXT: vpcmpgtb %ymm1, %ymm0, %k0 ## encoding: [0x62,0xf1,0x7d,0x28,0x64,0xc1]		; CHECK-NEXT: vpcmpgtb %ymm1, %ymm0, %k0 ## encoding: [0x62,0xf1,0x7d,0x28,0x64,0xc1]
; CHECK-NEXT: kmovd %k0, %eax ## encoding: [0xc5,0xfb,0x93,0xc0]		; CHECK-NEXT: kmovd %k0, %edx ## encoding: [0xc5,0xfb,0x93,0xd0]
; CHECK-NEXT: vmovd %esi, %xmm0 ## EVEX TO VEX Compression encoding: [0xc5,0xf9,0x6e,0xc6]		; CHECK-NEXT: vmovd %eax, %xmm2 ## EVEX TO VEX Compression encoding: [0xc5,0xf9,0x6e,0xd0]
; CHECK-NEXT: vpinsrd $1, %edi, %xmm0, %xmm0 ## encoding: [0xc4,0xe3,0x79,0x22,0xc7,0x01]		; CHECK-NEXT: vpinsrd $1, %ecx, %xmm2, %xmm2 ## encoding: [0xc4,0xe3,0x69,0x22,0xd1,0x01]
; CHECK-NEXT: vpinsrd $2, %eax, %xmm0, %xmm0 ## encoding: [0xc4,0xe3,0x79,0x22,0xc0,0x02]		; CHECK-NEXT: vpinsrd $2, %edx, %xmm2, %xmm2 ## encoding: [0xc4,0xe3,0x69,0x22,0xd2,0x02]
; CHECK-NEXT: kxnord %k0, %k0, %k0 ## encoding: [0xc4,0xe1,0xfd,0x46,0xc0]		; CHECK-NEXT: kxnord %k0, %k0, %k0 ## encoding: [0xc4,0xe1,0xfd,0x46,0xc0]
; CHECK-NEXT: kmovd %k0, %eax ## encoding: [0xc5,0xfb,0x93,0xc0]		; CHECK-NEXT: kmovd %k0, %eax ## encoding: [0xc5,0xfb,0x93,0xc0]
; CHECK-NEXT: vpinsrd $3, %eax, %xmm0, %xmm0 ## encoding: [0xc4,0xe3,0x79,0x22,0xc0,0x03]		; CHECK-NEXT: vpinsrd $3, %eax, %xmm2, %xmm2 ## encoding: [0xc4,0xe3,0x69,0x22,0xd0,0x03]
; CHECK-NEXT: vmovd %ecx, %xmm1 ## EVEX TO VEX Compression encoding: [0xc5,0xf9,0x6e,0xc9]		; CHECK-NEXT: vpcmpeqb %ymm1, %ymm0, %k0 ## encoding: [0x62,0xf1,0x7d,0x28,0x74,0xc1]
; CHECK-NEXT: vmovd %r8d, %xmm2 ## EVEX TO VEX Compression encoding: [0xc4,0xc1,0x79,0x6e,0xd0]		; CHECK-NEXT: kmovd %k0, %eax ## encoding: [0xc5,0xfb,0x93,0xc0]
; CHECK-NEXT: vpunpckldq %xmm1, %xmm2, %xmm1 ## EVEX TO VEX Compression encoding: [0xc5,0xe9,0x62,0xc9]		; CHECK-NEXT: vpcmpgtb %ymm0, %ymm1, %k0 ## encoding: [0x62,0xf1,0x75,0x28,0x64,0xc0]
; CHECK-NEXT: ## xmm1 = xmm2[0],xmm1[0],xmm2[1],xmm1[1]		; CHECK-NEXT: kmovd %k0, %ecx ## encoding: [0xc5,0xfb,0x93,0xc8]
; CHECK-NEXT: vmovd %edx, %xmm2 ## EVEX TO VEX Compression encoding: [0xc5,0xf9,0x6e,0xd2]		; CHECK-NEXT: vpcmpleb %ymm1, %ymm0, %k0 ## encoding: [0x62,0xf3,0x7d,0x28,0x3f,0xc1,0x02]
; CHECK-NEXT: vpunpcklqdq %xmm2, %xmm1, %xmm1 ## EVEX TO VEX Compression encoding: [0xc5,0xf1,0x6c,0xca]		; CHECK-NEXT: kmovd %k0, %edx ## encoding: [0xc5,0xfb,0x93,0xd0]
; CHECK-NEXT: ## xmm1 = xmm1[0],xmm2[0]		; CHECK-NEXT: vmovd %ecx, %xmm0 ## EVEX TO VEX Compression encoding: [0xc5,0xf9,0x6e,0xc1]
; CHECK-NEXT: vinserti128 $1, %xmm0, %ymm1, %ymm0 ## EVEX TO VEX Compression encoding: [0xc4,0xe3,0x75,0x38,0xc0,0x01]		; CHECK-NEXT: vmovd %eax, %xmm1 ## EVEX TO VEX Compression encoding: [0xc5,0xf9,0x6e,0xc8]
		; CHECK-NEXT: vpunpckldq %xmm0, %xmm1, %xmm0 ## EVEX TO VEX Compression encoding: [0xc5,0xf1,0x62,0xc0]
		; CHECK-NEXT: ## xmm0 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
		; CHECK-NEXT: vmovd %edx, %xmm1 ## EVEX TO VEX Compression encoding: [0xc5,0xf9,0x6e,0xca]
		; CHECK-NEXT: vpunpcklqdq %xmm1, %xmm0, %xmm0 ## EVEX TO VEX Compression encoding: [0xc5,0xf9,0x6c,0xc1]
		; CHECK-NEXT: ## xmm0 = xmm0[0],xmm1[0]
		; CHECK-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0 ## EVEX TO VEX Compression encoding: [0xc4,0xe3,0x7d,0x38,0xc2,0x01]
; CHECK-NEXT: retq ## encoding: [0xc3]		; CHECK-NEXT: retq ## encoding: [0xc3]
%res0 = call i32 @llvm.x86.avx512.mask.cmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 0, i32 -1)		%res0 = call i32 @llvm.x86.avx512.mask.cmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 0, i32 -1)
%vec0 = insertelement <8 x i32> undef, i32 %res0, i32 0		%vec0 = insertelement <8 x i32> undef, i32 %res0, i32 0
%res1 = call i32 @llvm.x86.avx512.mask.cmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 1, i32 -1)		%res1 = call i32 @llvm.x86.avx512.mask.cmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 1, i32 -1)
%vec1 = insertelement <8 x i32> %vec0, i32 %res1, i32 1		%vec1 = insertelement <8 x i32> %vec0, i32 %res1, i32 1
%res2 = call i32 @llvm.x86.avx512.mask.cmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 2, i32 -1)		%res2 = call i32 @llvm.x86.avx512.mask.cmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 2, i32 -1)
%vec2 = insertelement <8 x i32> %vec1, i32 %res2, i32 2		%vec2 = insertelement <8 x i32> %vec1, i32 %res2, i32 2
%res3 = call i32 @llvm.x86.avx512.mask.cmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 3, i32 -1)		%res3 = call i32 @llvm.x86.avx512.mask.cmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 3, i32 -1)
Show All 13 Lines
; CHECK-LABEL: test_mask_cmp_b_256:		; CHECK-LABEL: test_mask_cmp_b_256:
; CHECK: ## BB#0:		; CHECK: ## BB#0:
; CHECK-NEXT: kmovd %edi, %k1 ## encoding: [0xc5,0xfb,0x92,0xcf]		; CHECK-NEXT: kmovd %edi, %k1 ## encoding: [0xc5,0xfb,0x92,0xcf]
; CHECK-NEXT: vpcmpeqb %ymm1, %ymm0, %k0 {%k1} ## encoding: [0x62,0xf1,0x7d,0x29,0x74,0xc1]		; CHECK-NEXT: vpcmpeqb %ymm1, %ymm0, %k0 {%k1} ## encoding: [0x62,0xf1,0x7d,0x29,0x74,0xc1]
; CHECK-NEXT: kmovd %k0, %r8d ## encoding: [0xc5,0x7b,0x93,0xc0]		; CHECK-NEXT: kmovd %k0, %r8d ## encoding: [0xc5,0x7b,0x93,0xc0]
; CHECK-NEXT: vpcmpgtb %ymm0, %ymm1, %k0 {%k1} ## encoding: [0x62,0xf1,0x75,0x29,0x64,0xc0]		; CHECK-NEXT: vpcmpgtb %ymm0, %ymm1, %k0 {%k1} ## encoding: [0x62,0xf1,0x75,0x29,0x64,0xc0]
; CHECK-NEXT: kmovd %k0, %r9d ## encoding: [0xc5,0x7b,0x93,0xc8]		; CHECK-NEXT: kmovd %k0, %r9d ## encoding: [0xc5,0x7b,0x93,0xc8]
; CHECK-NEXT: vpcmpleb %ymm1, %ymm0, %k0 {%k1} ## encoding: [0x62,0xf3,0x7d,0x29,0x3f,0xc1,0x02]		; CHECK-NEXT: vpcmpleb %ymm1, %ymm0, %k0 {%k1} ## encoding: [0x62,0xf3,0x7d,0x29,0x3f,0xc1,0x02]
; CHECK-NEXT: kmovd %k0, %r10d ## encoding: [0xc5,0x7b,0x93,0xd0]		; CHECK-NEXT: kmovd %k0, %edx ## encoding: [0xc5,0xfb,0x93,0xd0]
; CHECK-NEXT: kxord %k0, %k0, %k0 ## encoding: [0xc4,0xe1,0xfd,0x47,0xc0]
; CHECK-NEXT: kmovd %k0, %esi ## encoding: [0xc5,0xfb,0x93,0xf0]
; CHECK-NEXT: vpcmpneqb %ymm1, %ymm0, %k0 {%k1} ## encoding: [0x62,0xf3,0x7d,0x29,0x3f,0xc1,0x04]		; CHECK-NEXT: vpcmpneqb %ymm1, %ymm0, %k0 {%k1} ## encoding: [0x62,0xf3,0x7d,0x29,0x3f,0xc1,0x04]
; CHECK-NEXT: kmovd %k0, %eax ## encoding: [0xc5,0xfb,0x93,0xc0]		; CHECK-NEXT: kmovd %k0, %esi ## encoding: [0xc5,0xfb,0x93,0xf0]
; CHECK-NEXT: vpcmpleb %ymm0, %ymm1, %k0 {%k1} ## encoding: [0x62,0xf3,0x75,0x29,0x3f,0xc0,0x02]		; CHECK-NEXT: vpcmpleb %ymm0, %ymm1, %k0 {%k1} ## encoding: [0x62,0xf3,0x75,0x29,0x3f,0xc0,0x02]
; CHECK-NEXT: kmovd %k0, %ecx ## encoding: [0xc5,0xfb,0x93,0xc8]		; CHECK-NEXT: kmovd %k0, %eax ## encoding: [0xc5,0xfb,0x93,0xc0]
; CHECK-NEXT: vpcmpgtb %ymm1, %ymm0, %k0 {%k1} ## encoding: [0x62,0xf1,0x7d,0x29,0x64,0xc1]		; CHECK-NEXT: vpcmpgtb %ymm1, %ymm0, %k0 {%k1} ## encoding: [0x62,0xf1,0x7d,0x29,0x64,0xc1]
; CHECK-NEXT: kmovd %k0, %edx ## encoding: [0xc5,0xfb,0x93,0xd0]		; CHECK-NEXT: kmovd %k0, %ecx ## encoding: [0xc5,0xfb,0x93,0xc8]
; CHECK-NEXT: vmovd %eax, %xmm0 ## EVEX TO VEX Compression encoding: [0xc5,0xf9,0x6e,0xc0]		; CHECK-NEXT: vmovd %esi, %xmm0 ## EVEX TO VEX Compression encoding: [0xc5,0xf9,0x6e,0xc6]
; CHECK-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0 ## encoding: [0xc4,0xe3,0x79,0x22,0xc1,0x01]		; CHECK-NEXT: vpinsrd $1, %eax, %xmm0, %xmm0 ## encoding: [0xc4,0xe3,0x79,0x22,0xc0,0x01]
; CHECK-NEXT: vpinsrd $2, %edx, %xmm0, %xmm0 ## encoding: [0xc4,0xe3,0x79,0x22,0xc2,0x02]		; CHECK-NEXT: vpinsrd $2, %ecx, %xmm0, %xmm0 ## encoding: [0xc4,0xe3,0x79,0x22,0xc1,0x02]
; CHECK-NEXT: vpinsrd $3, %edi, %xmm0, %xmm0 ## encoding: [0xc4,0xe3,0x79,0x22,0xc7,0x03]		; CHECK-NEXT: vpinsrd $3, %edi, %xmm0, %xmm0 ## encoding: [0xc4,0xe3,0x79,0x22,0xc7,0x03]
; CHECK-NEXT: vmovd %r8d, %xmm1 ## EVEX TO VEX Compression encoding: [0xc4,0xc1,0x79,0x6e,0xc8]		; CHECK-NEXT: vmovd %r8d, %xmm1 ## EVEX TO VEX Compression encoding: [0xc4,0xc1,0x79,0x6e,0xc8]
; CHECK-NEXT: vpinsrd $1, %r9d, %xmm1, %xmm1 ## encoding: [0xc4,0xc3,0x71,0x22,0xc9,0x01]		; CHECK-NEXT: vpinsrd $1, %r9d, %xmm1, %xmm1 ## encoding: [0xc4,0xc3,0x71,0x22,0xc9,0x01]
; CHECK-NEXT: vpinsrd $2, %r10d, %xmm1, %xmm1 ## encoding: [0xc4,0xc3,0x71,0x22,0xca,0x02]		; CHECK-NEXT: vpinsrd $2, %edx, %xmm1, %xmm1 ## encoding: [0xc4,0xe3,0x71,0x22,0xca,0x02]
; CHECK-NEXT: vpinsrd $3, %esi, %xmm1, %xmm1 ## encoding: [0xc4,0xe3,0x71,0x22,0xce,0x03]		; CHECK-NEXT: kxord %k0, %k0, %k0 ## encoding: [0xc4,0xe1,0xfd,0x47,0xc0]
		; CHECK-NEXT: kmovd %k0, %eax ## encoding: [0xc5,0xfb,0x93,0xc0]
		; CHECK-NEXT: vpinsrd $3, %eax, %xmm1, %xmm1 ## encoding: [0xc4,0xe3,0x71,0x22,0xc8,0x03]
; CHECK-NEXT: vinserti128 $1, %xmm0, %ymm1, %ymm0 ## EVEX TO VEX Compression encoding: [0xc4,0xe3,0x75,0x38,0xc0,0x01]		; CHECK-NEXT: vinserti128 $1, %xmm0, %ymm1, %ymm0 ## EVEX TO VEX Compression encoding: [0xc4,0xe3,0x75,0x38,0xc0,0x01]
; CHECK-NEXT: retq ## encoding: [0xc3]		; CHECK-NEXT: retq ## encoding: [0xc3]
%res0 = call i32 @llvm.x86.avx512.mask.cmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 0, i32 %mask)		%res0 = call i32 @llvm.x86.avx512.mask.cmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 0, i32 %mask)
%vec0 = insertelement <8 x i32> undef, i32 %res0, i32 0		%vec0 = insertelement <8 x i32> undef, i32 %res0, i32 0
%res1 = call i32 @llvm.x86.avx512.mask.cmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 1, i32 %mask)		%res1 = call i32 @llvm.x86.avx512.mask.cmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 1, i32 %mask)
%vec1 = insertelement <8 x i32> %vec0, i32 %res1, i32 1		%vec1 = insertelement <8 x i32> %vec0, i32 %res1, i32 1
%res2 = call i32 @llvm.x86.avx512.mask.cmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 2, i32 %mask)		%res2 = call i32 @llvm.x86.avx512.mask.cmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 2, i32 %mask)
%vec2 = insertelement <8 x i32> %vec1, i32 %res2, i32 2		%vec2 = insertelement <8 x i32> %vec1, i32 %res2, i32 2
Show All 10 Lines	; CHECK-NEXT: retq ## encoding: [0xc3]
ret <8 x i32> %vec7		ret <8 x i32> %vec7
}		}

declare i32 @llvm.x86.avx512.mask.cmp.b.256(<32 x i8>, <32 x i8>, i32, i32) nounwind readnone		declare i32 @llvm.x86.avx512.mask.cmp.b.256(<32 x i8>, <32 x i8>, i32, i32) nounwind readnone

define <8 x i32> @test_ucmp_b_256(<32 x i8> %a0, <32 x i8> %a1) {		define <8 x i32> @test_ucmp_b_256(<32 x i8> %a0, <32 x i8> %a1) {
; CHECK-LABEL: test_ucmp_b_256:		; CHECK-LABEL: test_ucmp_b_256:
; CHECK: ## BB#0:		; CHECK: ## BB#0:
; CHECK-NEXT: vpcmpeqb %ymm1, %ymm0, %k0 ## encoding: [0x62,0xf1,0x7d,0x28,0x74,0xc1]
; CHECK-NEXT: kmovd %k0, %r8d ## encoding: [0xc5,0x7b,0x93,0xc0]
; CHECK-NEXT: vpcmpltub %ymm1, %ymm0, %k0 ## encoding: [0x62,0xf3,0x7d,0x28,0x3e,0xc1,0x01]
; CHECK-NEXT: kmovd %k0, %ecx ## encoding: [0xc5,0xfb,0x93,0xc8]
; CHECK-NEXT: vpcmpleub %ymm1, %ymm0, %k0 ## encoding: [0x62,0xf3,0x7d,0x28,0x3e,0xc1,0x02]
; CHECK-NEXT: kmovd %k0, %edx ## encoding: [0xc5,0xfb,0x93,0xd0]
; CHECK-NEXT: vpcmpneqb %ymm1, %ymm0, %k0 ## encoding: [0x62,0xf3,0x7d,0x28,0x3f,0xc1,0x04]		; CHECK-NEXT: vpcmpneqb %ymm1, %ymm0, %k0 ## encoding: [0x62,0xf3,0x7d,0x28,0x3f,0xc1,0x04]
; CHECK-NEXT: kmovd %k0, %esi ## encoding: [0xc5,0xfb,0x93,0xf0]		; CHECK-NEXT: kmovd %k0, %eax ## encoding: [0xc5,0xfb,0x93,0xc0]
; CHECK-NEXT: vpcmpnltub %ymm1, %ymm0, %k0 ## encoding: [0x62,0xf3,0x7d,0x28,0x3e,0xc1,0x05]		; CHECK-NEXT: vpcmpnltub %ymm1, %ymm0, %k0 ## encoding: [0x62,0xf3,0x7d,0x28,0x3e,0xc1,0x05]
; CHECK-NEXT: kmovd %k0, %edi ## encoding: [0xc5,0xfb,0x93,0xf8]		; CHECK-NEXT: kmovd %k0, %ecx ## encoding: [0xc5,0xfb,0x93,0xc8]
; CHECK-NEXT: vpcmpnleub %ymm1, %ymm0, %k0 ## encoding: [0x62,0xf3,0x7d,0x28,0x3e,0xc1,0x06]		; CHECK-NEXT: vpcmpnleub %ymm1, %ymm0, %k0 ## encoding: [0x62,0xf3,0x7d,0x28,0x3e,0xc1,0x06]
; CHECK-NEXT: kmovd %k0, %eax ## encoding: [0xc5,0xfb,0x93,0xc0]		; CHECK-NEXT: kmovd %k0, %edx ## encoding: [0xc5,0xfb,0x93,0xd0]
; CHECK-NEXT: vmovd %esi, %xmm0 ## EVEX TO VEX Compression encoding: [0xc5,0xf9,0x6e,0xc6]		; CHECK-NEXT: vmovd %eax, %xmm2 ## EVEX TO VEX Compression encoding: [0xc5,0xf9,0x6e,0xd0]
; CHECK-NEXT: vpinsrd $1, %edi, %xmm0, %xmm0 ## encoding: [0xc4,0xe3,0x79,0x22,0xc7,0x01]		; CHECK-NEXT: vpinsrd $1, %ecx, %xmm2, %xmm2 ## encoding: [0xc4,0xe3,0x69,0x22,0xd1,0x01]
; CHECK-NEXT: vpinsrd $2, %eax, %xmm0, %xmm0 ## encoding: [0xc4,0xe3,0x79,0x22,0xc0,0x02]		; CHECK-NEXT: vpinsrd $2, %edx, %xmm2, %xmm2 ## encoding: [0xc4,0xe3,0x69,0x22,0xd2,0x02]
; CHECK-NEXT: kxnord %k0, %k0, %k0 ## encoding: [0xc4,0xe1,0xfd,0x46,0xc0]		; CHECK-NEXT: kxnord %k0, %k0, %k0 ## encoding: [0xc4,0xe1,0xfd,0x46,0xc0]
; CHECK-NEXT: kmovd %k0, %eax ## encoding: [0xc5,0xfb,0x93,0xc0]		; CHECK-NEXT: kmovd %k0, %eax ## encoding: [0xc5,0xfb,0x93,0xc0]
; CHECK-NEXT: vpinsrd $3, %eax, %xmm0, %xmm0 ## encoding: [0xc4,0xe3,0x79,0x22,0xc0,0x03]		; CHECK-NEXT: vpinsrd $3, %eax, %xmm2, %xmm2 ## encoding: [0xc4,0xe3,0x69,0x22,0xd0,0x03]
; CHECK-NEXT: vmovd %ecx, %xmm1 ## EVEX TO VEX Compression encoding: [0xc5,0xf9,0x6e,0xc9]		; CHECK-NEXT: vpcmpeqb %ymm1, %ymm0, %k0 ## encoding: [0x62,0xf1,0x7d,0x28,0x74,0xc1]
; CHECK-NEXT: vmovd %r8d, %xmm2 ## EVEX TO VEX Compression encoding: [0xc4,0xc1,0x79,0x6e,0xd0]		; CHECK-NEXT: kmovd %k0, %eax ## encoding: [0xc5,0xfb,0x93,0xc0]
; CHECK-NEXT: vpunpckldq %xmm1, %xmm2, %xmm1 ## EVEX TO VEX Compression encoding: [0xc5,0xe9,0x62,0xc9]		; CHECK-NEXT: vpcmpltub %ymm1, %ymm0, %k0 ## encoding: [0x62,0xf3,0x7d,0x28,0x3e,0xc1,0x01]
; CHECK-NEXT: ## xmm1 = xmm2[0],xmm1[0],xmm2[1],xmm1[1]		; CHECK-NEXT: kmovd %k0, %ecx ## encoding: [0xc5,0xfb,0x93,0xc8]
; CHECK-NEXT: vmovd %edx, %xmm2 ## EVEX TO VEX Compression encoding: [0xc5,0xf9,0x6e,0xd2]		; CHECK-NEXT: vpcmpleub %ymm1, %ymm0, %k0 ## encoding: [0x62,0xf3,0x7d,0x28,0x3e,0xc1,0x02]
; CHECK-NEXT: vpunpcklqdq %xmm2, %xmm1, %xmm1 ## EVEX TO VEX Compression encoding: [0xc5,0xf1,0x6c,0xca]		; CHECK-NEXT: kmovd %k0, %edx ## encoding: [0xc5,0xfb,0x93,0xd0]
; CHECK-NEXT: ## xmm1 = xmm1[0],xmm2[0]		; CHECK-NEXT: vmovd %ecx, %xmm0 ## EVEX TO VEX Compression encoding: [0xc5,0xf9,0x6e,0xc1]
; CHECK-NEXT: vinserti128 $1, %xmm0, %ymm1, %ymm0 ## EVEX TO VEX Compression encoding: [0xc4,0xe3,0x75,0x38,0xc0,0x01]		; CHECK-NEXT: vmovd %eax, %xmm1 ## EVEX TO VEX Compression encoding: [0xc5,0xf9,0x6e,0xc8]
		; CHECK-NEXT: vpunpckldq %xmm0, %xmm1, %xmm0 ## EVEX TO VEX Compression encoding: [0xc5,0xf1,0x62,0xc0]
		; CHECK-NEXT: ## xmm0 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
		; CHECK-NEXT: vmovd %edx, %xmm1 ## EVEX TO VEX Compression encoding: [0xc5,0xf9,0x6e,0xca]
		; CHECK-NEXT: vpunpcklqdq %xmm1, %xmm0, %xmm0 ## EVEX TO VEX Compression encoding: [0xc5,0xf9,0x6c,0xc1]
		; CHECK-NEXT: ## xmm0 = xmm0[0],xmm1[0]
		; CHECK-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0 ## EVEX TO VEX Compression encoding: [0xc4,0xe3,0x7d,0x38,0xc2,0x01]
; CHECK-NEXT: retq ## encoding: [0xc3]		; CHECK-NEXT: retq ## encoding: [0xc3]
%res0 = call i32 @llvm.x86.avx512.mask.ucmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 0, i32 -1)		%res0 = call i32 @llvm.x86.avx512.mask.ucmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 0, i32 -1)
%vec0 = insertelement <8 x i32> undef, i32 %res0, i32 0		%vec0 = insertelement <8 x i32> undef, i32 %res0, i32 0
%res1 = call i32 @llvm.x86.avx512.mask.ucmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 1, i32 -1)		%res1 = call i32 @llvm.x86.avx512.mask.ucmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 1, i32 -1)
%vec1 = insertelement <8 x i32> %vec0, i32 %res1, i32 1		%vec1 = insertelement <8 x i32> %vec0, i32 %res1, i32 1
%res2 = call i32 @llvm.x86.avx512.mask.ucmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 2, i32 -1)		%res2 = call i32 @llvm.x86.avx512.mask.ucmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 2, i32 -1)
%vec2 = insertelement <8 x i32> %vec1, i32 %res2, i32 2		%vec2 = insertelement <8 x i32> %vec1, i32 %res2, i32 2
%res3 = call i32 @llvm.x86.avx512.mask.ucmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 3, i32 -1)		%res3 = call i32 @llvm.x86.avx512.mask.ucmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 3, i32 -1)
Show All 13 Lines
; CHECK-LABEL: test_mask_ucmp_b_256:		; CHECK-LABEL: test_mask_ucmp_b_256:
; CHECK: ## BB#0:		; CHECK: ## BB#0:
; CHECK-NEXT: kmovd %edi, %k1 ## encoding: [0xc5,0xfb,0x92,0xcf]		; CHECK-NEXT: kmovd %edi, %k1 ## encoding: [0xc5,0xfb,0x92,0xcf]
; CHECK-NEXT: vpcmpeqb %ymm1, %ymm0, %k0 {%k1} ## encoding: [0x62,0xf1,0x7d,0x29,0x74,0xc1]		; CHECK-NEXT: vpcmpeqb %ymm1, %ymm0, %k0 {%k1} ## encoding: [0x62,0xf1,0x7d,0x29,0x74,0xc1]
; CHECK-NEXT: kmovd %k0, %r8d ## encoding: [0xc5,0x7b,0x93,0xc0]		; CHECK-NEXT: kmovd %k0, %r8d ## encoding: [0xc5,0x7b,0x93,0xc0]
; CHECK-NEXT: vpcmpltub %ymm1, %ymm0, %k0 {%k1} ## encoding: [0x62,0xf3,0x7d,0x29,0x3e,0xc1,0x01]		; CHECK-NEXT: vpcmpltub %ymm1, %ymm0, %k0 {%k1} ## encoding: [0x62,0xf3,0x7d,0x29,0x3e,0xc1,0x01]
; CHECK-NEXT: kmovd %k0, %r9d ## encoding: [0xc5,0x7b,0x93,0xc8]		; CHECK-NEXT: kmovd %k0, %r9d ## encoding: [0xc5,0x7b,0x93,0xc8]
; CHECK-NEXT: vpcmpleub %ymm1, %ymm0, %k0 {%k1} ## encoding: [0x62,0xf3,0x7d,0x29,0x3e,0xc1,0x02]		; CHECK-NEXT: vpcmpleub %ymm1, %ymm0, %k0 {%k1} ## encoding: [0x62,0xf3,0x7d,0x29,0x3e,0xc1,0x02]
; CHECK-NEXT: kmovd %k0, %r10d ## encoding: [0xc5,0x7b,0x93,0xd0]		; CHECK-NEXT: kmovd %k0, %edx ## encoding: [0xc5,0xfb,0x93,0xd0]
; CHECK-NEXT: kxord %k0, %k0, %k0 ## encoding: [0xc4,0xe1,0xfd,0x47,0xc0]
; CHECK-NEXT: kmovd %k0, %esi ## encoding: [0xc5,0xfb,0x93,0xf0]
; CHECK-NEXT: vpcmpneqb %ymm1, %ymm0, %k0 {%k1} ## encoding: [0x62,0xf3,0x7d,0x29,0x3f,0xc1,0x04]		; CHECK-NEXT: vpcmpneqb %ymm1, %ymm0, %k0 {%k1} ## encoding: [0x62,0xf3,0x7d,0x29,0x3f,0xc1,0x04]
; CHECK-NEXT: kmovd %k0, %eax ## encoding: [0xc5,0xfb,0x93,0xc0]		; CHECK-NEXT: kmovd %k0, %esi ## encoding: [0xc5,0xfb,0x93,0xf0]
; CHECK-NEXT: vpcmpnltub %ymm1, %ymm0, %k0 {%k1} ## encoding: [0x62,0xf3,0x7d,0x29,0x3e,0xc1,0x05]		; CHECK-NEXT: vpcmpnltub %ymm1, %ymm0, %k0 {%k1} ## encoding: [0x62,0xf3,0x7d,0x29,0x3e,0xc1,0x05]
; CHECK-NEXT: kmovd %k0, %ecx ## encoding: [0xc5,0xfb,0x93,0xc8]		; CHECK-NEXT: kmovd %k0, %eax ## encoding: [0xc5,0xfb,0x93,0xc0]
; CHECK-NEXT: vpcmpnleub %ymm1, %ymm0, %k0 {%k1} ## encoding: [0x62,0xf3,0x7d,0x29,0x3e,0xc1,0x06]		; CHECK-NEXT: vpcmpnleub %ymm1, %ymm0, %k0 {%k1} ## encoding: [0x62,0xf3,0x7d,0x29,0x3e,0xc1,0x06]
; CHECK-NEXT: kmovd %k0, %edx ## encoding: [0xc5,0xfb,0x93,0xd0]		; CHECK-NEXT: kmovd %k0, %ecx ## encoding: [0xc5,0xfb,0x93,0xc8]
; CHECK-NEXT: vmovd %eax, %xmm0 ## EVEX TO VEX Compression encoding: [0xc5,0xf9,0x6e,0xc0]		; CHECK-NEXT: vmovd %esi, %xmm0 ## EVEX TO VEX Compression encoding: [0xc5,0xf9,0x6e,0xc6]
; CHECK-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0 ## encoding: [0xc4,0xe3,0x79,0x22,0xc1,0x01]		; CHECK-NEXT: vpinsrd $1, %eax, %xmm0, %xmm0 ## encoding: [0xc4,0xe3,0x79,0x22,0xc0,0x01]
; CHECK-NEXT: vpinsrd $2, %edx, %xmm0, %xmm0 ## encoding: [0xc4,0xe3,0x79,0x22,0xc2,0x02]		; CHECK-NEXT: vpinsrd $2, %ecx, %xmm0, %xmm0 ## encoding: [0xc4,0xe3,0x79,0x22,0xc1,0x02]
; CHECK-NEXT: vpinsrd $3, %edi, %xmm0, %xmm0 ## encoding: [0xc4,0xe3,0x79,0x22,0xc7,0x03]		; CHECK-NEXT: vpinsrd $3, %edi, %xmm0, %xmm0 ## encoding: [0xc4,0xe3,0x79,0x22,0xc7,0x03]
; CHECK-NEXT: vmovd %r8d, %xmm1 ## EVEX TO VEX Compression encoding: [0xc4,0xc1,0x79,0x6e,0xc8]		; CHECK-NEXT: vmovd %r8d, %xmm1 ## EVEX TO VEX Compression encoding: [0xc4,0xc1,0x79,0x6e,0xc8]
; CHECK-NEXT: vpinsrd $1, %r9d, %xmm1, %xmm1 ## encoding: [0xc4,0xc3,0x71,0x22,0xc9,0x01]		; CHECK-NEXT: vpinsrd $1, %r9d, %xmm1, %xmm1 ## encoding: [0xc4,0xc3,0x71,0x22,0xc9,0x01]
; CHECK-NEXT: vpinsrd $2, %r10d, %xmm1, %xmm1 ## encoding: [0xc4,0xc3,0x71,0x22,0xca,0x02]		; CHECK-NEXT: vpinsrd $2, %edx, %xmm1, %xmm1 ## encoding: [0xc4,0xe3,0x71,0x22,0xca,0x02]
; CHECK-NEXT: vpinsrd $3, %esi, %xmm1, %xmm1 ## encoding: [0xc4,0xe3,0x71,0x22,0xce,0x03]		; CHECK-NEXT: kxord %k0, %k0, %k0 ## encoding: [0xc4,0xe1,0xfd,0x47,0xc0]
		; CHECK-NEXT: kmovd %k0, %eax ## encoding: [0xc5,0xfb,0x93,0xc0]
		; CHECK-NEXT: vpinsrd $3, %eax, %xmm1, %xmm1 ## encoding: [0xc4,0xe3,0x71,0x22,0xc8,0x03]
; CHECK-NEXT: vinserti128 $1, %xmm0, %ymm1, %ymm0 ## EVEX TO VEX Compression encoding: [0xc4,0xe3,0x75,0x38,0xc0,0x01]		; CHECK-NEXT: vinserti128 $1, %xmm0, %ymm1, %ymm0 ## EVEX TO VEX Compression encoding: [0xc4,0xe3,0x75,0x38,0xc0,0x01]
; CHECK-NEXT: retq ## encoding: [0xc3]		; CHECK-NEXT: retq ## encoding: [0xc3]
%res0 = call i32 @llvm.x86.avx512.mask.ucmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 0, i32 %mask)		%res0 = call i32 @llvm.x86.avx512.mask.ucmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 0, i32 %mask)
%vec0 = insertelement <8 x i32> undef, i32 %res0, i32 0		%vec0 = insertelement <8 x i32> undef, i32 %res0, i32 0
%res1 = call i32 @llvm.x86.avx512.mask.ucmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 1, i32 %mask)		%res1 = call i32 @llvm.x86.avx512.mask.ucmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 1, i32 %mask)
%vec1 = insertelement <8 x i32> %vec0, i32 %res1, i32 1		%vec1 = insertelement <8 x i32> %vec0, i32 %res1, i32 1
%res2 = call i32 @llvm.x86.avx512.mask.ucmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 2, i32 %mask)		%res2 = call i32 @llvm.x86.avx512.mask.ucmp.b.256(<32 x i8> %a0, <32 x i8> %a1, i32 2, i32 %mask)
%vec2 = insertelement <8 x i32> %vec1, i32 %res2, i32 2		%vec2 = insertelement <8 x i32> %vec1, i32 %res2, i32 2
▲ Show 20 Lines • Show All 572 Lines • Show Last 20 Lines

test/CodeGen/X86/avx512vl-vec-cmp.ll

	Show First 20 Lines • Show All 308 Lines • ▼ Show 20 Lines
	; VLX: # BB#0:			; VLX: # BB#0:
	; VLX-NEXT: vpcmpgtq %ymm2, %ymm1, %k1			; VLX-NEXT: vpcmpgtq %ymm2, %ymm1, %k1
	; VLX-NEXT: vpcmpgtq (%rdi), %ymm0, %k1 {%k1}			; VLX-NEXT: vpcmpgtq (%rdi), %ymm0, %k1 {%k1}
	; VLX-NEXT: vpblendmq %ymm0, %ymm1, %ymm0 {%k1}			; VLX-NEXT: vpblendmq %ymm0, %ymm1, %ymm0 {%k1}
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test256_11:			; NoVLX-LABEL: test256_11:
	; NoVLX: # BB#0:			; NoVLX: # BB#0:
	; NoVLX-NEXT: vpcmpgtq %ymm2, %ymm1, %ymm2
	; NoVLX-NEXT: vpcmpgtq (%rdi), %ymm0, %ymm3			; NoVLX-NEXT: vpcmpgtq (%rdi), %ymm0, %ymm3
				; NoVLX-NEXT: vpcmpgtq %ymm2, %ymm1, %ymm2
	; NoVLX-NEXT: vpand %ymm2, %ymm3, %ymm2			; NoVLX-NEXT: vpand %ymm2, %ymm3, %ymm2
	; NoVLX-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	%mask1 = icmp sgt <4 x i64> %x1, %y1			%mask1 = icmp sgt <4 x i64> %x1, %y1
	%y = load <4 x i64>, <4 x i64>* %y.ptr, align 4			%y = load <4 x i64>, <4 x i64>* %y.ptr, align 4
	%mask0 = icmp sgt <4 x i64> %x, %y			%mask0 = icmp sgt <4 x i64> %x, %y
	%mask = select <4 x i1> %mask0, <4 x i1> %mask1, <4 x i1> zeroinitializer			%mask = select <4 x i1> %mask0, <4 x i1> %mask1, <4 x i1> zeroinitializer
	%max = select <4 x i1> %mask, <4 x i64> %x, <4 x i64> %x1			%max = select <4 x i1> %mask, <4 x i64> %x, <4 x i64> %x1
	▲ Show 20 Lines • Show All 492 Lines • ▼ Show 20 Lines
	; VLX: # BB#0:			; VLX: # BB#0:
	; VLX-NEXT: vpcmpgtq %xmm2, %xmm1, %k1			; VLX-NEXT: vpcmpgtq %xmm2, %xmm1, %k1
	; VLX-NEXT: vpcmpgtq (%rdi), %xmm0, %k1 {%k1}			; VLX-NEXT: vpcmpgtq (%rdi), %xmm0, %k1 {%k1}
	; VLX-NEXT: vpblendmq %xmm0, %xmm1, %xmm0 {%k1}			; VLX-NEXT: vpblendmq %xmm0, %xmm1, %xmm0 {%k1}
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test128_11:			; NoVLX-LABEL: test128_11:
	; NoVLX: # BB#0:			; NoVLX: # BB#0:
	; NoVLX-NEXT: vpcmpgtq %xmm2, %xmm1, %xmm2
	; NoVLX-NEXT: vpcmpgtq (%rdi), %xmm0, %xmm3			; NoVLX-NEXT: vpcmpgtq (%rdi), %xmm0, %xmm3
				; NoVLX-NEXT: vpcmpgtq %xmm2, %xmm1, %xmm2
	; NoVLX-NEXT: vpand %xmm2, %xmm3, %xmm2			; NoVLX-NEXT: vpand %xmm2, %xmm3, %xmm2
	; NoVLX-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	%mask1 = icmp sgt <2 x i64> %x1, %y1			%mask1 = icmp sgt <2 x i64> %x1, %y1
	%y = load <2 x i64>, <2 x i64>* %y.ptr, align 4			%y = load <2 x i64>, <2 x i64>* %y.ptr, align 4
	%mask0 = icmp sgt <2 x i64> %x, %y			%mask0 = icmp sgt <2 x i64> %x, %y
	%mask = select <2 x i1> %mask0, <2 x i1> %mask1, <2 x i1> zeroinitializer			%mask = select <2 x i1> %mask0, <2 x i1> %mask1, <2 x i1> zeroinitializer
	%max = select <2 x i1> %mask, <2 x i64> %x, <2 x i64> %x1			%max = select <2 x i1> %mask, <2 x i64> %x, <2 x i64> %x1
	▲ Show 20 Lines • Show All 201 Lines • Show Last 20 Lines

test/CodeGen/X86/avx512vl-vec-masked-cmp.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 94 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	▲ Show 20 Lines • Show All 106 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	▲ Show 20 Lines • Show All 109 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	▲ Show 20 Lines • Show All 110 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 29 Lines
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi32:			; NoVLX-NEXT: .Lcfi32:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi33:			; NoVLX-NEXT: .Lcfi33:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi34:			; NoVLX-NEXT: .Lcfi34:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi35:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi36:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi37:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi38:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi39:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpeqb %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqb %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <16 x i8>			%0 = bitcast <2 x i64> %__a to <16 x i8>
	%1 = bitcast <2 x i64> %__b to <16 x i8>			%1 = bitcast <2 x i64> %__b to <16 x i8>
	%2 = icmp eq <16 x i8> %0, %1			%2 = icmp eq <16 x i8> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_vpcmpeqb_v16i1_v64i1_mask_mem(<2 x i64> %__a, <2 x i64>* %__b) local_unnamed_addr {			define zeroext i64 @test_vpcmpeqb_v16i1_v64i1_mask_mem(<2 x i64> %__a, <2 x i64>* %__b) local_unnamed_addr {
	; VLX-LABEL: test_vpcmpeqb_v16i1_v64i1_mask_mem:			; VLX-LABEL: test_vpcmpeqb_v16i1_v64i1_mask_mem:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpeqb (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpeqb (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqb_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqb_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi40:			; NoVLX-NEXT: .Lcfi35:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi41:			; NoVLX-NEXT: .Lcfi36:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi42:			; NoVLX-NEXT: .Lcfi37:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi43:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi44:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi45:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi46:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi47:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpeqb (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqb (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <16 x i8>			%0 = bitcast <2 x i64> %__a to <16 x i8>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	%1 = bitcast <2 x i64> %load to <16 x i8>			%1 = bitcast <2 x i64> %load to <16 x i8>
	%2 = icmp eq <16 x i8> %0, %1			%2 = icmp eq <16 x i8> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_masked_vpcmpeqb_v16i1_v64i1_mask(i16 zeroext %__u, <2 x i64> %__a, <2 x i64> %__b) local_unnamed_addr {			define zeroext i64 @test_masked_vpcmpeqb_v16i1_v64i1_mask(i16 zeroext %__u, <2 x i64> %__a, <2 x i64> %__b) local_unnamed_addr {
	; VLX-LABEL: test_masked_vpcmpeqb_v16i1_v64i1_mask:			; VLX-LABEL: test_masked_vpcmpeqb_v16i1_v64i1_mask:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqb %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqb %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqb_v16i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqb_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi48:			; NoVLX-NEXT: .Lcfi38:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi49:			; NoVLX-NEXT: .Lcfi39:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi50:			; NoVLX-NEXT: .Lcfi40:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi51:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi52:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi53:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi54:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi55:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpeqb %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqb %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <16 x i8>			%0 = bitcast <2 x i64> %__a to <16 x i8>
	%1 = bitcast <2 x i64> %__b to <16 x i8>			%1 = bitcast <2 x i64> %__b to <16 x i8>
	%2 = icmp eq <16 x i8> %0, %1			%2 = icmp eq <16 x i8> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	%4 = and <16 x i1> %2, %3			%4 = and <16 x i1> %2, %3
	%5 = shufflevector <16 x i1> %4, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%5 = shufflevector <16 x i1> %4, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%6 = bitcast <64 x i1> %5 to i64			%6 = bitcast <64 x i1> %5 to i64
	ret i64 %6			ret i64 %6
	}			}

	define zeroext i64 @test_masked_vpcmpeqb_v16i1_v64i1_mask_mem(i16 zeroext %__u, <2 x i64> %__a, <2 x i64>* %__b) local_unnamed_addr {			define zeroext i64 @test_masked_vpcmpeqb_v16i1_v64i1_mask_mem(i16 zeroext %__u, <2 x i64> %__a, <2 x i64>* %__b) local_unnamed_addr {
	; VLX-LABEL: test_masked_vpcmpeqb_v16i1_v64i1_mask_mem:			; VLX-LABEL: test_masked_vpcmpeqb_v16i1_v64i1_mask_mem:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqb (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqb (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqb_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqb_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi56:			; NoVLX-NEXT: .Lcfi41:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi57:			; NoVLX-NEXT: .Lcfi42:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi58:			; NoVLX-NEXT: .Lcfi43:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi59:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi60:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi61:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi62:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi63:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpeqb (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqb (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <16 x i8>			%0 = bitcast <2 x i64> %__a to <16 x i8>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	%1 = bitcast <2 x i64> %load to <16 x i8>			%1 = bitcast <2 x i64> %load to <16 x i8>
	%2 = icmp eq <16 x i8> %0, %1			%2 = icmp eq <16 x i8> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	Show All 10 Lines
	; VLX-NEXT: vpcmpeqb %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpeqb %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqb_v32i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpeqb_v32i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi64:			; NoVLX-NEXT: .Lcfi44:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi65:			; NoVLX-NEXT: .Lcfi45:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi66:			; NoVLX-NEXT: .Lcfi46:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqb %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqb %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 27 Lines
	; VLX-NEXT: vpcmpeqb (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpeqb (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqb_v32i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqb_v32i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi67:			; NoVLX-NEXT: .Lcfi47:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi68:			; NoVLX-NEXT: .Lcfi48:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi69:			; NoVLX-NEXT: .Lcfi49:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqb (%rdi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqb (%rdi), %ymm0, %ymm0
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 29 Lines
	; VLX-NEXT: vpcmpeqb %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqb %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqb_v32i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqb_v32i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi70:			; NoVLX-NEXT: .Lcfi50:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi71:			; NoVLX-NEXT: .Lcfi51:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi72:			; NoVLX-NEXT: .Lcfi52:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vpmovdb %zmm2, %xmm2			; NoVLX-NEXT: vpmovdb %zmm2, %xmm2
	Show All 39 Lines
	; VLX-NEXT: vpcmpeqb (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqb (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqb_v32i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqb_v32i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi73:			; NoVLX-NEXT: .Lcfi53:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi74:			; NoVLX-NEXT: .Lcfi54:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi75:			; NoVLX-NEXT: .Lcfi55:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpmovdb %zmm1, %xmm1			; NoVLX-NEXT: vpmovdb %zmm1, %xmm1
	▲ Show 20 Lines • Show All 162 Lines • ▼ Show 20 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpeqw %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpeqw %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqw_v8i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpeqw_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi76:			; NoVLX-NEXT: .Lcfi56:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi77:			; NoVLX-NEXT: .Lcfi57:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi78:			; NoVLX-NEXT: .Lcfi58:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpeqw %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqw %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 13 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpeqw (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpeqw (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqw_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqw_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi79:			; NoVLX-NEXT: .Lcfi59:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi80:			; NoVLX-NEXT: .Lcfi60:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi81:			; NoVLX-NEXT: .Lcfi61:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpeqw (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqw (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 15 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqw %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqw %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqw_v8i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqw_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi82:			; NoVLX-NEXT: .Lcfi62:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi83:			; NoVLX-NEXT: .Lcfi63:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi84:			; NoVLX-NEXT: .Lcfi64:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpeqw %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqw %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 16 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqw (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqw (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqw_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqw_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi85:			; NoVLX-NEXT: .Lcfi65:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi86:			; NoVLX-NEXT: .Lcfi66:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi87:			; NoVLX-NEXT: .Lcfi67:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpeqw (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqw (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpeqw %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpeqw %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqw_v8i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpeqw_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi88:			; NoVLX-NEXT: .Lcfi68:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi89:			; NoVLX-NEXT: .Lcfi69:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi90:			; NoVLX-NEXT: .Lcfi70:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqw %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqw %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpeqw (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpeqw (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqw_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqw_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi91:			; NoVLX-NEXT: .Lcfi71:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi92:			; NoVLX-NEXT: .Lcfi72:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi93:			; NoVLX-NEXT: .Lcfi73:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqw (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqw (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqw %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqw %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqw_v8i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqw_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi94:			; NoVLX-NEXT: .Lcfi74:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi95:			; NoVLX-NEXT: .Lcfi75:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi96:			; NoVLX-NEXT: .Lcfi76:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqw %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqw %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}
	▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqw (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqw (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqw_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqw_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi97:			; NoVLX-NEXT: .Lcfi77:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi98:			; NoVLX-NEXT: .Lcfi78:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi99:			; NoVLX-NEXT: .Lcfi79:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqw (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqw (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpeqw %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpeqw %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqw_v16i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpeqw_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi100:			; NoVLX-NEXT: .Lcfi80:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi101:			; NoVLX-NEXT: .Lcfi81:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi102:			; NoVLX-NEXT: .Lcfi82:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi103:			; NoVLX-NEXT: .Lcfi83:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi104:			; NoVLX-NEXT: .Lcfi84:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi105:			; NoVLX-NEXT: .Lcfi85:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi106:			; NoVLX-NEXT: .Lcfi86:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi107:			; NoVLX-NEXT: .Lcfi87:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 19 Lines
	; VLX-NEXT: vpcmpeqw (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpeqw (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqw_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqw_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi108:			; NoVLX-NEXT: .Lcfi88:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi109:			; NoVLX-NEXT: .Lcfi89:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi110:			; NoVLX-NEXT: .Lcfi90:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi111:			; NoVLX-NEXT: .Lcfi91:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi112:			; NoVLX-NEXT: .Lcfi92:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi113:			; NoVLX-NEXT: .Lcfi93:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi114:			; NoVLX-NEXT: .Lcfi94:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi115:			; NoVLX-NEXT: .Lcfi95:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpeqw (%rdi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqw (%rdi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 21 Lines
	; VLX-NEXT: vpcmpeqw %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqw %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqw_v16i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqw_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi116:			; NoVLX-NEXT: .Lcfi96:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi117:			; NoVLX-NEXT: .Lcfi97:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi118:			; NoVLX-NEXT: .Lcfi98:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi119:			; NoVLX-NEXT: .Lcfi99:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi120:			; NoVLX-NEXT: .Lcfi100:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi121:			; NoVLX-NEXT: .Lcfi101:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi122:			; NoVLX-NEXT: .Lcfi102:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi123:			; NoVLX-NEXT: .Lcfi103:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 22 Lines
	; VLX-NEXT: vpcmpeqw (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqw (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqw_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqw_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi124:			; NoVLX-NEXT: .Lcfi104:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi125:			; NoVLX-NEXT: .Lcfi105:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi126:			; NoVLX-NEXT: .Lcfi106:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi127:			; NoVLX-NEXT: .Lcfi107:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi128:			; NoVLX-NEXT: .Lcfi108:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi129:			; NoVLX-NEXT: .Lcfi109:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi130:			; NoVLX-NEXT: .Lcfi110:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi131:			; NoVLX-NEXT: .Lcfi111:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpeqw (%rsi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqw (%rsi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 23 Lines
	; VLX-NEXT: vpcmpeqw %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpeqw %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqw_v16i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpeqw_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi132:			; NoVLX-NEXT: .Lcfi112:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi133:			; NoVLX-NEXT: .Lcfi113:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi134:			; NoVLX-NEXT: .Lcfi114:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi135:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi136:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi137:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi138:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi139:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <4 x i64> %__a to <16 x i16>			%0 = bitcast <4 x i64> %__a to <16 x i16>
	%1 = bitcast <4 x i64> %__b to <16 x i16>			%1 = bitcast <4 x i64> %__b to <16 x i16>
	%2 = icmp eq <16 x i16> %0, %1			%2 = icmp eq <16 x i16> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_vpcmpeqw_v16i1_v64i1_mask_mem(<4 x i64> %__a, <4 x i64>* %__b) local_unnamed_addr {			define zeroext i64 @test_vpcmpeqw_v16i1_v64i1_mask_mem(<4 x i64> %__a, <4 x i64>* %__b) local_unnamed_addr {
	; VLX-LABEL: test_vpcmpeqw_v16i1_v64i1_mask_mem:			; VLX-LABEL: test_vpcmpeqw_v16i1_v64i1_mask_mem:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpeqw (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpeqw (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqw_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqw_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi140:			; NoVLX-NEXT: .Lcfi115:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi141:			; NoVLX-NEXT: .Lcfi116:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi142:			; NoVLX-NEXT: .Lcfi117:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi143:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi144:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi145:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi146:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi147:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpeqw (%rdi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqw (%rdi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <4 x i64> %__a to <16 x i16>			%0 = bitcast <4 x i64> %__a to <16 x i16>
	%load = load <4 x i64>, <4 x i64>* %__b			%load = load <4 x i64>, <4 x i64>* %__b
	%1 = bitcast <4 x i64> %load to <16 x i16>			%1 = bitcast <4 x i64> %load to <16 x i16>
	%2 = icmp eq <16 x i16> %0, %1			%2 = icmp eq <16 x i16> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_masked_vpcmpeqw_v16i1_v64i1_mask(i16 zeroext %__u, <4 x i64> %__a, <4 x i64> %__b) local_unnamed_addr {			define zeroext i64 @test_masked_vpcmpeqw_v16i1_v64i1_mask(i16 zeroext %__u, <4 x i64> %__a, <4 x i64> %__b) local_unnamed_addr {
	; VLX-LABEL: test_masked_vpcmpeqw_v16i1_v64i1_mask:			; VLX-LABEL: test_masked_vpcmpeqw_v16i1_v64i1_mask:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqw %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqw %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqw_v16i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqw_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi148:			; NoVLX-NEXT: .Lcfi118:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi149:			; NoVLX-NEXT: .Lcfi119:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi150:			; NoVLX-NEXT: .Lcfi120:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi151:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi152:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi153:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi154:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi155:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <4 x i64> %__a to <16 x i16>			%0 = bitcast <4 x i64> %__a to <16 x i16>
	%1 = bitcast <4 x i64> %__b to <16 x i16>			%1 = bitcast <4 x i64> %__b to <16 x i16>
	%2 = icmp eq <16 x i16> %0, %1			%2 = icmp eq <16 x i16> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	%4 = and <16 x i1> %2, %3			%4 = and <16 x i1> %2, %3
	Show All 9 Lines
	; VLX-NEXT: vpcmpeqw (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqw (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqw_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqw_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi156:			; NoVLX-NEXT: .Lcfi121:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi157:			; NoVLX-NEXT: .Lcfi122:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi158:			; NoVLX-NEXT: .Lcfi123:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi159:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi160:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi161:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi162:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi163:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpeqw (%rsi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqw (%rsi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <4 x i64> %__a to <16 x i16>			%0 = bitcast <4 x i64> %__a to <16 x i16>
	%load = load <4 x i64>, <4 x i64>* %__b			%load = load <4 x i64>, <4 x i64>* %__b
	%1 = bitcast <4 x i64> %load to <16 x i16>			%1 = bitcast <4 x i64> %load to <16 x i16>
	%2 = icmp eq <16 x i16> %0, %1			%2 = icmp eq <16 x i16> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	Show All 10 Lines
	; VLX-NEXT: vpcmpeqw %zmm1, %zmm0, %k0			; VLX-NEXT: vpcmpeqw %zmm1, %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqw_v32i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpeqw_v32i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi164:			; NoVLX-NEXT: .Lcfi124:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi165:			; NoVLX-NEXT: .Lcfi125:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi166:			; NoVLX-NEXT: .Lcfi126:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm3			; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm2
	; NoVLX-NEXT: vmovq %xmm3, %rax			; NoVLX-NEXT: vmovq %xmm2, %rax
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: movq %rax, %rdx			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: vmovd %eax, %xmm2			; NoVLX-NEXT: vmovd %eax, %xmm3
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm5			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vextracti32x4 $2, %zmm1, %xmm8			; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm4
	; NoVLX-NEXT: vextracti32x4 $3, %zmm1, %xmm4			; NoVLX-NEXT: vpextrq $1, %xmm4, %rax
	; NoVLX-NEXT: vextracti32x4 $1, %zmm1, %xmm6
	; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm7
	; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm2
	; NoVLX-NEXT: shrq $32, %rdx			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %edx, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm3, %xmm3
	; NoVLX-NEXT: vpextrq $1, %xmm3, %rax			; NoVLX-NEXT: vpextrq $1, %xmm2, %rdx
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %edx, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %edx, %xmm2, %xmm2
				; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
				; NoVLX-NEXT: movq %rdx, %rcx
				; NoVLX-NEXT: shrq $32, %rcx
				; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
				; NoVLX-NEXT: vmovq %xmm0, %rcx
				; NoVLX-NEXT: shrq $48, %rdx
				; NoVLX-NEXT: vpinsrw $7, %edx, %xmm2, %xmm9
				; NoVLX-NEXT: movl %ecx, %edx
				; NoVLX-NEXT: shrl $16, %edx
				; NoVLX-NEXT: vmovd %ecx, %xmm3
				; NoVLX-NEXT: vpinsrw $1, %edx, %xmm3, %xmm3
				; NoVLX-NEXT: movq %rcx, %rdx
				; NoVLX-NEXT: shrq $32, %rdx
				; NoVLX-NEXT: vpinsrw $2, %edx, %xmm3, %xmm3
				; NoVLX-NEXT: vpextrq $1, %xmm0, %rdx
				; NoVLX-NEXT: shrq $48, %rcx
				; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm3
				; NoVLX-NEXT: movl %edx, %ecx
				; NoVLX-NEXT: shrl $16, %ecx
				; NoVLX-NEXT: vpinsrw $4, %edx, %xmm3, %xmm3
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rdx, %rcx
				; NoVLX-NEXT: shrq $48, %rdx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: vmovq %xmm0, %rcx			; NoVLX-NEXT: vpinsrw $7, %edx, %xmm3, %xmm3
				; NoVLX-NEXT: vmovq %xmm4, %rcx
				; NoVLX-NEXT: movl %ecx, %edx
				; NoVLX-NEXT: shrl $16, %edx
				; NoVLX-NEXT: vmovd %ecx, %xmm4
				; NoVLX-NEXT: vpinsrw $1, %edx, %xmm4, %xmm4
				; NoVLX-NEXT: movq %rcx, %rdx
				; NoVLX-NEXT: shrq $32, %rdx
				; NoVLX-NEXT: vpinsrw $2, %edx, %xmm4, %xmm4
				; NoVLX-NEXT: movl %eax, %edx
				; NoVLX-NEXT: shrl $16, %edx
				; NoVLX-NEXT: shrq $48, %rcx
				; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm4
				; NoVLX-NEXT: vpinsrw $4, %eax, %xmm4, %xmm4
				; NoVLX-NEXT: vpinsrw $5, %edx, %xmm4, %xmm4
				; NoVLX-NEXT: vextracti32x4 $1, %zmm1, %xmm6
				; NoVLX-NEXT: vmovq %xmm6, %rcx
				; NoVLX-NEXT: movq %rax, %rdx
				; NoVLX-NEXT: shrq $32, %rdx
				; NoVLX-NEXT: vpinsrw $6, %edx, %xmm4, %xmm4
				; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm0
				; NoVLX-NEXT: vmovq %xmm0, %rdx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %edx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm5			; NoVLX-NEXT: vmovd %edx, %xmm5
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rdx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: vpextrq $1, %xmm0, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rdx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm0			; NoVLX-NEXT: vpinsrw $3, %edx, %xmm5, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %edx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %edx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $5, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $6, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vmovq %xmm2, %rcx			; NoVLX-NEXT: movq %rcx, %rdx
				; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm5
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm5			; NoVLX-NEXT: vmovd %ecx, %xmm0
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: vmovq %xmm1, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpextrq $1, %xmm6, %rdx
	; NoVLX-NEXT: vpextrq $1, %xmm2, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %edx, %ecx
				; NoVLX-NEXT: vpinsrw $4, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: movq %rdx, %rcx
	; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vmovq %xmm7, %rcx
	; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm5
	; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm7, %rax
	; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: shrq $48, %rdx
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $7, %edx, %xmm0, %xmm8
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: vmovd %eax, %xmm6
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: vpinsrw $1, %ecx, %xmm6, %xmm6
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vextracti32x4 $3, %zmm1, %xmm7
	; NoVLX-NEXT: vmovq %xmm6, %rcx			; NoVLX-NEXT: vmovq %xmm7, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm7			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm6, %xmm6
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: movl %ecx, %edx
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: shrl $16, %edx
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm0
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: vpinsrw $1, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: movq %rcx, %rdx
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpextrq $1, %xmm6, %rax			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpextrq $1, %xmm7, %rdx
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %edx, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rdx, %rcx
	; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vmovq %xmm1, %rcx
	; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm6
	; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm1, %rax
	; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm1
	; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vmovq %xmm4, %rcx			; NoVLX-NEXT: vextracti32x4 $2, %zmm1, %xmm7
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: vmovq %xmm7, %rcx
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1			; NoVLX-NEXT: shrq $48, %rdx
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: vpinsrw $7, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: movl %ecx, %edx
				; NoVLX-NEXT: shrl $16, %edx
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rdx
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm4, %rax			; NoVLX-NEXT: vpextrq $1, %xmm7, %rdx
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %edx, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rdx, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vmovq %xmm8, %rcx			; NoVLX-NEXT: shrq $48, %rdx
				; NoVLX-NEXT: vpinsrw $7, %edx, %xmm2, %xmm2
				; NoVLX-NEXT: vpextrq $1, %xmm1, %rcx
				; NoVLX-NEXT: vinserti128 $1, %xmm9, %ymm3, %ymm1
				; NoVLX-NEXT: vinserti128 $1, %xmm4, %ymm5, %ymm3
				; NoVLX-NEXT: vinserti128 $1, %xmm0, %ymm2, %ymm0
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $3, %eax, %xmm6, %xmm2
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm4			; NoVLX-NEXT: vpinsrw $4, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $5, %eax, %xmm2, %xmm2
				; NoVLX-NEXT: vpcmpeqw %ymm0, %ymm3, %ymm0
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $6, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm8, %rax
	; NoVLX-NEXT: vinserti128 $1, %xmm3, %ymm0, %ymm0
	; NoVLX-NEXT: vinserti128 $1, %xmm5, %ymm7, %ymm3
	; NoVLX-NEXT: vinserti128 $1, %xmm6, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm1			; NoVLX-NEXT: vpinsrw $7, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vinserti128 $1, %xmm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpeqw %ymm1, %ymm3, %ymm1
	; NoVLX-NEXT: vpmovsxwd %ymm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $2, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $3, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $6, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $9, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $10, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $10, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $13, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $14, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $14, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: vinserti128 $1, %xmm8, %ymm2, %ymm2
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpcmpeqw %ymm2, %ymm1, %ymm1
				; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
				; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
				; NoVLX-NEXT: vpmovsxwd %ymm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm0			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $1, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $2, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $3, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $10, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $14, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %eax, %xmm1, %xmm1
				; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm1, %xmm0
				; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %ecx			; NoVLX-NEXT: movl (%rsp), %ecx
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 18 Lines
	; VLX-NEXT: vpcmpeqw (%rdi), %zmm0, %k0			; VLX-NEXT: vpcmpeqw (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqw_v32i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqw_v32i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi167:			; NoVLX-NEXT: .Lcfi127:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi168:			; NoVLX-NEXT: .Lcfi128:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi169:			; NoVLX-NEXT: .Lcfi129:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm2			; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm1
	; NoVLX-NEXT: vmovq %xmm2, %rax			; NoVLX-NEXT: vmovq %xmm1, %rax
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: movq %rax, %rdx			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: vmovd %eax, %xmm1			; NoVLX-NEXT: vmovd %eax, %xmm2
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm1, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm1
	; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm4
	; NoVLX-NEXT: shrq $32, %rdx			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %edx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm2, %rax			; NoVLX-NEXT: vpextrq $1, %xmm1, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm1
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: vmovq %xmm0, %rcx			; NoVLX-NEXT: vmovq %xmm0, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm0, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm0			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vmovq %xmm4, %rcx			; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm3
				; NoVLX-NEXT: vmovq %xmm3, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm4
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vpextrq $1, %xmm4, %rax			; NoVLX-NEXT: vpextrq $1, %xmm3, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm3
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: vmovq %xmm1, %rcx			; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm0
				; NoVLX-NEXT: vmovq %xmm0, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm4			; NoVLX-NEXT: vmovd %ecx, %xmm4
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vpextrq $1, %xmm1, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm1			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vinserti128 $1, %xmm3, %ymm1, %ymm1			; NoVLX-NEXT: vinserti128 $1, %xmm3, %ymm0, %ymm0
	; NoVLX-NEXT: vpcmpeqw 32(%rdi), %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqw 32(%rdi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm1, %zmm1			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %eax, %xmm1			; NoVLX-NEXT: vmovd %eax, %xmm0
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $1, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $2, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $3, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $6, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $9, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $10, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $10, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $13, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $14, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $14, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vinserti128 $1, %xmm1, %ymm2, %ymm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
				; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpcmpeqw (%rdi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqw (%rdi), %ymm1, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpeqw %zmm1, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqw %zmm1, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqw_v32i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqw_v32i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi170:			; NoVLX-NEXT: .Lcfi130:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi171:			; NoVLX-NEXT: .Lcfi131:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi172:			; NoVLX-NEXT: .Lcfi132:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm2			; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm2
	; NoVLX-NEXT: vmovq %xmm2, %rax			; NoVLX-NEXT: vmovq %xmm2, %rax
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: movq %rax, %rdx			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: vmovd %eax, %xmm3			; NoVLX-NEXT: vmovd %eax, %xmm3
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm4			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vextracti32x4 $1, %zmm1, %xmm8
	; NoVLX-NEXT: vextracti32x4 $2, %zmm1, %xmm5
	; NoVLX-NEXT: vextracti32x4 $3, %zmm1, %xmm7
	; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm6
	; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm3
	; NoVLX-NEXT: shrq $32, %rdx			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %edx, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm3, %xmm3
	; NoVLX-NEXT: vpextrq $1, %xmm2, %rax			; NoVLX-NEXT: vpextrq $1, %xmm2, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
				; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm3
	; NoVLX-NEXT: vmovq %xmm3, %rcx			; NoVLX-NEXT: vmovq %xmm3, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm9			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm8
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm4			; NoVLX-NEXT: vmovd %ecx, %xmm4
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vpextrq $1, %xmm3, %rax			; NoVLX-NEXT: vpextrq $1, %xmm3, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm3
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: vmovq %xmm6, %rcx			; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm4
				; NoVLX-NEXT: vmovq %xmm4, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm4			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm5
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: vpextrq $1, %xmm6, %rax			; NoVLX-NEXT: vpextrq $1, %xmm4, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm4
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm4, %xmm4
	; NoVLX-NEXT: vmovq %xmm0, %rcx			; NoVLX-NEXT: vmovq %xmm0, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm6			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm5
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: vpextrq $1, %xmm0, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm0			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vmovq %xmm7, %rcx			; NoVLX-NEXT: vextracti32x4 $3, %zmm1, %xmm5
				; NoVLX-NEXT: vmovq %xmm5, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm6
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm6, %xmm6
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm6, %xmm6
	; NoVLX-NEXT: vpextrq $1, %xmm7, %rax			; NoVLX-NEXT: vpextrq $1, %xmm5, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm6, %xmm5
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm5, %xmm5
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm5, %xmm5
	; NoVLX-NEXT: vmovq %xmm5, %rcx			; NoVLX-NEXT: vextracti32x4 $2, %zmm1, %xmm6
				; NoVLX-NEXT: vmovq %xmm6, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm7			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm7
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm7, %xmm7
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm7, %xmm7
	; NoVLX-NEXT: vpextrq $1, %xmm5, %rax			; NoVLX-NEXT: vpextrq $1, %xmm6, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm7, %xmm6
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm6, %xmm6
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm6, %xmm6
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm6, %xmm6
	; NoVLX-NEXT: vmovq %xmm8, %rcx			; NoVLX-NEXT: vextracti32x4 $1, %zmm1, %xmm7
				; NoVLX-NEXT: vmovq %xmm7, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm6, %xmm6
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm5			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm8, %rax			; NoVLX-NEXT: vpextrq $1, %xmm7, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vmovq %xmm1, %rcx			; NoVLX-NEXT: vmovq %xmm1, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm7
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm7, %xmm7
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm7, %xmm7
	; NoVLX-NEXT: vpextrq $1, %xmm1, %rax			; NoVLX-NEXT: vpextrq $1, %xmm1, %rax
	; NoVLX-NEXT: vinserti128 $1, %xmm9, %ymm4, %ymm1			; NoVLX-NEXT: vinserti128 $1, %xmm8, %ymm3, %ymm1
	; NoVLX-NEXT: vinserti128 $1, %xmm6, %ymm0, %ymm4			; NoVLX-NEXT: vinserti128 $1, %xmm4, %ymm0, %ymm4
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2
	; NoVLX-NEXT: vinserti128 $1, %xmm7, %ymm3, %ymm3			; NoVLX-NEXT: vinserti128 $1, %xmm5, %ymm6, %ymm3
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: vpmovdb %zmm0, %xmm0			; NoVLX-NEXT: vpmovdb %zmm0, %xmm0
	; NoVLX-NEXT: vpcmpeqw %ymm3, %ymm1, %ymm3
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k2} {z}
	; NoVLX-NEXT: vpmovdb %zmm1, %xmm1
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpcmpeqw %ymm3, %ymm1, %ymm3
				; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm7, %xmm1
				; NoVLX-NEXT: vpternlogd $255, %zmm5, %zmm5, %zmm5 {%k2} {z}
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm6
	; NoVLX-NEXT: vinserti128 $1, %xmm5, %ymm2, %ymm2			; NoVLX-NEXT: vpmovdb %zmm5, %xmm1
				; NoVLX-NEXT: vinserti128 $1, %xmm2, %ymm6, %ymm2
	; NoVLX-NEXT: vpcmpeqw %ymm2, %ymm4, %ymm2			; NoVLX-NEXT: vpcmpeqw %ymm2, %ymm4, %ymm2
	; NoVLX-NEXT: vpmovsxwd %ymm2, %zmm2			; NoVLX-NEXT: vpmovsxwd %ymm2, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2
	; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0			; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	▲ Show 20 Lines • Show All 160 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpeqw (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqw (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqw_v32i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqw_v32i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi173:			; NoVLX-NEXT: .Lcfi133:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi174:			; NoVLX-NEXT: .Lcfi134:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi175:			; NoVLX-NEXT: .Lcfi135:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm1			; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm1
	; NoVLX-NEXT: vmovq %xmm1, %rax			; NoVLX-NEXT: vmovq %xmm1, %rax
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: movq %rax, %rdx			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: vmovd %eax, %xmm2			; NoVLX-NEXT: vmovd %eax, %xmm2
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm3
	; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm4
	; NoVLX-NEXT: shrq $32, %rdx			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %edx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm1, %rax			; NoVLX-NEXT: vpextrq $1, %xmm1, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm1			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm1
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: vmovq %xmm4, %rcx			; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm2
				; NoVLX-NEXT: vmovq %xmm2, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm3
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpextrq $1, %xmm4, %rax			; NoVLX-NEXT: vpextrq $1, %xmm2, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
				; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm3
	; NoVLX-NEXT: vmovq %xmm3, %rcx			; NoVLX-NEXT: vmovq %xmm3, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm4			; NoVLX-NEXT: vmovd %ecx, %xmm4
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vpextrq $1, %xmm3, %rax			; NoVLX-NEXT: vpextrq $1, %xmm3, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm3
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: vmovq %xmm0, %rcx			; NoVLX-NEXT: vmovq %xmm0, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm4			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm4
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vpextrq $1, %xmm0, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm0			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm5			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm4
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: vpmovdb %zmm0, %xmm0			; NoVLX-NEXT: vpmovdb %zmm0, %xmm0
	; NoVLX-NEXT: vinserti128 $1, %xmm1, %ymm2, %ymm3
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k2} {z}
	; NoVLX-NEXT: vpmovdb %zmm1, %xmm1
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm5, %xmm2			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vinserti128 $1, %xmm4, %ymm2, %ymm2			; NoVLX-NEXT: vinserti128 $1, %xmm3, %ymm4, %ymm3
	; NoVLX-NEXT: vpcmpeqw (%rsi), %ymm2, %ymm2			; NoVLX-NEXT: vpternlogd $255, %zmm4, %zmm4, %zmm4 {%k2} {z}
	; NoVLX-NEXT: vpmovsxwd %ymm2, %zmm2			; NoVLX-NEXT: vpcmpeqw (%rsi), %ymm3, %ymm3
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2			; NoVLX-NEXT: vpmovsxwd %ymm3, %zmm3
	; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0			; NoVLX-NEXT: vpslld $31, %zmm3, %zmm3
				; NoVLX-NEXT: vptestmd %zmm3, %zmm3, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %eax, %xmm2			; NoVLX-NEXT: vmovd %eax, %xmm3
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $1, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $2, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $3, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $3, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $6, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $6, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $9, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $9, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $10, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $10, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $13, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $14, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $14, %eax, %xmm3, %xmm3
				; NoVLX-NEXT: vpmovdb %zmm4, %xmm4
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpcmpeqw 32(%rsi), %ymm3, %ymm3			; NoVLX-NEXT: vinserti128 $1, %xmm1, %ymm2, %ymm1
	; NoVLX-NEXT: vpmovsxwd %ymm3, %zmm3			; NoVLX-NEXT: vpcmpeqw 32(%rsi), %ymm1, %ymm1
	; NoVLX-NEXT: vpslld $31, %zmm3, %zmm3			; NoVLX-NEXT: vpmovsxwd %ymm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm3, %zmm3, %k0			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
				; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $1, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $2, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $3, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $3, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $6, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $6, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $9, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $9, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $10, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $10, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $13, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $14, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $14, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm3, %xmm1			; NoVLX-NEXT: vpand %xmm4, %xmm1, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpand %xmm0, %xmm2, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm3, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %ecx			; NoVLX-NEXT: movl (%rsp), %ecx
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 24 Lines
	; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v4i1_v8i1_mask:			; NoVLX-LABEL: test_vpcmpeqd_v4i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	Show All 37 Lines
	; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v4i1_v8i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqd_v4i1_v8i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqd (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	Show All 39 Lines
	; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v8i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v8i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v8i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqd (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v4i1_v8i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpeqd_v4i1_v8i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v8i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v8i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v4i1_v16i1_mask:			; NoVLX-LABEL: test_vpcmpeqd_v4i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 36 Lines
	; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v4i1_v16i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqd_v4i1_v16i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqd (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 38 Lines
	; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v16i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 40 Lines
	; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v16i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v16i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqd (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v4i1_v16i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpeqd_v4i1_v16i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 40 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v16i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v16i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 39 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpeqd %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpeqd %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v4i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpeqd_v4i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi176:			; NoVLX-NEXT: .Lcfi136:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi177:			; NoVLX-NEXT: .Lcfi137:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi178:			; NoVLX-NEXT: .Lcfi138:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 21 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpeqd (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpeqd (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v4i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqd_v4i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi179:			; NoVLX-NEXT: .Lcfi139:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi180:			; NoVLX-NEXT: .Lcfi140:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi181:			; NoVLX-NEXT: .Lcfi141:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpeqd (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 23 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqd %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqd %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi182:			; NoVLX-NEXT: .Lcfi142:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi183:			; NoVLX-NEXT: .Lcfi143:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi184:			; NoVLX-NEXT: .Lcfi144:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 23 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqd (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqd (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi185:			; NoVLX-NEXT: .Lcfi145:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi186:			; NoVLX-NEXT: .Lcfi146:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi187:			; NoVLX-NEXT: .Lcfi147:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpeqd (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 24 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpeqd (%rdi){1to4}, %xmm0, %k0			; VLX-NEXT: vpcmpeqd (%rdi){1to4}, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v4i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpeqd_v4i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi188:			; NoVLX-NEXT: .Lcfi148:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi189:			; NoVLX-NEXT: .Lcfi149:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi190:			; NoVLX-NEXT: .Lcfi150:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	Show All 25 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqd (%rsi){1to4}, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqd (%rsi){1to4}, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi191:			; NoVLX-NEXT: .Lcfi151:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi192:			; NoVLX-NEXT: .Lcfi152:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi193:			; NoVLX-NEXT: .Lcfi153:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 25 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpeqd %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpeqd %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v4i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpeqd_v4i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi194:			; NoVLX-NEXT: .Lcfi154:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi195:			; NoVLX-NEXT: .Lcfi155:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi196:			; NoVLX-NEXT: .Lcfi156:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 27 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpeqd (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpeqd (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v4i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqd_v4i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi197:			; NoVLX-NEXT: .Lcfi157:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi198:			; NoVLX-NEXT: .Lcfi158:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi199:			; NoVLX-NEXT: .Lcfi159:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqd (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 29 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqd %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqd %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi200:			; NoVLX-NEXT: .Lcfi160:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi201:			; NoVLX-NEXT: .Lcfi161:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi202:			; NoVLX-NEXT: .Lcfi162:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
				; NoVLX-NEXT: vpand %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 27 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqd (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqd (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi203:			; NoVLX-NEXT: .Lcfi163:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi204:			; NoVLX-NEXT: .Lcfi164:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi205:			; NoVLX-NEXT: .Lcfi165:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqd (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpeqd (%rdi){1to4}, %xmm0, %k0			; VLX-NEXT: vpcmpeqd (%rdi){1to4}, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v4i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpeqd_v4i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi206:			; NoVLX-NEXT: .Lcfi166:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi207:			; NoVLX-NEXT: .Lcfi167:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi208:			; NoVLX-NEXT: .Lcfi168:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 31 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqd (%rsi){1to4}, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqd (%rsi){1to4}, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpeqd_v4i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi209:			; NoVLX-NEXT: .Lcfi169:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi210:			; NoVLX-NEXT: .Lcfi170:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi211:			; NoVLX-NEXT: .Lcfi171:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
				; NoVLX-NEXT: vpand %xmm0, %xmm2, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	▲ Show 20 Lines • Show All 218 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpeqd %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpeqd %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v8i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpeqd_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi212:			; NoVLX-NEXT: .Lcfi172:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi213:			; NoVLX-NEXT: .Lcfi173:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi214:			; NoVLX-NEXT: .Lcfi174:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>			; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 14 Lines
	; VLX-NEXT: vpcmpeqd (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpeqd (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqd_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi215:			; NoVLX-NEXT: .Lcfi175:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi216:			; NoVLX-NEXT: .Lcfi176:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi217:			; NoVLX-NEXT: .Lcfi177:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vmovdqa (%rdi), %ymm1			; NoVLX-NEXT: vmovdqa (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 16 Lines
	; VLX-NEXT: vpcmpeqd %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqd %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v8i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqd_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi218:			; NoVLX-NEXT: .Lcfi178:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi219:			; NoVLX-NEXT: .Lcfi179:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi220:			; NoVLX-NEXT: .Lcfi180:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>			; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX-NEXT: vpcmpeqd (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqd (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqd_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi221:			; NoVLX-NEXT: .Lcfi181:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi222:			; NoVLX-NEXT: .Lcfi182:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi223:			; NoVLX-NEXT: .Lcfi183:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vmovdqa (%rsi), %ymm1			; NoVLX-NEXT: vmovdqa (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 18 Lines
	; VLX-NEXT: vpcmpeqd (%rdi){1to8}, %ymm0, %k0			; VLX-NEXT: vpcmpeqd (%rdi){1to8}, %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v8i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpeqd_v8i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi224:			; NoVLX-NEXT: .Lcfi184:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi225:			; NoVLX-NEXT: .Lcfi185:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi226:			; NoVLX-NEXT: .Lcfi186:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpbroadcastd (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX-NEXT: vpcmpeqd (%rsi){1to8}, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqd (%rsi){1to8}, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v8i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpeqd_v8i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi227:			; NoVLX-NEXT: .Lcfi187:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi228:			; NoVLX-NEXT: .Lcfi188:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi229:			; NoVLX-NEXT: .Lcfi189:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpbroadcastd (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k0, %k1, %k0			; NoVLX-NEXT: kandw %k0, %k1, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 19 Lines
	; VLX-NEXT: vpcmpeqd %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpeqd %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v8i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpeqd_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi230:			; NoVLX-NEXT: .Lcfi190:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi231:			; NoVLX-NEXT: .Lcfi191:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi232:			; NoVLX-NEXT: .Lcfi192:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>			; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpeqd (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpeqd (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqd_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi233:			; NoVLX-NEXT: .Lcfi193:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi234:			; NoVLX-NEXT: .Lcfi194:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi235:			; NoVLX-NEXT: .Lcfi195:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vmovdqa (%rdi), %ymm1			; NoVLX-NEXT: vmovdqa (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpeqd %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqd %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v8i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqd_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi236:			; NoVLX-NEXT: .Lcfi196:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi237:			; NoVLX-NEXT: .Lcfi197:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi238:			; NoVLX-NEXT: .Lcfi198:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>			; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpeqd (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqd (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqd_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi239:			; NoVLX-NEXT: .Lcfi199:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi240:			; NoVLX-NEXT: .Lcfi200:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi241:			; NoVLX-NEXT: .Lcfi201:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vmovdqa (%rsi), %ymm1			; NoVLX-NEXT: vmovdqa (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpeqd (%rdi){1to8}, %ymm0, %k0			; VLX-NEXT: vpcmpeqd (%rdi){1to8}, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v8i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpeqd_v8i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi242:			; NoVLX-NEXT: .Lcfi202:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi243:			; NoVLX-NEXT: .Lcfi203:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi244:			; NoVLX-NEXT: .Lcfi204:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpbroadcastd (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpeqd (%rsi){1to8}, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqd (%rsi){1to8}, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v8i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpeqd_v8i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi245:			; NoVLX-NEXT: .Lcfi205:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi246:			; NoVLX-NEXT: .Lcfi206:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi247:			; NoVLX-NEXT: .Lcfi207:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpbroadcastd (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k0, %k1, %k0			; NoVLX-NEXT: kandw %k0, %k1, %k0
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0			; VLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v16i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpeqd_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi248:			; NoVLX-NEXT: .Lcfi208:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi249:			; NoVLX-NEXT: .Lcfi209:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi250:			; NoVLX-NEXT: .Lcfi210:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi251:			; NoVLX-NEXT: .Lcfi211:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi252:			; NoVLX-NEXT: .Lcfi212:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi253:			; NoVLX-NEXT: .Lcfi213:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi254:			; NoVLX-NEXT: .Lcfi214:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi255:			; NoVLX-NEXT: .Lcfi215:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 19 Lines
	; VLX-NEXT: vpcmpeqd (%rdi), %zmm0, %k0			; VLX-NEXT: vpcmpeqd (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqd_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi256:			; NoVLX-NEXT: .Lcfi216:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi257:			; NoVLX-NEXT: .Lcfi217:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi258:			; NoVLX-NEXT: .Lcfi218:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi259:			; NoVLX-NEXT: .Lcfi219:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi260:			; NoVLX-NEXT: .Lcfi220:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi261:			; NoVLX-NEXT: .Lcfi221:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi262:			; NoVLX-NEXT: .Lcfi222:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi263:			; NoVLX-NEXT: .Lcfi223:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpeqd (%rdi), %zmm0, %k0			; NoVLX-NEXT: vpcmpeqd (%rdi), %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 21 Lines
	; VLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v16i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqd_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi264:			; NoVLX-NEXT: .Lcfi224:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi265:			; NoVLX-NEXT: .Lcfi225:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi266:			; NoVLX-NEXT: .Lcfi226:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi267:			; NoVLX-NEXT: .Lcfi227:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi268:			; NoVLX-NEXT: .Lcfi228:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi269:			; NoVLX-NEXT: .Lcfi229:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi270:			; NoVLX-NEXT: .Lcfi230:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi271:			; NoVLX-NEXT: .Lcfi231:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 22 Lines
	; VLX-NEXT: vpcmpeqd (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqd (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqd_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi272:			; NoVLX-NEXT: .Lcfi232:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi273:			; NoVLX-NEXT: .Lcfi233:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi274:			; NoVLX-NEXT: .Lcfi234:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi275:			; NoVLX-NEXT: .Lcfi235:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi276:			; NoVLX-NEXT: .Lcfi236:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi277:			; NoVLX-NEXT: .Lcfi237:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi278:			; NoVLX-NEXT: .Lcfi238:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi279:			; NoVLX-NEXT: .Lcfi239:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpeqd (%rsi), %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpeqd (%rsi), %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 23 Lines
	; VLX-NEXT: vpcmpeqd (%rdi){1to16}, %zmm0, %k0			; VLX-NEXT: vpcmpeqd (%rdi){1to16}, %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v16i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpeqd_v16i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi280:			; NoVLX-NEXT: .Lcfi240:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi281:			; NoVLX-NEXT: .Lcfi241:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi282:			; NoVLX-NEXT: .Lcfi242:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi283:			; NoVLX-NEXT: .Lcfi243:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi284:			; NoVLX-NEXT: .Lcfi244:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi285:			; NoVLX-NEXT: .Lcfi245:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi286:			; NoVLX-NEXT: .Lcfi246:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi287:			; NoVLX-NEXT: .Lcfi247:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpeqd (%rdi){1to16}, %zmm0, %k0			; NoVLX-NEXT: vpcmpeqd (%rdi){1to16}, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 22 Lines
	; VLX-NEXT: vpcmpeqd (%rsi){1to16}, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqd (%rsi){1to16}, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v16i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpeqd_v16i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi288:			; NoVLX-NEXT: .Lcfi248:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi289:			; NoVLX-NEXT: .Lcfi249:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi290:			; NoVLX-NEXT: .Lcfi250:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi291:			; NoVLX-NEXT: .Lcfi251:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi292:			; NoVLX-NEXT: .Lcfi252:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi293:			; NoVLX-NEXT: .Lcfi253:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi294:			; NoVLX-NEXT: .Lcfi254:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi295:			; NoVLX-NEXT: .Lcfi255:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpeqd (%rsi){1to16}, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpeqd (%rsi){1to16}, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 24 Lines
	; VLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0			; VLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v16i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpeqd_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi296:			; NoVLX-NEXT: .Lcfi256:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi297:			; NoVLX-NEXT: .Lcfi257:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi298:			; NoVLX-NEXT: .Lcfi258:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi299:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi300:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi301:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi302:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi303:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%1 = bitcast <8 x i64> %__b to <16 x i32>			%1 = bitcast <8 x i64> %__b to <16 x i32>
	%2 = icmp eq <16 x i32> %0, %1			%2 = icmp eq <16 x i32> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0,i32 1,i32 2,i32 3,i32 4,i32 5,i32 6,i32 7,i32 8,i32 9,i32 10,i32 11,i32 12,i32 13,i32 14,i32 15,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0,i32 1,i32 2,i32 3,i32 4,i32 5,i32 6,i32 7,i32 8,i32 9,i32 10,i32 11,i32 12,i32 13,i32 14,i32 15,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_vpcmpeqd_v16i1_v64i1_mask_mem(<8 x i64> %__a, <8 x i64>* %__b) local_unnamed_addr {			define zeroext i64 @test_vpcmpeqd_v16i1_v64i1_mask_mem(<8 x i64> %__a, <8 x i64>* %__b) local_unnamed_addr {
	; VLX-LABEL: test_vpcmpeqd_v16i1_v64i1_mask_mem:			; VLX-LABEL: test_vpcmpeqd_v16i1_v64i1_mask_mem:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpeqd (%rdi), %zmm0, %k0			; VLX-NEXT: vpcmpeqd (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqd_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi304:			; NoVLX-NEXT: .Lcfi259:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi305:			; NoVLX-NEXT: .Lcfi260:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi306:			; NoVLX-NEXT: .Lcfi261:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi307:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi308:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi309:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi310:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi311:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpeqd (%rdi), %zmm0, %k0			; NoVLX-NEXT: vpcmpeqd (%rdi), %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%load = load <8 x i64>, <8 x i64>* %__b			%load = load <8 x i64>, <8 x i64>* %__b
	%1 = bitcast <8 x i64> %load to <16 x i32>			%1 = bitcast <8 x i64> %load to <16 x i32>
	%2 = icmp eq <16 x i32> %0, %1			%2 = icmp eq <16 x i32> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0,i32 1,i32 2,i32 3,i32 4,i32 5,i32 6,i32 7,i32 8,i32 9,i32 10,i32 11,i32 12,i32 13,i32 14,i32 15,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0,i32 1,i32 2,i32 3,i32 4,i32 5,i32 6,i32 7,i32 8,i32 9,i32 10,i32 11,i32 12,i32 13,i32 14,i32 15,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_masked_vpcmpeqd_v16i1_v64i1_mask(i16 zeroext %__u, <8 x i64> %__a, <8 x i64> %__b) local_unnamed_addr {			define zeroext i64 @test_masked_vpcmpeqd_v16i1_v64i1_mask(i16 zeroext %__u, <8 x i64> %__a, <8 x i64> %__b) local_unnamed_addr {
	; VLX-LABEL: test_masked_vpcmpeqd_v16i1_v64i1_mask:			; VLX-LABEL: test_masked_vpcmpeqd_v16i1_v64i1_mask:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v16i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqd_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi312:			; NoVLX-NEXT: .Lcfi262:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi313:			; NoVLX-NEXT: .Lcfi263:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi314:			; NoVLX-NEXT: .Lcfi264:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi315:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi316:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi317:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi318:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi319:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpeqd %zmm1, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%1 = bitcast <8 x i64> %__b to <16 x i32>			%1 = bitcast <8 x i64> %__b to <16 x i32>
	%2 = icmp eq <16 x i32> %0, %1			%2 = icmp eq <16 x i32> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	%4 = and <16 x i1> %2, %3			%4 = and <16 x i1> %2, %3
	Show All 9 Lines
	; VLX-NEXT: vpcmpeqd (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqd (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqd_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi320:			; NoVLX-NEXT: .Lcfi265:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi321:			; NoVLX-NEXT: .Lcfi266:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi322:			; NoVLX-NEXT: .Lcfi267:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi323:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi324:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi325:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi326:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi327:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpeqd (%rsi), %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpeqd (%rsi), %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%load = load <8 x i64>, <8 x i64>* %__b			%load = load <8 x i64>, <8 x i64>* %__b
	%1 = bitcast <8 x i64> %load to <16 x i32>			%1 = bitcast <8 x i64> %load to <16 x i32>
	%2 = icmp eq <16 x i32> %0, %1			%2 = icmp eq <16 x i32> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	Show All 10 Lines
	; VLX-NEXT: vpcmpeqd (%rdi){1to16}, %zmm0, %k0			; VLX-NEXT: vpcmpeqd (%rdi){1to16}, %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqd_v16i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpeqd_v16i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi328:			; NoVLX-NEXT: .Lcfi268:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi329:			; NoVLX-NEXT: .Lcfi269:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi330:			; NoVLX-NEXT: .Lcfi270:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi331:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi332:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi333:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi334:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi335:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpeqd (%rdi){1to16}, %zmm0, %k0			; NoVLX-NEXT: vpcmpeqd (%rdi){1to16}, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%load = load i32, i32* %__b			%load = load i32, i32* %__b
	%vec = insertelement <16 x i32> undef, i32 %load, i32 0			%vec = insertelement <16 x i32> undef, i32 %load, i32 0
	%1 = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%1 = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	%2 = icmp eq <16 x i32> %0, %1			%2 = icmp eq <16 x i32> %0, %1
	Show All 9 Lines
	; VLX-NEXT: vpcmpeqd (%rsi){1to16}, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqd (%rsi){1to16}, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqd_v16i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpeqd_v16i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi336:			; NoVLX-NEXT: .Lcfi271:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi337:			; NoVLX-NEXT: .Lcfi272:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi338:			; NoVLX-NEXT: .Lcfi273:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi339:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi340:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi341:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi342:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi343:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpeqd (%rsi){1to16}, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpeqd (%rsi){1to16}, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%load = load i32, i32* %__b			%load = load i32, i32* %__b
	%vec = insertelement <16 x i32> undef, i32 %load, i32 0			%vec = insertelement <16 x i32> undef, i32 %load, i32 0
	%1 = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%1 = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	%2 = icmp eq <16 x i32> %0, %1			%2 = icmp eq <16 x i32> %0, %1
	▲ Show 20 Lines • Show All 66 Lines • ▼ Show 20 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqq %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqq %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovb %k0, -{{[0-9]+}}(%rsp)			; VLX-NEXT: kmovb %k0, -{{[0-9]+}}(%rsp)
	; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v2i1_v4i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqq_v2i1_v4i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
				; NoVLX-NEXT: vpand %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero			; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero
	; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0			; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	▲ Show 20 Lines • Show All 88 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpeqq (%rsi){1to2}, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqq (%rsi){1to2}, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovb %k0, -{{[0-9]+}}(%rsp)			; VLX-NEXT: kmovb %k0, -{{[0-9]+}}(%rsp)
	; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v2i1_v4i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpeqq_v2i1_v4i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
				; NoVLX-NEXT: vpand %xmm0, %xmm2, %xmm0
	; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero			; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero
	; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0			; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	Show All 19 Lines
	; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v2i1_v8i1_mask:			; NoVLX-LABEL: test_vpcmpeqq_v2i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%1 = bitcast <2 x i64> %__b to <2 x i64>			%1 = bitcast <2 x i64> %__b to <2 x i64>
	Show All 11 Lines
	; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v2i1_v8i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqq_v2i1_v8i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqq (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqq (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	Show All 23 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%1 = bitcast <2 x i64> %__b to <2 x i64>			%1 = bitcast <2 x i64> %__b to <2 x i64>
	Show All 25 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	Show All 17 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v2i1_v8i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpeqq_v2i1_v8i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load i64, i64* %__b			%load = load i64, i64* %__b
	Show All 25 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load i64, i64* %__b			%load = load i64, i64* %__b
	Show All 17 Lines
	; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v2i1_v16i1_mask:			; NoVLX-LABEL: test_vpcmpeqq_v2i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%1 = bitcast <2 x i64> %__b to <2 x i64>			%1 = bitcast <2 x i64> %__b to <2 x i64>
	Show All 11 Lines
	; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v2i1_v16i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqq_v2i1_v16i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqq (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqq (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	Show All 23 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%1 = bitcast <2 x i64> %__b to <2 x i64>			%1 = bitcast <2 x i64> %__b to <2 x i64>
	Show All 25 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	Show All 17 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v2i1_v16i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpeqq_v2i1_v16i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load i64, i64* %__b			%load = load i64, i64* %__b
	Show All 25 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load i64, i64* %__b			%load = load i64, i64* %__b
	Show All 14 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpeqq %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpeqq %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v2i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpeqq_v2i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi344:			; NoVLX-NEXT: .Lcfi274:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi345:			; NoVLX-NEXT: .Lcfi275:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi346:			; NoVLX-NEXT: .Lcfi276:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 21 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpeqq (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpeqq (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v2i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqq_v2i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi347:			; NoVLX-NEXT: .Lcfi277:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi348:			; NoVLX-NEXT: .Lcfi278:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi349:			; NoVLX-NEXT: .Lcfi279:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpeqq (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqq (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 23 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqq %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqq %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v2i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqq_v2i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi350:			; NoVLX-NEXT: .Lcfi280:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi351:			; NoVLX-NEXT: .Lcfi281:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi352:			; NoVLX-NEXT: .Lcfi282:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	Show All 35 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqq (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqq (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v2i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqq_v2i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi353:			; NoVLX-NEXT: .Lcfi283:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi354:			; NoVLX-NEXT: .Lcfi284:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi355:			; NoVLX-NEXT: .Lcfi285:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpeqq (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqq (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	Show All 36 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpeqq (%rdi){1to2}, %xmm0, %k0			; VLX-NEXT: vpcmpeqq (%rdi){1to2}, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v2i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpeqq_v2i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi356:			; NoVLX-NEXT: .Lcfi286:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi357:			; NoVLX-NEXT: .Lcfi287:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi358:			; NoVLX-NEXT: .Lcfi288:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	Show All 25 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqq (%rsi){1to2}, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqq (%rsi){1to2}, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v2i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpeqq_v2i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi359:			; NoVLX-NEXT: .Lcfi289:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi360:			; NoVLX-NEXT: .Lcfi290:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi361:			; NoVLX-NEXT: .Lcfi291:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	Show All 38 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpeqq %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpeqq %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v2i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpeqq_v2i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi362:			; NoVLX-NEXT: .Lcfi292:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi363:			; NoVLX-NEXT: .Lcfi293:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi364:			; NoVLX-NEXT: .Lcfi294:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 27 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpeqq (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpeqq (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v2i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqq_v2i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi365:			; NoVLX-NEXT: .Lcfi295:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi366:			; NoVLX-NEXT: .Lcfi296:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi367:			; NoVLX-NEXT: .Lcfi297:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqq (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqq (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 29 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqq %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqq %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v2i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqq_v2i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi368:			; NoVLX-NEXT: .Lcfi298:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi369:			; NoVLX-NEXT: .Lcfi299:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi370:			; NoVLX-NEXT: .Lcfi300:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
				; NoVLX-NEXT: vpand %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 27 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqq (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqq (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v2i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqq_v2i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi371:			; NoVLX-NEXT: .Lcfi301:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi372:			; NoVLX-NEXT: .Lcfi302:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi373:			; NoVLX-NEXT: .Lcfi303:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqq (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqq (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpeqq (%rdi){1to2}, %xmm0, %k0			; VLX-NEXT: vpcmpeqq (%rdi){1to2}, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v2i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpeqq_v2i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi374:			; NoVLX-NEXT: .Lcfi304:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi375:			; NoVLX-NEXT: .Lcfi305:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi376:			; NoVLX-NEXT: .Lcfi306:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 31 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpeqq (%rsi){1to2}, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqq (%rsi){1to2}, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v2i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpeqq_v2i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi377:			; NoVLX-NEXT: .Lcfi307:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi378:			; NoVLX-NEXT: .Lcfi308:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi379:			; NoVLX-NEXT: .Lcfi309:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
				; NoVLX-NEXT: vpand %xmm0, %xmm2, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 34 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v4i1_v8i1_mask:			; NoVLX-LABEL: test_vpcmpeqq_v4i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	Show All 39 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v4i1_v8i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqq_v4i1_v8i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqq (%rdi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq (%rdi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v8i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v8i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v8i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqq (%rsi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq (%rsi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v4i1_v8i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpeqq_v4i1_v8i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v8i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v8i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v4i1_v16i1_mask:			; NoVLX-LABEL: test_vpcmpeqq_v4i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 38 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v4i1_v16i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqq_v4i1_v16i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqq (%rdi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq (%rdi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 40 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v16i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v16i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v16i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpeqq (%rsi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq (%rsi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v4i1_v16i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpeqq_v4i1_v16i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v16i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v16i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 40 Lines
	; VLX-NEXT: vpcmpeqq %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpeqq %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v4i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpeqq_v4i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi380:			; NoVLX-NEXT: .Lcfi310:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi381:			; NoVLX-NEXT: .Lcfi311:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi382:			; NoVLX-NEXT: .Lcfi312:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	Show All 23 Lines
	; VLX-NEXT: vpcmpeqq (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpeqq (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v4i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqq_v4i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi383:			; NoVLX-NEXT: .Lcfi313:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi384:			; NoVLX-NEXT: .Lcfi314:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi385:			; NoVLX-NEXT: .Lcfi315:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpeqq (%rdi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq (%rdi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	Show All 25 Lines
	; VLX-NEXT: vpcmpeqq %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqq %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi386:			; NoVLX-NEXT: .Lcfi316:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi387:			; NoVLX-NEXT: .Lcfi317:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi388:			; NoVLX-NEXT: .Lcfi318:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 24 Lines
	; VLX-NEXT: vpcmpeqq (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqq (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi389:			; NoVLX-NEXT: .Lcfi319:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi390:			; NoVLX-NEXT: .Lcfi320:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi391:			; NoVLX-NEXT: .Lcfi321:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpeqq (%rsi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq (%rsi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 25 Lines
	; VLX-NEXT: vpcmpeqq (%rdi){1to4}, %ymm0, %k0			; VLX-NEXT: vpcmpeqq (%rdi){1to4}, %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v4i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpeqq_v4i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi392:			; NoVLX-NEXT: .Lcfi322:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi393:			; NoVLX-NEXT: .Lcfi323:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi394:			; NoVLX-NEXT: .Lcfi324:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	Show All 27 Lines
	; VLX-NEXT: vpcmpeqq (%rsi){1to4}, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqq (%rsi){1to4}, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi395:			; NoVLX-NEXT: .Lcfi325:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi396:			; NoVLX-NEXT: .Lcfi326:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi397:			; NoVLX-NEXT: .Lcfi327:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 26 Lines
	; VLX-NEXT: vpcmpeqq %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpeqq %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v4i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpeqq_v4i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi398:			; NoVLX-NEXT: .Lcfi328:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi399:			; NoVLX-NEXT: .Lcfi329:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi400:			; NoVLX-NEXT: .Lcfi330:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 29 Lines
	; VLX-NEXT: vpcmpeqq (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpeqq (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v4i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqq_v4i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi401:			; NoVLX-NEXT: .Lcfi331:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi402:			; NoVLX-NEXT: .Lcfi332:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi403:			; NoVLX-NEXT: .Lcfi333:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqq (%rdi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq (%rdi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 31 Lines
	; VLX-NEXT: vpcmpeqq %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqq %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi404:			; NoVLX-NEXT: .Lcfi334:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi405:			; NoVLX-NEXT: .Lcfi335:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi406:			; NoVLX-NEXT: .Lcfi336:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
				; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 29 Lines
	; VLX-NEXT: vpcmpeqq (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqq (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi407:			; NoVLX-NEXT: .Lcfi337:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi408:			; NoVLX-NEXT: .Lcfi338:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi409:			; NoVLX-NEXT: .Lcfi339:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqq (%rsi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq (%rsi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
				; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 30 Lines
	; VLX-NEXT: vpcmpeqq (%rdi){1to4}, %ymm0, %k0			; VLX-NEXT: vpcmpeqq (%rdi){1to4}, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v4i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpeqq_v4i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi410:			; NoVLX-NEXT: .Lcfi340:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi411:			; NoVLX-NEXT: .Lcfi341:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi412:			; NoVLX-NEXT: .Lcfi342:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 33 Lines
	; VLX-NEXT: vpcmpeqq (%rsi){1to4}, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqq (%rsi){1to4}, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpeqq_v4i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi413:			; NoVLX-NEXT: .Lcfi343:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi414:			; NoVLX-NEXT: .Lcfi344:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi415:			; NoVLX-NEXT: .Lcfi345:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
				; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	▲ Show 20 Lines • Show All 195 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpeqq %zmm1, %zmm0, %k0			; VLX-NEXT: vpcmpeqq %zmm1, %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v8i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpeqq_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi416:			; NoVLX-NEXT: .Lcfi346:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi417:			; NoVLX-NEXT: .Lcfi347:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi418:			; NoVLX-NEXT: .Lcfi348:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpeqq %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpeqq %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 14 Lines
	; VLX-NEXT: vpcmpeqq (%rdi), %zmm0, %k0			; VLX-NEXT: vpcmpeqq (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqq_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi419:			; NoVLX-NEXT: .Lcfi349:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi420:			; NoVLX-NEXT: .Lcfi350:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi421:			; NoVLX-NEXT: .Lcfi351:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpeqq (%rdi), %zmm0, %k0			; NoVLX-NEXT: vpcmpeqq (%rdi), %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 16 Lines
	; VLX-NEXT: vpcmpeqq %zmm1, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqq %zmm1, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v8i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqq_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi422:			; NoVLX-NEXT: .Lcfi352:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi423:			; NoVLX-NEXT: .Lcfi353:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi424:			; NoVLX-NEXT: .Lcfi354:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpeqq %zmm1, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpeqq %zmm1, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX-NEXT: vpcmpeqq (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqq (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqq_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi425:			; NoVLX-NEXT: .Lcfi355:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi426:			; NoVLX-NEXT: .Lcfi356:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi427:			; NoVLX-NEXT: .Lcfi357:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpeqq (%rsi), %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpeqq (%rsi), %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 18 Lines
	; VLX-NEXT: vpcmpeqq (%rdi){1to8}, %zmm0, %k0			; VLX-NEXT: vpcmpeqq (%rdi){1to8}, %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v8i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpeqq_v8i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi428:			; NoVLX-NEXT: .Lcfi358:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi429:			; NoVLX-NEXT: .Lcfi359:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi430:			; NoVLX-NEXT: .Lcfi360:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpeqq (%rdi){1to8}, %zmm0, %k0			; NoVLX-NEXT: vpcmpeqq (%rdi){1to8}, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX-NEXT: vpcmpeqq (%rsi){1to8}, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqq (%rsi){1to8}, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v8i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpeqq_v8i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi431:			; NoVLX-NEXT: .Lcfi361:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi432:			; NoVLX-NEXT: .Lcfi362:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi433:			; NoVLX-NEXT: .Lcfi363:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpeqq (%rsi){1to8}, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpeqq (%rsi){1to8}, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 19 Lines
	; VLX-NEXT: vpcmpeqq %zmm1, %zmm0, %k0			; VLX-NEXT: vpcmpeqq %zmm1, %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v8i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpeqq_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi434:			; NoVLX-NEXT: .Lcfi364:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi435:			; NoVLX-NEXT: .Lcfi365:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi436:			; NoVLX-NEXT: .Lcfi366:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqq %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpeqq %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpeqq (%rdi), %zmm0, %k0			; VLX-NEXT: vpcmpeqq (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpeqq_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi437:			; NoVLX-NEXT: .Lcfi367:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi438:			; NoVLX-NEXT: .Lcfi368:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi439:			; NoVLX-NEXT: .Lcfi369:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqq (%rdi), %zmm0, %k0			; NoVLX-NEXT: vpcmpeqq (%rdi), %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpeqq %zmm1, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqq %zmm1, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v8i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpeqq_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi440:			; NoVLX-NEXT: .Lcfi370:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi441:			; NoVLX-NEXT: .Lcfi371:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi442:			; NoVLX-NEXT: .Lcfi372:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpeqq %zmm1, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpeqq %zmm1, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpeqq (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqq (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpeqq_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi443:			; NoVLX-NEXT: .Lcfi373:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi444:			; NoVLX-NEXT: .Lcfi374:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi445:			; NoVLX-NEXT: .Lcfi375:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpeqq (%rsi), %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpeqq (%rsi), %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpeqq (%rdi){1to8}, %zmm0, %k0			; VLX-NEXT: vpcmpeqq (%rdi){1to8}, %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpeqq_v8i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpeqq_v8i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi446:			; NoVLX-NEXT: .Lcfi376:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi447:			; NoVLX-NEXT: .Lcfi377:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi448:			; NoVLX-NEXT: .Lcfi378:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpeqq (%rdi){1to8}, %zmm0, %k0			; NoVLX-NEXT: vpcmpeqq (%rdi){1to8}, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpeqq (%rsi){1to8}, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpeqq (%rsi){1to8}, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpeqq_v8i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpeqq_v8i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi449:			; NoVLX-NEXT: .Lcfi379:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi450:			; NoVLX-NEXT: .Lcfi380:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi451:			; NoVLX-NEXT: .Lcfi381:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpeqq (%rsi){1to8}, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpeqq (%rsi){1to8}, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtb %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpgtb %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtb_v16i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpsgtb_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi452:			; NoVLX-NEXT: .Lcfi382:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi453:			; NoVLX-NEXT: .Lcfi383:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi454:			; NoVLX-NEXT: .Lcfi384:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi455:			; NoVLX-NEXT: .Lcfi385:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi456:			; NoVLX-NEXT: .Lcfi386:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi457:			; NoVLX-NEXT: .Lcfi387:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi458:			; NoVLX-NEXT: .Lcfi388:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi459:			; NoVLX-NEXT: .Lcfi389:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtb %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtb %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 18 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtb (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpgtb (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtb_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtb_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi460:			; NoVLX-NEXT: .Lcfi390:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi461:			; NoVLX-NEXT: .Lcfi391:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi462:			; NoVLX-NEXT: .Lcfi392:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi463:			; NoVLX-NEXT: .Lcfi393:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi464:			; NoVLX-NEXT: .Lcfi394:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi465:			; NoVLX-NEXT: .Lcfi395:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi466:			; NoVLX-NEXT: .Lcfi396:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi467:			; NoVLX-NEXT: .Lcfi397:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtb (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtb (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 20 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtb %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtb %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtb_v16i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtb_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi468:			; NoVLX-NEXT: .Lcfi398:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi469:			; NoVLX-NEXT: .Lcfi399:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi470:			; NoVLX-NEXT: .Lcfi400:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi471:			; NoVLX-NEXT: .Lcfi401:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi472:			; NoVLX-NEXT: .Lcfi402:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi473:			; NoVLX-NEXT: .Lcfi403:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi474:			; NoVLX-NEXT: .Lcfi404:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi475:			; NoVLX-NEXT: .Lcfi405:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtb %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtb %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 21 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtb (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtb (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtb_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtb_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi476:			; NoVLX-NEXT: .Lcfi406:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi477:			; NoVLX-NEXT: .Lcfi407:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi478:			; NoVLX-NEXT: .Lcfi408:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi479:			; NoVLX-NEXT: .Lcfi409:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi480:			; NoVLX-NEXT: .Lcfi410:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi481:			; NoVLX-NEXT: .Lcfi411:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi482:			; NoVLX-NEXT: .Lcfi412:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi483:			; NoVLX-NEXT: .Lcfi413:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtb (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtb (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 22 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtb %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpgtb %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtb_v16i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsgtb_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi484:			; NoVLX-NEXT: .Lcfi414:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi485:			; NoVLX-NEXT: .Lcfi415:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi486:			; NoVLX-NEXT: .Lcfi416:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi487:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi488:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi489:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi490:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi491:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtb %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtb %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <16 x i8>			%0 = bitcast <2 x i64> %__a to <16 x i8>
	%1 = bitcast <2 x i64> %__b to <16 x i8>			%1 = bitcast <2 x i64> %__b to <16 x i8>
	%2 = icmp sgt <16 x i8> %0, %1			%2 = icmp sgt <16 x i8> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_vpcmpsgtb_v16i1_v64i1_mask_mem(<2 x i64> %__a, <2 x i64>* %__b) local_unnamed_addr {			define zeroext i64 @test_vpcmpsgtb_v16i1_v64i1_mask_mem(<2 x i64> %__a, <2 x i64>* %__b) local_unnamed_addr {
	; VLX-LABEL: test_vpcmpsgtb_v16i1_v64i1_mask_mem:			; VLX-LABEL: test_vpcmpsgtb_v16i1_v64i1_mask_mem:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtb (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpgtb (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtb_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtb_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi492:			; NoVLX-NEXT: .Lcfi417:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi493:			; NoVLX-NEXT: .Lcfi418:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi494:			; NoVLX-NEXT: .Lcfi419:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi495:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi496:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi497:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi498:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi499:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtb (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtb (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <16 x i8>			%0 = bitcast <2 x i64> %__a to <16 x i8>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	%1 = bitcast <2 x i64> %load to <16 x i8>			%1 = bitcast <2 x i64> %load to <16 x i8>
	%2 = icmp sgt <16 x i8> %0, %1			%2 = icmp sgt <16 x i8> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_masked_vpcmpsgtb_v16i1_v64i1_mask(i16 zeroext %__u, <2 x i64> %__a, <2 x i64> %__b) local_unnamed_addr {			define zeroext i64 @test_masked_vpcmpsgtb_v16i1_v64i1_mask(i16 zeroext %__u, <2 x i64> %__a, <2 x i64> %__b) local_unnamed_addr {
	; VLX-LABEL: test_masked_vpcmpsgtb_v16i1_v64i1_mask:			; VLX-LABEL: test_masked_vpcmpsgtb_v16i1_v64i1_mask:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtb %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtb %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtb_v16i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtb_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi500:			; NoVLX-NEXT: .Lcfi420:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi501:			; NoVLX-NEXT: .Lcfi421:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi502:			; NoVLX-NEXT: .Lcfi422:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi503:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi504:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi505:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi506:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi507:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtb %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtb %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <16 x i8>			%0 = bitcast <2 x i64> %__a to <16 x i8>
	%1 = bitcast <2 x i64> %__b to <16 x i8>			%1 = bitcast <2 x i64> %__b to <16 x i8>
	%2 = icmp sgt <16 x i8> %0, %1			%2 = icmp sgt <16 x i8> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	%4 = and <16 x i1> %2, %3			%4 = and <16 x i1> %2, %3
	%5 = shufflevector <16 x i1> %4, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%5 = shufflevector <16 x i1> %4, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%6 = bitcast <64 x i1> %5 to i64			%6 = bitcast <64 x i1> %5 to i64
	ret i64 %6			ret i64 %6
	}			}

	define zeroext i64 @test_masked_vpcmpsgtb_v16i1_v64i1_mask_mem(i16 zeroext %__u, <2 x i64> %__a, <2 x i64>* %__b) local_unnamed_addr {			define zeroext i64 @test_masked_vpcmpsgtb_v16i1_v64i1_mask_mem(i16 zeroext %__u, <2 x i64> %__a, <2 x i64>* %__b) local_unnamed_addr {
	; VLX-LABEL: test_masked_vpcmpsgtb_v16i1_v64i1_mask_mem:			; VLX-LABEL: test_masked_vpcmpsgtb_v16i1_v64i1_mask_mem:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtb (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtb (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtb_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtb_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi508:			; NoVLX-NEXT: .Lcfi423:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi509:			; NoVLX-NEXT: .Lcfi424:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi510:			; NoVLX-NEXT: .Lcfi425:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi511:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi512:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi513:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi514:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi515:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtb (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtb (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <16 x i8>			%0 = bitcast <2 x i64> %__a to <16 x i8>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	%1 = bitcast <2 x i64> %load to <16 x i8>			%1 = bitcast <2 x i64> %load to <16 x i8>
	%2 = icmp sgt <16 x i8> %0, %1			%2 = icmp sgt <16 x i8> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	Show All 10 Lines
	; VLX-NEXT: vpcmpgtb %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpgtb %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtb_v32i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsgtb_v32i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi516:			; NoVLX-NEXT: .Lcfi426:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi517:			; NoVLX-NEXT: .Lcfi427:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi518:			; NoVLX-NEXT: .Lcfi428:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtb %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtb %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 27 Lines
	; VLX-NEXT: vpcmpgtb (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpgtb (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtb_v32i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtb_v32i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi519:			; NoVLX-NEXT: .Lcfi429:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi520:			; NoVLX-NEXT: .Lcfi430:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi521:			; NoVLX-NEXT: .Lcfi431:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtb (%rdi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtb (%rdi), %ymm0, %ymm0
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 29 Lines
	; VLX-NEXT: vpcmpgtb %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtb %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtb_v32i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtb_v32i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi522:			; NoVLX-NEXT: .Lcfi432:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi523:			; NoVLX-NEXT: .Lcfi433:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi524:			; NoVLX-NEXT: .Lcfi434:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vpmovdb %zmm2, %xmm2			; NoVLX-NEXT: vpmovdb %zmm2, %xmm2
	Show All 39 Lines
	; VLX-NEXT: vpcmpgtb (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtb (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtb_v32i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtb_v32i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi525:			; NoVLX-NEXT: .Lcfi435:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi526:			; NoVLX-NEXT: .Lcfi436:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi527:			; NoVLX-NEXT: .Lcfi437:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpmovdb %zmm1, %xmm1			; NoVLX-NEXT: vpmovdb %zmm1, %xmm1
	▲ Show 20 Lines • Show All 162 Lines • ▼ Show 20 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtw %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpgtw %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtw_v8i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpsgtw_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi528:			; NoVLX-NEXT: .Lcfi438:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi529:			; NoVLX-NEXT: .Lcfi439:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi530:			; NoVLX-NEXT: .Lcfi440:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 13 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtw (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpgtw (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtw_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtw_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi531:			; NoVLX-NEXT: .Lcfi441:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi532:			; NoVLX-NEXT: .Lcfi442:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi533:			; NoVLX-NEXT: .Lcfi443:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtw (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtw (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 15 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtw %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtw %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtw_v8i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtw_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi534:			; NoVLX-NEXT: .Lcfi444:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi535:			; NoVLX-NEXT: .Lcfi445:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi536:			; NoVLX-NEXT: .Lcfi446:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 16 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtw (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtw (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtw_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtw_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi537:			; NoVLX-NEXT: .Lcfi447:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi538:			; NoVLX-NEXT: .Lcfi448:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi539:			; NoVLX-NEXT: .Lcfi449:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtw (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtw (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtw %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpgtw %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtw_v8i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsgtw_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi540:			; NoVLX-NEXT: .Lcfi450:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi541:			; NoVLX-NEXT: .Lcfi451:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi542:			; NoVLX-NEXT: .Lcfi452:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtw (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpgtw (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtw_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtw_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi543:			; NoVLX-NEXT: .Lcfi453:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi544:			; NoVLX-NEXT: .Lcfi454:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi545:			; NoVLX-NEXT: .Lcfi455:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtw (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtw (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtw %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtw %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtw_v8i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtw_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi546:			; NoVLX-NEXT: .Lcfi456:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi547:			; NoVLX-NEXT: .Lcfi457:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi548:			; NoVLX-NEXT: .Lcfi458:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}
	▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtw (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtw (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtw_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtw_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi549:			; NoVLX-NEXT: .Lcfi459:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi550:			; NoVLX-NEXT: .Lcfi460:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi551:			; NoVLX-NEXT: .Lcfi461:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtw (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtw (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpgtw %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpgtw %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtw_v16i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpsgtw_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi552:			; NoVLX-NEXT: .Lcfi462:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi553:			; NoVLX-NEXT: .Lcfi463:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi554:			; NoVLX-NEXT: .Lcfi464:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi555:			; NoVLX-NEXT: .Lcfi465:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi556:			; NoVLX-NEXT: .Lcfi466:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi557:			; NoVLX-NEXT: .Lcfi467:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi558:			; NoVLX-NEXT: .Lcfi468:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi559:			; NoVLX-NEXT: .Lcfi469:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 19 Lines
	; VLX-NEXT: vpcmpgtw (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpgtw (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtw_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtw_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi560:			; NoVLX-NEXT: .Lcfi470:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi561:			; NoVLX-NEXT: .Lcfi471:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi562:			; NoVLX-NEXT: .Lcfi472:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi563:			; NoVLX-NEXT: .Lcfi473:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi564:			; NoVLX-NEXT: .Lcfi474:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi565:			; NoVLX-NEXT: .Lcfi475:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi566:			; NoVLX-NEXT: .Lcfi476:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi567:			; NoVLX-NEXT: .Lcfi477:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtw (%rdi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtw (%rdi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 21 Lines
	; VLX-NEXT: vpcmpgtw %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtw %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtw_v16i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtw_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi568:			; NoVLX-NEXT: .Lcfi478:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi569:			; NoVLX-NEXT: .Lcfi479:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi570:			; NoVLX-NEXT: .Lcfi480:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi571:			; NoVLX-NEXT: .Lcfi481:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi572:			; NoVLX-NEXT: .Lcfi482:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi573:			; NoVLX-NEXT: .Lcfi483:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi574:			; NoVLX-NEXT: .Lcfi484:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi575:			; NoVLX-NEXT: .Lcfi485:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 22 Lines
	; VLX-NEXT: vpcmpgtw (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtw (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtw_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtw_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi576:			; NoVLX-NEXT: .Lcfi486:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi577:			; NoVLX-NEXT: .Lcfi487:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi578:			; NoVLX-NEXT: .Lcfi488:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi579:			; NoVLX-NEXT: .Lcfi489:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi580:			; NoVLX-NEXT: .Lcfi490:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi581:			; NoVLX-NEXT: .Lcfi491:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi582:			; NoVLX-NEXT: .Lcfi492:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi583:			; NoVLX-NEXT: .Lcfi493:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtw (%rsi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtw (%rsi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 23 Lines
	; VLX-NEXT: vpcmpgtw %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpgtw %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtw_v16i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsgtw_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi584:			; NoVLX-NEXT: .Lcfi494:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi585:			; NoVLX-NEXT: .Lcfi495:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi586:			; NoVLX-NEXT: .Lcfi496:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi587:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi588:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi589:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi590:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi591:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <4 x i64> %__a to <16 x i16>			%0 = bitcast <4 x i64> %__a to <16 x i16>
	%1 = bitcast <4 x i64> %__b to <16 x i16>			%1 = bitcast <4 x i64> %__b to <16 x i16>
	%2 = icmp sgt <16 x i16> %0, %1			%2 = icmp sgt <16 x i16> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_vpcmpsgtw_v16i1_v64i1_mask_mem(<4 x i64> %__a, <4 x i64>* %__b) local_unnamed_addr {			define zeroext i64 @test_vpcmpsgtw_v16i1_v64i1_mask_mem(<4 x i64> %__a, <4 x i64>* %__b) local_unnamed_addr {
	; VLX-LABEL: test_vpcmpsgtw_v16i1_v64i1_mask_mem:			; VLX-LABEL: test_vpcmpsgtw_v16i1_v64i1_mask_mem:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtw (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpgtw (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtw_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtw_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi592:			; NoVLX-NEXT: .Lcfi497:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi593:			; NoVLX-NEXT: .Lcfi498:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi594:			; NoVLX-NEXT: .Lcfi499:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi595:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi596:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi597:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi598:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi599:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtw (%rdi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtw (%rdi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <4 x i64> %__a to <16 x i16>			%0 = bitcast <4 x i64> %__a to <16 x i16>
	%load = load <4 x i64>, <4 x i64>* %__b			%load = load <4 x i64>, <4 x i64>* %__b
	%1 = bitcast <4 x i64> %load to <16 x i16>			%1 = bitcast <4 x i64> %load to <16 x i16>
	%2 = icmp sgt <16 x i16> %0, %1			%2 = icmp sgt <16 x i16> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_masked_vpcmpsgtw_v16i1_v64i1_mask(i16 zeroext %__u, <4 x i64> %__a, <4 x i64> %__b) local_unnamed_addr {			define zeroext i64 @test_masked_vpcmpsgtw_v16i1_v64i1_mask(i16 zeroext %__u, <4 x i64> %__a, <4 x i64> %__b) local_unnamed_addr {
	; VLX-LABEL: test_masked_vpcmpsgtw_v16i1_v64i1_mask:			; VLX-LABEL: test_masked_vpcmpsgtw_v16i1_v64i1_mask:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtw %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtw %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtw_v16i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtw_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi600:			; NoVLX-NEXT: .Lcfi500:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi601:			; NoVLX-NEXT: .Lcfi501:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi602:			; NoVLX-NEXT: .Lcfi502:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi603:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi604:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi605:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi606:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi607:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <4 x i64> %__a to <16 x i16>			%0 = bitcast <4 x i64> %__a to <16 x i16>
	%1 = bitcast <4 x i64> %__b to <16 x i16>			%1 = bitcast <4 x i64> %__b to <16 x i16>
	%2 = icmp sgt <16 x i16> %0, %1			%2 = icmp sgt <16 x i16> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	%4 = and <16 x i1> %2, %3			%4 = and <16 x i1> %2, %3
	Show All 9 Lines
	; VLX-NEXT: vpcmpgtw (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtw (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtw_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtw_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi608:			; NoVLX-NEXT: .Lcfi503:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi609:			; NoVLX-NEXT: .Lcfi504:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi610:			; NoVLX-NEXT: .Lcfi505:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi611:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi612:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi613:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi614:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi615:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtw (%rsi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtw (%rsi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <4 x i64> %__a to <16 x i16>			%0 = bitcast <4 x i64> %__a to <16 x i16>
	%load = load <4 x i64>, <4 x i64>* %__b			%load = load <4 x i64>, <4 x i64>* %__b
	%1 = bitcast <4 x i64> %load to <16 x i16>			%1 = bitcast <4 x i64> %load to <16 x i16>
	%2 = icmp sgt <16 x i16> %0, %1			%2 = icmp sgt <16 x i16> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	Show All 10 Lines
	; VLX-NEXT: vpcmpgtw %zmm1, %zmm0, %k0			; VLX-NEXT: vpcmpgtw %zmm1, %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtw_v32i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsgtw_v32i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi616:			; NoVLX-NEXT: .Lcfi506:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi617:			; NoVLX-NEXT: .Lcfi507:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi618:			; NoVLX-NEXT: .Lcfi508:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm3			; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm2
	; NoVLX-NEXT: vmovq %xmm3, %rax			; NoVLX-NEXT: vmovq %xmm2, %rax
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: movq %rax, %rdx			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: vmovd %eax, %xmm2			; NoVLX-NEXT: vmovd %eax, %xmm3
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm5			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vextracti32x4 $2, %zmm1, %xmm8			; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm4
	; NoVLX-NEXT: vextracti32x4 $3, %zmm1, %xmm4			; NoVLX-NEXT: vpextrq $1, %xmm4, %rax
	; NoVLX-NEXT: vextracti32x4 $1, %zmm1, %xmm6
	; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm7
	; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm2
	; NoVLX-NEXT: shrq $32, %rdx			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %edx, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm3, %xmm3
	; NoVLX-NEXT: vpextrq $1, %xmm3, %rax			; NoVLX-NEXT: vpextrq $1, %xmm2, %rdx
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %edx, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rdx, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vmovq %xmm0, %rcx			; NoVLX-NEXT: vmovq %xmm0, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rdx
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $7, %edx, %xmm2, %xmm9
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %edx
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %edx
	; NoVLX-NEXT: vmovd %ecx, %xmm5			; NoVLX-NEXT: vmovd %ecx, %xmm3
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $1, %edx, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rdx
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm3, %xmm3
	; NoVLX-NEXT: vpextrq $1, %xmm0, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rdx
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm0			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %edx, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $4, %edx, %xmm3, %xmm3
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rdx, %rcx
				; NoVLX-NEXT: shrq $48, %rdx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: vmovq %xmm2, %rcx			; NoVLX-NEXT: vpinsrw $7, %edx, %xmm3, %xmm3
				; NoVLX-NEXT: vmovq %xmm4, %rcx
				; NoVLX-NEXT: movl %ecx, %edx
				; NoVLX-NEXT: shrl $16, %edx
				; NoVLX-NEXT: vmovd %ecx, %xmm4
				; NoVLX-NEXT: vpinsrw $1, %edx, %xmm4, %xmm4
				; NoVLX-NEXT: movq %rcx, %rdx
				; NoVLX-NEXT: shrq $32, %rdx
				; NoVLX-NEXT: vpinsrw $2, %edx, %xmm4, %xmm4
				; NoVLX-NEXT: movl %eax, %edx
				; NoVLX-NEXT: shrl $16, %edx
				; NoVLX-NEXT: shrq $48, %rcx
				; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm4
				; NoVLX-NEXT: vpinsrw $4, %eax, %xmm4, %xmm4
				; NoVLX-NEXT: vpinsrw $5, %edx, %xmm4, %xmm4
				; NoVLX-NEXT: vextracti32x4 $1, %zmm1, %xmm6
				; NoVLX-NEXT: vmovq %xmm6, %rcx
				; NoVLX-NEXT: movq %rax, %rdx
				; NoVLX-NEXT: shrq $32, %rdx
				; NoVLX-NEXT: vpinsrw $6, %edx, %xmm4, %xmm4
				; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm0
				; NoVLX-NEXT: vmovq %xmm0, %rdx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %edx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm5			; NoVLX-NEXT: vmovd %edx, %xmm5
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rdx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: vpextrq $1, %xmm2, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rdx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm2			; NoVLX-NEXT: vpinsrw $3, %edx, %xmm5, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %edx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %edx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vmovq %xmm7, %rcx			; NoVLX-NEXT: movq %rcx, %rdx
				; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm5			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm5
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm0
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: vmovq %xmm1, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpextrq $1, %xmm6, %rdx
	; NoVLX-NEXT: vpextrq $1, %xmm7, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %edx, %ecx
				; NoVLX-NEXT: vpinsrw $4, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: movq %rdx, %rcx
	; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vmovq %xmm6, %rcx
	; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm7
	; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm6, %rax
	; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: shrq $48, %rdx
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $7, %edx, %xmm0, %xmm8
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: vmovd %eax, %xmm6
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: vpinsrw $1, %ecx, %xmm6, %xmm6
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vextracti32x4 $3, %zmm1, %xmm7
	; NoVLX-NEXT: vmovq %xmm1, %rcx			; NoVLX-NEXT: vmovq %xmm7, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm6			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm6, %xmm6
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: movl %ecx, %edx
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: shrl $16, %edx
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm0
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: vpinsrw $1, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: movq %rcx, %rdx
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpextrq $1, %xmm1, %rax			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpextrq $1, %xmm7, %rdx
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm1			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %edx, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $4, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rdx, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vmovq %xmm4, %rcx			; NoVLX-NEXT: vextracti32x4 $2, %zmm1, %xmm7
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: vmovq %xmm7, %rcx
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1			; NoVLX-NEXT: shrq $48, %rdx
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: vpinsrw $7, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: movl %ecx, %edx
				; NoVLX-NEXT: shrl $16, %edx
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rdx
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm4, %rax			; NoVLX-NEXT: vpextrq $1, %xmm7, %rdx
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %edx, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rdx, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vmovq %xmm8, %rcx			; NoVLX-NEXT: shrq $48, %rdx
				; NoVLX-NEXT: vpinsrw $7, %edx, %xmm2, %xmm2
				; NoVLX-NEXT: vpextrq $1, %xmm1, %rcx
				; NoVLX-NEXT: vinserti128 $1, %xmm9, %ymm3, %ymm1
				; NoVLX-NEXT: vinserti128 $1, %xmm4, %ymm5, %ymm3
				; NoVLX-NEXT: vinserti128 $1, %xmm0, %ymm2, %ymm0
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $3, %eax, %xmm6, %xmm2
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm4			; NoVLX-NEXT: vpinsrw $4, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $5, %eax, %xmm2, %xmm2
				; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm3, %ymm0
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $6, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm8, %rax
	; NoVLX-NEXT: vinserti128 $1, %xmm3, %ymm0, %ymm0
	; NoVLX-NEXT: vinserti128 $1, %xmm5, %ymm7, %ymm3
	; NoVLX-NEXT: vinserti128 $1, %xmm6, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm1			; NoVLX-NEXT: vpinsrw $7, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vinserti128 $1, %xmm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtw %ymm1, %ymm3, %ymm1
	; NoVLX-NEXT: vpmovsxwd %ymm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $2, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $3, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $6, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $9, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $10, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $10, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $13, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $14, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $14, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: vinserti128 $1, %xmm8, %ymm2, %ymm2
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpcmpgtw %ymm2, %ymm1, %ymm1
				; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
				; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
				; NoVLX-NEXT: vpmovsxwd %ymm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm0			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $1, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $2, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $3, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $10, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $14, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %eax, %xmm1, %xmm1
				; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm1, %xmm0
				; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %ecx			; NoVLX-NEXT: movl (%rsp), %ecx
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 18 Lines
	; VLX-NEXT: vpcmpgtw (%rdi), %zmm0, %k0			; VLX-NEXT: vpcmpgtw (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtw_v32i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtw_v32i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi619:			; NoVLX-NEXT: .Lcfi509:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi620:			; NoVLX-NEXT: .Lcfi510:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi621:			; NoVLX-NEXT: .Lcfi511:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm2			; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm1
	; NoVLX-NEXT: vmovq %xmm2, %rax			; NoVLX-NEXT: vmovq %xmm1, %rax
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: movq %rax, %rdx			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: vmovd %eax, %xmm1			; NoVLX-NEXT: vmovd %eax, %xmm2
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm1, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm1
	; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm4
	; NoVLX-NEXT: shrq $32, %rdx			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %edx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm2, %rax			; NoVLX-NEXT: vpextrq $1, %xmm1, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm1
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: vmovq %xmm0, %rcx			; NoVLX-NEXT: vmovq %xmm0, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm0, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm0			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vmovq %xmm4, %rcx			; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm3
				; NoVLX-NEXT: vmovq %xmm3, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm4
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vpextrq $1, %xmm4, %rax			; NoVLX-NEXT: vpextrq $1, %xmm3, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm3
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: vmovq %xmm1, %rcx			; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm0
				; NoVLX-NEXT: vmovq %xmm0, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm4			; NoVLX-NEXT: vmovd %ecx, %xmm4
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vpextrq $1, %xmm1, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm1			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vinserti128 $1, %xmm3, %ymm1, %ymm1			; NoVLX-NEXT: vinserti128 $1, %xmm3, %ymm0, %ymm0
	; NoVLX-NEXT: vpcmpgtw 32(%rdi), %ymm1, %ymm1			; NoVLX-NEXT: vpcmpgtw 32(%rdi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm1, %zmm1			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %eax, %xmm1			; NoVLX-NEXT: vmovd %eax, %xmm0
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $1, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $2, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $3, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $6, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $9, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $10, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $10, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $13, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $14, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $14, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vinserti128 $1, %xmm1, %ymm2, %ymm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
				; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpcmpgtw (%rdi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtw (%rdi), %ymm1, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpgtw %zmm1, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtw %zmm1, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtw_v32i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtw_v32i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi622:			; NoVLX-NEXT: .Lcfi512:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi623:			; NoVLX-NEXT: .Lcfi513:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi624:			; NoVLX-NEXT: .Lcfi514:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm2			; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm2
	; NoVLX-NEXT: vmovq %xmm2, %rax			; NoVLX-NEXT: vmovq %xmm2, %rax
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: movq %rax, %rdx			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: vmovd %eax, %xmm3			; NoVLX-NEXT: vmovd %eax, %xmm3
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm4			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vextracti32x4 $1, %zmm1, %xmm8
	; NoVLX-NEXT: vextracti32x4 $2, %zmm1, %xmm5
	; NoVLX-NEXT: vextracti32x4 $3, %zmm1, %xmm7
	; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm6
	; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm3
	; NoVLX-NEXT: shrq $32, %rdx			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %edx, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm3, %xmm3
	; NoVLX-NEXT: vpextrq $1, %xmm2, %rax			; NoVLX-NEXT: vpextrq $1, %xmm2, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
				; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm3
	; NoVLX-NEXT: vmovq %xmm3, %rcx			; NoVLX-NEXT: vmovq %xmm3, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm9			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm8
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm4			; NoVLX-NEXT: vmovd %ecx, %xmm4
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vpextrq $1, %xmm3, %rax			; NoVLX-NEXT: vpextrq $1, %xmm3, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm3
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: vmovq %xmm6, %rcx			; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm4
				; NoVLX-NEXT: vmovq %xmm4, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm4			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm5
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: vpextrq $1, %xmm6, %rax			; NoVLX-NEXT: vpextrq $1, %xmm4, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm4
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm4, %xmm4
	; NoVLX-NEXT: vmovq %xmm0, %rcx			; NoVLX-NEXT: vmovq %xmm0, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm6			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm5
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: vpextrq $1, %xmm0, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm0			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vmovq %xmm7, %rcx			; NoVLX-NEXT: vextracti32x4 $3, %zmm1, %xmm5
				; NoVLX-NEXT: vmovq %xmm5, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm6
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm6, %xmm6
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm6, %xmm6
	; NoVLX-NEXT: vpextrq $1, %xmm7, %rax			; NoVLX-NEXT: vpextrq $1, %xmm5, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm6, %xmm5
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm5, %xmm5
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm5, %xmm5
	; NoVLX-NEXT: vmovq %xmm5, %rcx			; NoVLX-NEXT: vextracti32x4 $2, %zmm1, %xmm6
				; NoVLX-NEXT: vmovq %xmm6, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm7			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm7
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm7, %xmm7
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm7, %xmm7
	; NoVLX-NEXT: vpextrq $1, %xmm5, %rax			; NoVLX-NEXT: vpextrq $1, %xmm6, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm7, %xmm6
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm6, %xmm6
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm6, %xmm6
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm6, %xmm6
	; NoVLX-NEXT: vmovq %xmm8, %rcx			; NoVLX-NEXT: vextracti32x4 $1, %zmm1, %xmm7
				; NoVLX-NEXT: vmovq %xmm7, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm6, %xmm6
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm5			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm8, %rax			; NoVLX-NEXT: vpextrq $1, %xmm7, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vmovq %xmm1, %rcx			; NoVLX-NEXT: vmovq %xmm1, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm7
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm7, %xmm7
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm7, %xmm7
	; NoVLX-NEXT: vpextrq $1, %xmm1, %rax			; NoVLX-NEXT: vpextrq $1, %xmm1, %rax
	; NoVLX-NEXT: vinserti128 $1, %xmm9, %ymm4, %ymm1			; NoVLX-NEXT: vinserti128 $1, %xmm8, %ymm3, %ymm1
	; NoVLX-NEXT: vinserti128 $1, %xmm6, %ymm0, %ymm4			; NoVLX-NEXT: vinserti128 $1, %xmm4, %ymm0, %ymm4
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2
	; NoVLX-NEXT: vinserti128 $1, %xmm7, %ymm3, %ymm3			; NoVLX-NEXT: vinserti128 $1, %xmm5, %ymm6, %ymm3
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: vpmovdb %zmm0, %xmm0			; NoVLX-NEXT: vpmovdb %zmm0, %xmm0
	; NoVLX-NEXT: vpcmpgtw %ymm3, %ymm1, %ymm3
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k2} {z}
	; NoVLX-NEXT: vpmovdb %zmm1, %xmm1
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpcmpgtw %ymm3, %ymm1, %ymm3
				; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm7, %xmm1
				; NoVLX-NEXT: vpternlogd $255, %zmm5, %zmm5, %zmm5 {%k2} {z}
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm6
	; NoVLX-NEXT: vinserti128 $1, %xmm5, %ymm2, %ymm2			; NoVLX-NEXT: vpmovdb %zmm5, %xmm1
				; NoVLX-NEXT: vinserti128 $1, %xmm2, %ymm6, %ymm2
	; NoVLX-NEXT: vpcmpgtw %ymm2, %ymm4, %ymm2			; NoVLX-NEXT: vpcmpgtw %ymm2, %ymm4, %ymm2
	; NoVLX-NEXT: vpmovsxwd %ymm2, %zmm2			; NoVLX-NEXT: vpmovsxwd %ymm2, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2
	; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0			; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	▲ Show 20 Lines • Show All 160 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpgtw (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtw (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtw_v32i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtw_v32i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi625:			; NoVLX-NEXT: .Lcfi515:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi626:			; NoVLX-NEXT: .Lcfi516:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi627:			; NoVLX-NEXT: .Lcfi517:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm1			; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm1
	; NoVLX-NEXT: vmovq %xmm1, %rax			; NoVLX-NEXT: vmovq %xmm1, %rax
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: movq %rax, %rdx			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: vmovd %eax, %xmm2			; NoVLX-NEXT: vmovd %eax, %xmm2
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm3
	; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm4
	; NoVLX-NEXT: shrq $32, %rdx			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %edx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm1, %rax			; NoVLX-NEXT: vpextrq $1, %xmm1, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm1			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm1
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: vmovq %xmm4, %rcx			; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm2
				; NoVLX-NEXT: vmovq %xmm2, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm3
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpextrq $1, %xmm4, %rax			; NoVLX-NEXT: vpextrq $1, %xmm2, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
				; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm3
	; NoVLX-NEXT: vmovq %xmm3, %rcx			; NoVLX-NEXT: vmovq %xmm3, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm4			; NoVLX-NEXT: vmovd %ecx, %xmm4
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vpextrq $1, %xmm3, %rax			; NoVLX-NEXT: vpextrq $1, %xmm3, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm3
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: vmovq %xmm0, %rcx			; NoVLX-NEXT: vmovq %xmm0, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm4			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm4
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vpextrq $1, %xmm0, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm0			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm5			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm4
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: vpmovdb %zmm0, %xmm0			; NoVLX-NEXT: vpmovdb %zmm0, %xmm0
	; NoVLX-NEXT: vinserti128 $1, %xmm1, %ymm2, %ymm3
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k2} {z}
	; NoVLX-NEXT: vpmovdb %zmm1, %xmm1
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm5, %xmm2			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vinserti128 $1, %xmm4, %ymm2, %ymm2			; NoVLX-NEXT: vinserti128 $1, %xmm3, %ymm4, %ymm3
	; NoVLX-NEXT: vpcmpgtw (%rsi), %ymm2, %ymm2			; NoVLX-NEXT: vpternlogd $255, %zmm4, %zmm4, %zmm4 {%k2} {z}
	; NoVLX-NEXT: vpmovsxwd %ymm2, %zmm2			; NoVLX-NEXT: vpcmpgtw (%rsi), %ymm3, %ymm3
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2			; NoVLX-NEXT: vpmovsxwd %ymm3, %zmm3
	; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0			; NoVLX-NEXT: vpslld $31, %zmm3, %zmm3
				; NoVLX-NEXT: vptestmd %zmm3, %zmm3, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %eax, %xmm2			; NoVLX-NEXT: vmovd %eax, %xmm3
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $1, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $2, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $3, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $3, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $6, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $6, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $9, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $9, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $10, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $10, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $13, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $14, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $14, %eax, %xmm3, %xmm3
				; NoVLX-NEXT: vpmovdb %zmm4, %xmm4
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpcmpgtw 32(%rsi), %ymm3, %ymm3			; NoVLX-NEXT: vinserti128 $1, %xmm1, %ymm2, %ymm1
	; NoVLX-NEXT: vpmovsxwd %ymm3, %zmm3			; NoVLX-NEXT: vpcmpgtw 32(%rsi), %ymm1, %ymm1
	; NoVLX-NEXT: vpslld $31, %zmm3, %zmm3			; NoVLX-NEXT: vpmovsxwd %ymm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm3, %zmm3, %k0			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
				; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $1, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $2, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $3, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $3, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $6, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $6, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $9, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $9, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $10, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $10, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $13, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $14, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $14, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm3, %xmm1			; NoVLX-NEXT: vpand %xmm4, %xmm1, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpand %xmm0, %xmm2, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm3, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %ecx			; NoVLX-NEXT: movl (%rsp), %ecx
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 24 Lines
	; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v8i1_mask:			; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	Show All 37 Lines
	; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v8i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v8i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtd (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	Show All 39 Lines
	; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v8i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v8i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v8i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtd (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v8i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v8i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v8i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v8i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v16i1_mask:			; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 36 Lines
	; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v16i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v16i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtd (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 38 Lines
	; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v16i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 40 Lines
	; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v16i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v16i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtd (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v16i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v16i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 40 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v16i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v16i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 39 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtd %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpgtd %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi628:			; NoVLX-NEXT: .Lcfi518:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi629:			; NoVLX-NEXT: .Lcfi519:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi630:			; NoVLX-NEXT: .Lcfi520:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 21 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtd (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpgtd (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi631:			; NoVLX-NEXT: .Lcfi521:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi632:			; NoVLX-NEXT: .Lcfi522:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi633:			; NoVLX-NEXT: .Lcfi523:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtd (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 23 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtd %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtd %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi634:			; NoVLX-NEXT: .Lcfi524:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi635:			; NoVLX-NEXT: .Lcfi525:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi636:			; NoVLX-NEXT: .Lcfi526:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 23 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtd (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtd (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi637:			; NoVLX-NEXT: .Lcfi527:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi638:			; NoVLX-NEXT: .Lcfi528:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi639:			; NoVLX-NEXT: .Lcfi529:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtd (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 24 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtd (%rdi){1to4}, %xmm0, %k0			; VLX-NEXT: vpcmpgtd (%rdi){1to4}, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi640:			; NoVLX-NEXT: .Lcfi530:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi641:			; NoVLX-NEXT: .Lcfi531:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi642:			; NoVLX-NEXT: .Lcfi532:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	Show All 25 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtd (%rsi){1to4}, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtd (%rsi){1to4}, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi643:			; NoVLX-NEXT: .Lcfi533:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi644:			; NoVLX-NEXT: .Lcfi534:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi645:			; NoVLX-NEXT: .Lcfi535:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 25 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtd %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpgtd %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi646:			; NoVLX-NEXT: .Lcfi536:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi647:			; NoVLX-NEXT: .Lcfi537:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi648:			; NoVLX-NEXT: .Lcfi538:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 27 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtd (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpgtd (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi649:			; NoVLX-NEXT: .Lcfi539:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi650:			; NoVLX-NEXT: .Lcfi540:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi651:			; NoVLX-NEXT: .Lcfi541:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtd (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 29 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtd %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtd %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi652:			; NoVLX-NEXT: .Lcfi542:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi653:			; NoVLX-NEXT: .Lcfi543:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi654:			; NoVLX-NEXT: .Lcfi544:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0
				; NoVLX-NEXT: vpand %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 27 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtd (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtd (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi655:			; NoVLX-NEXT: .Lcfi545:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi656:			; NoVLX-NEXT: .Lcfi546:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi657:			; NoVLX-NEXT: .Lcfi547:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtd (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtd (%rdi){1to4}, %xmm0, %k0			; VLX-NEXT: vpcmpgtd (%rdi){1to4}, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgtd_v4i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi658:			; NoVLX-NEXT: .Lcfi548:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi659:			; NoVLX-NEXT: .Lcfi549:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi660:			; NoVLX-NEXT: .Lcfi550:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 31 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtd (%rsi){1to4}, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtd (%rsi){1to4}, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v4i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi661:			; NoVLX-NEXT: .Lcfi551:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi662:			; NoVLX-NEXT: .Lcfi552:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi663:			; NoVLX-NEXT: .Lcfi553:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0
				; NoVLX-NEXT: vpand %xmm0, %xmm2, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	▲ Show 20 Lines • Show All 218 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpgtd %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpgtd %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v8i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpsgtd_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi664:			; NoVLX-NEXT: .Lcfi554:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi665:			; NoVLX-NEXT: .Lcfi555:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi666:			; NoVLX-NEXT: .Lcfi556:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>			; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 14 Lines
	; VLX-NEXT: vpcmpgtd (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpgtd (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtd_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi667:			; NoVLX-NEXT: .Lcfi557:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi668:			; NoVLX-NEXT: .Lcfi558:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi669:			; NoVLX-NEXT: .Lcfi559:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vmovdqa (%rdi), %ymm1			; NoVLX-NEXT: vmovdqa (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 16 Lines
	; VLX-NEXT: vpcmpgtd %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtd %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v8i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi670:			; NoVLX-NEXT: .Lcfi560:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi671:			; NoVLX-NEXT: .Lcfi561:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi672:			; NoVLX-NEXT: .Lcfi562:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>			; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX-NEXT: vpcmpgtd (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtd (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi673:			; NoVLX-NEXT: .Lcfi563:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi674:			; NoVLX-NEXT: .Lcfi564:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi675:			; NoVLX-NEXT: .Lcfi565:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vmovdqa (%rsi), %ymm1			; NoVLX-NEXT: vmovdqa (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 18 Lines
	; VLX-NEXT: vpcmpgtd (%rdi){1to8}, %ymm0, %k0			; VLX-NEXT: vpcmpgtd (%rdi){1to8}, %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v8i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgtd_v8i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi676:			; NoVLX-NEXT: .Lcfi566:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi677:			; NoVLX-NEXT: .Lcfi567:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi678:			; NoVLX-NEXT: .Lcfi568:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpbroadcastd (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX-NEXT: vpcmpgtd (%rsi){1to8}, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtd (%rsi){1to8}, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v8i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v8i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi679:			; NoVLX-NEXT: .Lcfi569:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi680:			; NoVLX-NEXT: .Lcfi570:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi681:			; NoVLX-NEXT: .Lcfi571:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpbroadcastd (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k0, %k1, %k0			; NoVLX-NEXT: kandw %k0, %k1, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 19 Lines
	; VLX-NEXT: vpcmpgtd %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpgtd %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v8i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsgtd_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi682:			; NoVLX-NEXT: .Lcfi572:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi683:			; NoVLX-NEXT: .Lcfi573:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi684:			; NoVLX-NEXT: .Lcfi574:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>			; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpgtd (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpgtd (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtd_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi685:			; NoVLX-NEXT: .Lcfi575:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi686:			; NoVLX-NEXT: .Lcfi576:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi687:			; NoVLX-NEXT: .Lcfi577:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vmovdqa (%rdi), %ymm1			; NoVLX-NEXT: vmovdqa (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpgtd %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtd %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v8i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi688:			; NoVLX-NEXT: .Lcfi578:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi689:			; NoVLX-NEXT: .Lcfi579:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi690:			; NoVLX-NEXT: .Lcfi580:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>			; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpgtd (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtd (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi691:			; NoVLX-NEXT: .Lcfi581:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi692:			; NoVLX-NEXT: .Lcfi582:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi693:			; NoVLX-NEXT: .Lcfi583:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vmovdqa (%rsi), %ymm1			; NoVLX-NEXT: vmovdqa (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpgtd (%rdi){1to8}, %ymm0, %k0			; VLX-NEXT: vpcmpgtd (%rdi){1to8}, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v8i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgtd_v8i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi694:			; NoVLX-NEXT: .Lcfi584:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi695:			; NoVLX-NEXT: .Lcfi585:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi696:			; NoVLX-NEXT: .Lcfi586:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpbroadcastd (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpgtd (%rsi){1to8}, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtd (%rsi){1to8}, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v8i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v8i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi697:			; NoVLX-NEXT: .Lcfi587:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi698:			; NoVLX-NEXT: .Lcfi588:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi699:			; NoVLX-NEXT: .Lcfi589:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpbroadcastd (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k0, %k1, %k0			; NoVLX-NEXT: kandw %k0, %k1, %k0
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0			; VLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v16i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpsgtd_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi700:			; NoVLX-NEXT: .Lcfi590:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi701:			; NoVLX-NEXT: .Lcfi591:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi702:			; NoVLX-NEXT: .Lcfi592:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi703:			; NoVLX-NEXT: .Lcfi593:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi704:			; NoVLX-NEXT: .Lcfi594:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi705:			; NoVLX-NEXT: .Lcfi595:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi706:			; NoVLX-NEXT: .Lcfi596:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi707:			; NoVLX-NEXT: .Lcfi597:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 19 Lines
	; VLX-NEXT: vpcmpgtd (%rdi), %zmm0, %k0			; VLX-NEXT: vpcmpgtd (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtd_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi708:			; NoVLX-NEXT: .Lcfi598:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi709:			; NoVLX-NEXT: .Lcfi599:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi710:			; NoVLX-NEXT: .Lcfi600:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi711:			; NoVLX-NEXT: .Lcfi601:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi712:			; NoVLX-NEXT: .Lcfi602:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi713:			; NoVLX-NEXT: .Lcfi603:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi714:			; NoVLX-NEXT: .Lcfi604:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi715:			; NoVLX-NEXT: .Lcfi605:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtd (%rdi), %zmm0, %k0			; NoVLX-NEXT: vpcmpgtd (%rdi), %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 21 Lines
	; VLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v16i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi716:			; NoVLX-NEXT: .Lcfi606:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi717:			; NoVLX-NEXT: .Lcfi607:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi718:			; NoVLX-NEXT: .Lcfi608:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi719:			; NoVLX-NEXT: .Lcfi609:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi720:			; NoVLX-NEXT: .Lcfi610:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi721:			; NoVLX-NEXT: .Lcfi611:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi722:			; NoVLX-NEXT: .Lcfi612:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi723:			; NoVLX-NEXT: .Lcfi613:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 22 Lines
	; VLX-NEXT: vpcmpgtd (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtd (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi724:			; NoVLX-NEXT: .Lcfi614:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi725:			; NoVLX-NEXT: .Lcfi615:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi726:			; NoVLX-NEXT: .Lcfi616:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi727:			; NoVLX-NEXT: .Lcfi617:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi728:			; NoVLX-NEXT: .Lcfi618:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi729:			; NoVLX-NEXT: .Lcfi619:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi730:			; NoVLX-NEXT: .Lcfi620:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi731:			; NoVLX-NEXT: .Lcfi621:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpgtd (%rsi), %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpgtd (%rsi), %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 23 Lines
	; VLX-NEXT: vpcmpgtd (%rdi){1to16}, %zmm0, %k0			; VLX-NEXT: vpcmpgtd (%rdi){1to16}, %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v16i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgtd_v16i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi732:			; NoVLX-NEXT: .Lcfi622:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi733:			; NoVLX-NEXT: .Lcfi623:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi734:			; NoVLX-NEXT: .Lcfi624:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi735:			; NoVLX-NEXT: .Lcfi625:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi736:			; NoVLX-NEXT: .Lcfi626:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi737:			; NoVLX-NEXT: .Lcfi627:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi738:			; NoVLX-NEXT: .Lcfi628:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi739:			; NoVLX-NEXT: .Lcfi629:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtd (%rdi){1to16}, %zmm0, %k0			; NoVLX-NEXT: vpcmpgtd (%rdi){1to16}, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 22 Lines
	; VLX-NEXT: vpcmpgtd (%rsi){1to16}, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtd (%rsi){1to16}, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v16i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v16i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi740:			; NoVLX-NEXT: .Lcfi630:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi741:			; NoVLX-NEXT: .Lcfi631:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi742:			; NoVLX-NEXT: .Lcfi632:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi743:			; NoVLX-NEXT: .Lcfi633:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi744:			; NoVLX-NEXT: .Lcfi634:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi745:			; NoVLX-NEXT: .Lcfi635:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi746:			; NoVLX-NEXT: .Lcfi636:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi747:			; NoVLX-NEXT: .Lcfi637:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpgtd (%rsi){1to16}, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpgtd (%rsi){1to16}, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 24 Lines
	; VLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0			; VLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v16i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsgtd_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi748:			; NoVLX-NEXT: .Lcfi638:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi749:			; NoVLX-NEXT: .Lcfi639:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi750:			; NoVLX-NEXT: .Lcfi640:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi751:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi752:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi753:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi754:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi755:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%1 = bitcast <8 x i64> %__b to <16 x i32>			%1 = bitcast <8 x i64> %__b to <16 x i32>
	%2 = icmp sgt <16 x i32> %0, %1			%2 = icmp sgt <16 x i32> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0,i32 1,i32 2,i32 3,i32 4,i32 5,i32 6,i32 7,i32 8,i32 9,i32 10,i32 11,i32 12,i32 13,i32 14,i32 15,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0,i32 1,i32 2,i32 3,i32 4,i32 5,i32 6,i32 7,i32 8,i32 9,i32 10,i32 11,i32 12,i32 13,i32 14,i32 15,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_vpcmpsgtd_v16i1_v64i1_mask_mem(<8 x i64> %__a, <8 x i64>* %__b) local_unnamed_addr {			define zeroext i64 @test_vpcmpsgtd_v16i1_v64i1_mask_mem(<8 x i64> %__a, <8 x i64>* %__b) local_unnamed_addr {
	; VLX-LABEL: test_vpcmpsgtd_v16i1_v64i1_mask_mem:			; VLX-LABEL: test_vpcmpsgtd_v16i1_v64i1_mask_mem:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtd (%rdi), %zmm0, %k0			; VLX-NEXT: vpcmpgtd (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtd_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi756:			; NoVLX-NEXT: .Lcfi641:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi757:			; NoVLX-NEXT: .Lcfi642:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi758:			; NoVLX-NEXT: .Lcfi643:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi759:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi760:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi761:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi762:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi763:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtd (%rdi), %zmm0, %k0			; NoVLX-NEXT: vpcmpgtd (%rdi), %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%load = load <8 x i64>, <8 x i64>* %__b			%load = load <8 x i64>, <8 x i64>* %__b
	%1 = bitcast <8 x i64> %load to <16 x i32>			%1 = bitcast <8 x i64> %load to <16 x i32>
	%2 = icmp sgt <16 x i32> %0, %1			%2 = icmp sgt <16 x i32> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0,i32 1,i32 2,i32 3,i32 4,i32 5,i32 6,i32 7,i32 8,i32 9,i32 10,i32 11,i32 12,i32 13,i32 14,i32 15,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0,i32 1,i32 2,i32 3,i32 4,i32 5,i32 6,i32 7,i32 8,i32 9,i32 10,i32 11,i32 12,i32 13,i32 14,i32 15,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_masked_vpcmpsgtd_v16i1_v64i1_mask(i16 zeroext %__u, <8 x i64> %__a, <8 x i64> %__b) local_unnamed_addr {			define zeroext i64 @test_masked_vpcmpsgtd_v16i1_v64i1_mask(i16 zeroext %__u, <8 x i64> %__a, <8 x i64> %__b) local_unnamed_addr {
	; VLX-LABEL: test_masked_vpcmpsgtd_v16i1_v64i1_mask:			; VLX-LABEL: test_masked_vpcmpsgtd_v16i1_v64i1_mask:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v16i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi764:			; NoVLX-NEXT: .Lcfi644:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi765:			; NoVLX-NEXT: .Lcfi645:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi766:			; NoVLX-NEXT: .Lcfi646:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi767:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi768:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi769:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi770:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi771:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpgtd %zmm1, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%1 = bitcast <8 x i64> %__b to <16 x i32>			%1 = bitcast <8 x i64> %__b to <16 x i32>
	%2 = icmp sgt <16 x i32> %0, %1			%2 = icmp sgt <16 x i32> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	%4 = and <16 x i1> %2, %3			%4 = and <16 x i1> %2, %3
	Show All 9 Lines
	; VLX-NEXT: vpcmpgtd (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtd (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi772:			; NoVLX-NEXT: .Lcfi647:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi773:			; NoVLX-NEXT: .Lcfi648:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi774:			; NoVLX-NEXT: .Lcfi649:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi775:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi776:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi777:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi778:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi779:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpgtd (%rsi), %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpgtd (%rsi), %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%load = load <8 x i64>, <8 x i64>* %__b			%load = load <8 x i64>, <8 x i64>* %__b
	%1 = bitcast <8 x i64> %load to <16 x i32>			%1 = bitcast <8 x i64> %load to <16 x i32>
	%2 = icmp sgt <16 x i32> %0, %1			%2 = icmp sgt <16 x i32> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	Show All 10 Lines
	; VLX-NEXT: vpcmpgtd (%rdi){1to16}, %zmm0, %k0			; VLX-NEXT: vpcmpgtd (%rdi){1to16}, %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtd_v16i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgtd_v16i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi780:			; NoVLX-NEXT: .Lcfi650:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi781:			; NoVLX-NEXT: .Lcfi651:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi782:			; NoVLX-NEXT: .Lcfi652:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi783:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi784:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi785:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi786:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi787:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtd (%rdi){1to16}, %zmm0, %k0			; NoVLX-NEXT: vpcmpgtd (%rdi){1to16}, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%load = load i32, i32* %__b			%load = load i32, i32* %__b
	%vec = insertelement <16 x i32> undef, i32 %load, i32 0			%vec = insertelement <16 x i32> undef, i32 %load, i32 0
	%1 = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%1 = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	%2 = icmp sgt <16 x i32> %0, %1			%2 = icmp sgt <16 x i32> %0, %1
	Show All 9 Lines
	; VLX-NEXT: vpcmpgtd (%rsi){1to16}, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtd (%rsi){1to16}, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtd_v16i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgtd_v16i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi788:			; NoVLX-NEXT: .Lcfi653:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi789:			; NoVLX-NEXT: .Lcfi654:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi790:			; NoVLX-NEXT: .Lcfi655:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi791:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi792:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi793:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi794:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi795:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpgtd (%rsi){1to16}, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpgtd (%rsi){1to16}, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%load = load i32, i32* %__b			%load = load i32, i32* %__b
	%vec = insertelement <16 x i32> undef, i32 %load, i32 0			%vec = insertelement <16 x i32> undef, i32 %load, i32 0
	%1 = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%1 = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	%2 = icmp sgt <16 x i32> %0, %1			%2 = icmp sgt <16 x i32> %0, %1
	▲ Show 20 Lines • Show All 66 Lines • ▼ Show 20 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtq %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtq %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovb %k0, -{{[0-9]+}}(%rsp)			; VLX-NEXT: kmovb %k0, -{{[0-9]+}}(%rsp)
	; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v2i1_v4i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v2i1_v4i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
				; NoVLX-NEXT: vpand %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero			; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero
	; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0			; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	▲ Show 20 Lines • Show All 88 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpgtq (%rsi){1to2}, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtq (%rsi){1to2}, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovb %k0, -{{[0-9]+}}(%rsp)			; VLX-NEXT: kmovb %k0, -{{[0-9]+}}(%rsp)
	; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v2i1_v4i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v2i1_v4i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
				; NoVLX-NEXT: vpand %xmm0, %xmm2, %xmm0
	; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero			; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero
	; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0			; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	Show All 19 Lines
	; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v8i1_mask:			; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%1 = bitcast <2 x i64> %__b to <2 x i64>			%1 = bitcast <2 x i64> %__b to <2 x i64>
	Show All 11 Lines
	; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v8i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v8i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtq (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	Show All 23 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%1 = bitcast <2 x i64> %__b to <2 x i64>			%1 = bitcast <2 x i64> %__b to <2 x i64>
	Show All 25 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	Show All 17 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v8i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v8i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load i64, i64* %__b			%load = load i64, i64* %__b
	Show All 25 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load i64, i64* %__b			%load = load i64, i64* %__b
	Show All 17 Lines
	; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v16i1_mask:			; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%1 = bitcast <2 x i64> %__b to <2 x i64>			%1 = bitcast <2 x i64> %__b to <2 x i64>
	Show All 11 Lines
	; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v16i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v16i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtq (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	Show All 23 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%1 = bitcast <2 x i64> %__b to <2 x i64>			%1 = bitcast <2 x i64> %__b to <2 x i64>
	Show All 25 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	Show All 17 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v16i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v16i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load i64, i64* %__b			%load = load i64, i64* %__b
	Show All 25 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load i64, i64* %__b			%load = load i64, i64* %__b
	Show All 14 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtq %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpgtq %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi796:			; NoVLX-NEXT: .Lcfi656:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi797:			; NoVLX-NEXT: .Lcfi657:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi798:			; NoVLX-NEXT: .Lcfi658:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 21 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtq (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpgtq (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi799:			; NoVLX-NEXT: .Lcfi659:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi800:			; NoVLX-NEXT: .Lcfi660:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi801:			; NoVLX-NEXT: .Lcfi661:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtq (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 23 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtq %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtq %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v2i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v2i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi802:			; NoVLX-NEXT: .Lcfi662:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi803:			; NoVLX-NEXT: .Lcfi663:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi804:			; NoVLX-NEXT: .Lcfi664:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	Show All 35 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtq (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtq (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v2i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v2i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi805:			; NoVLX-NEXT: .Lcfi665:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi806:			; NoVLX-NEXT: .Lcfi666:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi807:			; NoVLX-NEXT: .Lcfi667:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtq (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	Show All 36 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtq (%rdi){1to2}, %xmm0, %k0			; VLX-NEXT: vpcmpgtq (%rdi){1to2}, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi808:			; NoVLX-NEXT: .Lcfi668:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi809:			; NoVLX-NEXT: .Lcfi669:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi810:			; NoVLX-NEXT: .Lcfi670:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	Show All 25 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtq (%rsi){1to2}, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtq (%rsi){1to2}, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v2i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v2i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi811:			; NoVLX-NEXT: .Lcfi671:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi812:			; NoVLX-NEXT: .Lcfi672:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi813:			; NoVLX-NEXT: .Lcfi673:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	Show All 38 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtq %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpgtq %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi814:			; NoVLX-NEXT: .Lcfi674:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi815:			; NoVLX-NEXT: .Lcfi675:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi816:			; NoVLX-NEXT: .Lcfi676:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 27 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtq (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpgtq (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi817:			; NoVLX-NEXT: .Lcfi677:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi818:			; NoVLX-NEXT: .Lcfi678:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi819:			; NoVLX-NEXT: .Lcfi679:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtq (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 29 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtq %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtq %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v2i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v2i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi820:			; NoVLX-NEXT: .Lcfi680:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi821:			; NoVLX-NEXT: .Lcfi681:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi822:			; NoVLX-NEXT: .Lcfi682:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
				; NoVLX-NEXT: vpand %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 27 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtq (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtq (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v2i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v2i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi823:			; NoVLX-NEXT: .Lcfi683:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi824:			; NoVLX-NEXT: .Lcfi684:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi825:			; NoVLX-NEXT: .Lcfi685:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtq (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpgtq (%rdi){1to2}, %xmm0, %k0			; VLX-NEXT: vpcmpgtq (%rdi){1to2}, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgtq_v2i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi826:			; NoVLX-NEXT: .Lcfi686:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi827:			; NoVLX-NEXT: .Lcfi687:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi828:			; NoVLX-NEXT: .Lcfi688:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 31 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpgtq (%rsi){1to2}, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtq (%rsi){1to2}, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v2i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v2i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi829:			; NoVLX-NEXT: .Lcfi689:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi830:			; NoVLX-NEXT: .Lcfi690:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi831:			; NoVLX-NEXT: .Lcfi691:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
				; NoVLX-NEXT: vpand %xmm0, %xmm2, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 34 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v8i1_mask:			; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	Show All 39 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v8i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v8i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtq (%rdi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq (%rdi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v8i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v8i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v8i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtq (%rsi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq (%rsi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v8i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v8i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v8i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v8i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v16i1_mask:			; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 38 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v16i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v16i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtq (%rdi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq (%rdi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 40 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v16i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v16i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v16i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtq (%rsi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq (%rsi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v16i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v16i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v16i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v16i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 40 Lines
	; VLX-NEXT: vpcmpgtq %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpgtq %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi832:			; NoVLX-NEXT: .Lcfi692:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi833:			; NoVLX-NEXT: .Lcfi693:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi834:			; NoVLX-NEXT: .Lcfi694:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	Show All 23 Lines
	; VLX-NEXT: vpcmpgtq (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpgtq (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi835:			; NoVLX-NEXT: .Lcfi695:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi836:			; NoVLX-NEXT: .Lcfi696:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi837:			; NoVLX-NEXT: .Lcfi697:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtq (%rdi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq (%rdi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	Show All 25 Lines
	; VLX-NEXT: vpcmpgtq %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtq %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi838:			; NoVLX-NEXT: .Lcfi698:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi839:			; NoVLX-NEXT: .Lcfi699:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi840:			; NoVLX-NEXT: .Lcfi700:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 24 Lines
	; VLX-NEXT: vpcmpgtq (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtq (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi841:			; NoVLX-NEXT: .Lcfi701:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi842:			; NoVLX-NEXT: .Lcfi702:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi843:			; NoVLX-NEXT: .Lcfi703:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtq (%rsi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq (%rsi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 25 Lines
	; VLX-NEXT: vpcmpgtq (%rdi){1to4}, %ymm0, %k0			; VLX-NEXT: vpcmpgtq (%rdi){1to4}, %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi844:			; NoVLX-NEXT: .Lcfi704:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi845:			; NoVLX-NEXT: .Lcfi705:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi846:			; NoVLX-NEXT: .Lcfi706:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	Show All 27 Lines
	; VLX-NEXT: vpcmpgtq (%rsi){1to4}, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtq (%rsi){1to4}, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi847:			; NoVLX-NEXT: .Lcfi707:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi848:			; NoVLX-NEXT: .Lcfi708:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi849:			; NoVLX-NEXT: .Lcfi709:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 26 Lines
	; VLX-NEXT: vpcmpgtq %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpgtq %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi850:			; NoVLX-NEXT: .Lcfi710:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi851:			; NoVLX-NEXT: .Lcfi711:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi852:			; NoVLX-NEXT: .Lcfi712:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 29 Lines
	; VLX-NEXT: vpcmpgtq (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpgtq (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi853:			; NoVLX-NEXT: .Lcfi713:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi854:			; NoVLX-NEXT: .Lcfi714:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi855:			; NoVLX-NEXT: .Lcfi715:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtq (%rdi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq (%rdi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 31 Lines
	; VLX-NEXT: vpcmpgtq %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtq %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi856:			; NoVLX-NEXT: .Lcfi716:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi857:			; NoVLX-NEXT: .Lcfi717:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi858:			; NoVLX-NEXT: .Lcfi718:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
				; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 29 Lines
	; VLX-NEXT: vpcmpgtq (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtq (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi859:			; NoVLX-NEXT: .Lcfi719:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi860:			; NoVLX-NEXT: .Lcfi720:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi861:			; NoVLX-NEXT: .Lcfi721:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtq (%rsi), %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq (%rsi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
				; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 30 Lines
	; VLX-NEXT: vpcmpgtq (%rdi){1to4}, %ymm0, %k0			; VLX-NEXT: vpcmpgtq (%rdi){1to4}, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgtq_v4i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi862:			; NoVLX-NEXT: .Lcfi722:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi863:			; NoVLX-NEXT: .Lcfi723:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi864:			; NoVLX-NEXT: .Lcfi724:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 33 Lines
	; VLX-NEXT: vpcmpgtq (%rsi){1to4}, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtq (%rsi){1to4}, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v4i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi865:			; NoVLX-NEXT: .Lcfi725:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi866:			; NoVLX-NEXT: .Lcfi726:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi867:			; NoVLX-NEXT: .Lcfi727:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
				; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	▲ Show 20 Lines • Show All 195 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpgtq %zmm1, %zmm0, %k0			; VLX-NEXT: vpcmpgtq %zmm1, %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v8i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpsgtq_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi868:			; NoVLX-NEXT: .Lcfi728:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi869:			; NoVLX-NEXT: .Lcfi729:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi870:			; NoVLX-NEXT: .Lcfi730:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtq %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpgtq %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 14 Lines
	; VLX-NEXT: vpcmpgtq (%rdi), %zmm0, %k0			; VLX-NEXT: vpcmpgtq (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtq_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi871:			; NoVLX-NEXT: .Lcfi731:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi872:			; NoVLX-NEXT: .Lcfi732:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi873:			; NoVLX-NEXT: .Lcfi733:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtq (%rdi), %zmm0, %k0			; NoVLX-NEXT: vpcmpgtq (%rdi), %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 16 Lines
	; VLX-NEXT: vpcmpgtq %zmm1, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtq %zmm1, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v8i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi874:			; NoVLX-NEXT: .Lcfi734:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi875:			; NoVLX-NEXT: .Lcfi735:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi876:			; NoVLX-NEXT: .Lcfi736:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpgtq %zmm1, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpgtq %zmm1, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX-NEXT: vpcmpgtq (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtq (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi877:			; NoVLX-NEXT: .Lcfi737:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi878:			; NoVLX-NEXT: .Lcfi738:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi879:			; NoVLX-NEXT: .Lcfi739:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpgtq (%rsi), %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpgtq (%rsi), %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 18 Lines
	; VLX-NEXT: vpcmpgtq (%rdi){1to8}, %zmm0, %k0			; VLX-NEXT: vpcmpgtq (%rdi){1to8}, %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v8i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgtq_v8i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi880:			; NoVLX-NEXT: .Lcfi740:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi881:			; NoVLX-NEXT: .Lcfi741:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi882:			; NoVLX-NEXT: .Lcfi742:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtq (%rdi){1to8}, %zmm0, %k0			; NoVLX-NEXT: vpcmpgtq (%rdi){1to8}, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX-NEXT: vpcmpgtq (%rsi){1to8}, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtq (%rsi){1to8}, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v8i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v8i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi883:			; NoVLX-NEXT: .Lcfi743:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi884:			; NoVLX-NEXT: .Lcfi744:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi885:			; NoVLX-NEXT: .Lcfi745:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpgtq (%rsi){1to8}, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpgtq (%rsi){1to8}, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 19 Lines
	; VLX-NEXT: vpcmpgtq %zmm1, %zmm0, %k0			; VLX-NEXT: vpcmpgtq %zmm1, %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v8i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsgtq_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi886:			; NoVLX-NEXT: .Lcfi746:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi887:			; NoVLX-NEXT: .Lcfi747:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi888:			; NoVLX-NEXT: .Lcfi748:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtq %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpgtq %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpgtq (%rdi), %zmm0, %k0			; VLX-NEXT: vpcmpgtq (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgtq_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi889:			; NoVLX-NEXT: .Lcfi749:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi890:			; NoVLX-NEXT: .Lcfi750:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi891:			; NoVLX-NEXT: .Lcfi751:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtq (%rdi), %zmm0, %k0			; NoVLX-NEXT: vpcmpgtq (%rdi), %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpgtq %zmm1, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtq %zmm1, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v8i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi892:			; NoVLX-NEXT: .Lcfi752:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi893:			; NoVLX-NEXT: .Lcfi753:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi894:			; NoVLX-NEXT: .Lcfi754:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpgtq %zmm1, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpgtq %zmm1, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpgtq (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtq (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi895:			; NoVLX-NEXT: .Lcfi755:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi896:			; NoVLX-NEXT: .Lcfi756:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi897:			; NoVLX-NEXT: .Lcfi757:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpgtq (%rsi), %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpgtq (%rsi), %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpgtq (%rdi){1to8}, %zmm0, %k0			; VLX-NEXT: vpcmpgtq (%rdi){1to8}, %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgtq_v8i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgtq_v8i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi898:			; NoVLX-NEXT: .Lcfi758:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi899:			; NoVLX-NEXT: .Lcfi759:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi900:			; NoVLX-NEXT: .Lcfi760:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtq (%rdi){1to8}, %zmm0, %k0			; NoVLX-NEXT: vpcmpgtq (%rdi){1to8}, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpgtq (%rsi){1to8}, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpgtq (%rsi){1to8}, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgtq_v8i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgtq_v8i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi901:			; NoVLX-NEXT: .Lcfi761:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi902:			; NoVLX-NEXT: .Lcfi762:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi903:			; NoVLX-NEXT: .Lcfi763:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpgtq (%rsi){1to8}, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpgtq (%rsi){1to8}, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpleb %xmm0, %xmm1, %k0			; VLX-NEXT: vpcmpleb %xmm0, %xmm1, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeb_v16i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpsgeb_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi904:			; NoVLX-NEXT: .Lcfi764:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi905:			; NoVLX-NEXT: .Lcfi765:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi906:			; NoVLX-NEXT: .Lcfi766:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi907:			; NoVLX-NEXT: .Lcfi767:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi908:			; NoVLX-NEXT: .Lcfi768:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi909:			; NoVLX-NEXT: .Lcfi769:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi910:			; NoVLX-NEXT: .Lcfi770:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi911:			; NoVLX-NEXT: .Lcfi771:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 18 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpnltb (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpnltb (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeb_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgeb_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi912:			; NoVLX-NEXT: .Lcfi772:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi913:			; NoVLX-NEXT: .Lcfi773:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi914:			; NoVLX-NEXT: .Lcfi774:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi915:			; NoVLX-NEXT: .Lcfi775:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi916:			; NoVLX-NEXT: .Lcfi776:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi917:			; NoVLX-NEXT: .Lcfi777:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi918:			; NoVLX-NEXT: .Lcfi778:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi919:			; NoVLX-NEXT: .Lcfi779:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa (%rdi), %xmm1			; NoVLX-NEXT: vmovdqa (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 20 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpleb %xmm0, %xmm1, %k0 {%k1}			; VLX-NEXT: vpcmpleb %xmm0, %xmm1, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeb_v16i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgeb_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi920:			; NoVLX-NEXT: .Lcfi780:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi921:			; NoVLX-NEXT: .Lcfi781:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi922:			; NoVLX-NEXT: .Lcfi782:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi923:			; NoVLX-NEXT: .Lcfi783:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi924:			; NoVLX-NEXT: .Lcfi784:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi925:			; NoVLX-NEXT: .Lcfi785:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi926:			; NoVLX-NEXT: .Lcfi786:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi927:			; NoVLX-NEXT: .Lcfi787:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 21 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpnltb (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltb (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeb_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgeb_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi928:			; NoVLX-NEXT: .Lcfi788:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi929:			; NoVLX-NEXT: .Lcfi789:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi930:			; NoVLX-NEXT: .Lcfi790:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi931:			; NoVLX-NEXT: .Lcfi791:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi932:			; NoVLX-NEXT: .Lcfi792:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi933:			; NoVLX-NEXT: .Lcfi793:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi934:			; NoVLX-NEXT: .Lcfi794:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi935:			; NoVLX-NEXT: .Lcfi795:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa (%rsi), %xmm1			; NoVLX-NEXT: vmovdqa (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 22 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpleb %xmm0, %xmm1, %k0			; VLX-NEXT: vpcmpleb %xmm0, %xmm1, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeb_v16i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsgeb_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi936:			; NoVLX-NEXT: .Lcfi796:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi937:			; NoVLX-NEXT: .Lcfi797:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi938:			; NoVLX-NEXT: .Lcfi798:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi939:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi940:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi941:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi942:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi943:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <16 x i8>			%0 = bitcast <2 x i64> %__a to <16 x i8>
	%1 = bitcast <2 x i64> %__b to <16 x i8>			%1 = bitcast <2 x i64> %__b to <16 x i8>
	%2 = icmp sge <16 x i8> %0, %1			%2 = icmp sge <16 x i8> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_vpcmpsgeb_v16i1_v64i1_mask_mem(<2 x i64> %__a, <2 x i64>* %__b) local_unnamed_addr {			define zeroext i64 @test_vpcmpsgeb_v16i1_v64i1_mask_mem(<2 x i64> %__a, <2 x i64>* %__b) local_unnamed_addr {
	; VLX-LABEL: test_vpcmpsgeb_v16i1_v64i1_mask_mem:			; VLX-LABEL: test_vpcmpsgeb_v16i1_v64i1_mask_mem:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpnltb (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpnltb (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeb_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgeb_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi944:			; NoVLX-NEXT: .Lcfi799:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi945:			; NoVLX-NEXT: .Lcfi800:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi946:			; NoVLX-NEXT: .Lcfi801:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi947:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi948:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi949:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi950:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi951:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa (%rdi), %xmm1			; NoVLX-NEXT: vmovdqa (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <16 x i8>			%0 = bitcast <2 x i64> %__a to <16 x i8>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	%1 = bitcast <2 x i64> %load to <16 x i8>			%1 = bitcast <2 x i64> %load to <16 x i8>
	%2 = icmp sge <16 x i8> %0, %1			%2 = icmp sge <16 x i8> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_masked_vpcmpsgeb_v16i1_v64i1_mask(i16 zeroext %__u, <2 x i64> %__a, <2 x i64> %__b) local_unnamed_addr {			define zeroext i64 @test_masked_vpcmpsgeb_v16i1_v64i1_mask(i16 zeroext %__u, <2 x i64> %__a, <2 x i64> %__b) local_unnamed_addr {
	; VLX-LABEL: test_masked_vpcmpsgeb_v16i1_v64i1_mask:			; VLX-LABEL: test_masked_vpcmpsgeb_v16i1_v64i1_mask:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpleb %xmm0, %xmm1, %k0 {%k1}			; VLX-NEXT: vpcmpleb %xmm0, %xmm1, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeb_v16i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgeb_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi952:			; NoVLX-NEXT: .Lcfi802:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi953:			; NoVLX-NEXT: .Lcfi803:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi954:			; NoVLX-NEXT: .Lcfi804:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi955:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi956:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi957:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi958:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi959:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <16 x i8>			%0 = bitcast <2 x i64> %__a to <16 x i8>
	%1 = bitcast <2 x i64> %__b to <16 x i8>			%1 = bitcast <2 x i64> %__b to <16 x i8>
	%2 = icmp sge <16 x i8> %0, %1			%2 = icmp sge <16 x i8> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	%4 = and <16 x i1> %2, %3			%4 = and <16 x i1> %2, %3
	%5 = shufflevector <16 x i1> %4, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%5 = shufflevector <16 x i1> %4, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%6 = bitcast <64 x i1> %5 to i64			%6 = bitcast <64 x i1> %5 to i64
	ret i64 %6			ret i64 %6
	}			}

	define zeroext i64 @test_masked_vpcmpsgeb_v16i1_v64i1_mask_mem(i16 zeroext %__u, <2 x i64> %__a, <2 x i64>* %__b) local_unnamed_addr {			define zeroext i64 @test_masked_vpcmpsgeb_v16i1_v64i1_mask_mem(i16 zeroext %__u, <2 x i64> %__a, <2 x i64>* %__b) local_unnamed_addr {
	; VLX-LABEL: test_masked_vpcmpsgeb_v16i1_v64i1_mask_mem:			; VLX-LABEL: test_masked_vpcmpsgeb_v16i1_v64i1_mask_mem:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpnltb (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltb (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeb_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgeb_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi960:			; NoVLX-NEXT: .Lcfi805:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi961:			; NoVLX-NEXT: .Lcfi806:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi962:			; NoVLX-NEXT: .Lcfi807:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi963:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi964:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi965:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi966:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi967:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa (%rsi), %xmm1			; NoVLX-NEXT: vmovdqa (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <16 x i8>			%0 = bitcast <2 x i64> %__a to <16 x i8>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	%1 = bitcast <2 x i64> %load to <16 x i8>			%1 = bitcast <2 x i64> %load to <16 x i8>
	%2 = icmp sge <16 x i8> %0, %1			%2 = icmp sge <16 x i8> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	Show All 10 Lines
	; VLX-NEXT: vpcmpleb %ymm0, %ymm1, %k0			; VLX-NEXT: vpcmpleb %ymm0, %ymm1, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeb_v32i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsgeb_v32i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi968:			; NoVLX-NEXT: .Lcfi808:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi969:			; NoVLX-NEXT: .Lcfi809:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi970:			; NoVLX-NEXT: .Lcfi810:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtb %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtb %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	Show All 29 Lines
	; VLX-NEXT: vpcmpnltb (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpnltb (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeb_v32i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgeb_v32i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi971:			; NoVLX-NEXT: .Lcfi811:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi972:			; NoVLX-NEXT: .Lcfi812:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi973:			; NoVLX-NEXT: .Lcfi813:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vmovdqa (%rdi), %ymm1			; NoVLX-NEXT: vmovdqa (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpgtb %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtb %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	Show All 32 Lines
	; VLX-NEXT: vpcmpleb %ymm0, %ymm1, %k0 {%k1}			; VLX-NEXT: vpcmpleb %ymm0, %ymm1, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeb_v32i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgeb_v32i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi974:			; NoVLX-NEXT: .Lcfi814:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi975:			; NoVLX-NEXT: .Lcfi815:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi976:			; NoVLX-NEXT: .Lcfi816:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vpmovdb %zmm2, %xmm2			; NoVLX-NEXT: vpmovdb %zmm2, %xmm2
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpnltb (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltb (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeb_v32i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgeb_v32i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi977:			; NoVLX-NEXT: .Lcfi817:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi978:			; NoVLX-NEXT: .Lcfi818:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi979:			; NoVLX-NEXT: .Lcfi819:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpmovdb %zmm1, %xmm1			; NoVLX-NEXT: vpmovdb %zmm1, %xmm1
	▲ Show 20 Lines • Show All 175 Lines • ▼ Show 20 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmplew %xmm0, %xmm1, %k0			; VLX-NEXT: vpcmplew %xmm0, %xmm1, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgew_v8i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpsgew_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi980:			; NoVLX-NEXT: .Lcfi820:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi981:			; NoVLX-NEXT: .Lcfi821:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi982:			; NoVLX-NEXT: .Lcfi822:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 13 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpnltw (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpnltw (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgew_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgew_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi983:			; NoVLX-NEXT: .Lcfi823:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi984:			; NoVLX-NEXT: .Lcfi824:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi985:			; NoVLX-NEXT: .Lcfi825:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vmovdqa (%rdi), %xmm1			; NoVLX-NEXT: vmovdqa (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 15 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmplew %xmm0, %xmm1, %k0 {%k1}			; VLX-NEXT: vpcmplew %xmm0, %xmm1, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgew_v8i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgew_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi986:			; NoVLX-NEXT: .Lcfi826:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi987:			; NoVLX-NEXT: .Lcfi827:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi988:			; NoVLX-NEXT: .Lcfi828:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 16 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpnltw (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltw (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgew_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgew_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi989:			; NoVLX-NEXT: .Lcfi829:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi990:			; NoVLX-NEXT: .Lcfi830:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi991:			; NoVLX-NEXT: .Lcfi831:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vmovdqa (%rsi), %xmm1			; NoVLX-NEXT: vmovdqa (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmplew %xmm0, %xmm1, %k0			; VLX-NEXT: vpcmplew %xmm0, %xmm1, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgew_v8i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsgew_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi992:			; NoVLX-NEXT: .Lcfi832:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi993:			; NoVLX-NEXT: .Lcfi833:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi994:			; NoVLX-NEXT: .Lcfi834:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpnltw (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpnltw (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgew_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgew_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi995:			; NoVLX-NEXT: .Lcfi835:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi996:			; NoVLX-NEXT: .Lcfi836:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi997:			; NoVLX-NEXT: .Lcfi837:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vmovdqa (%rdi), %xmm1			; NoVLX-NEXT: vmovdqa (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmplew %xmm0, %xmm1, %k0 {%k1}			; VLX-NEXT: vpcmplew %xmm0, %xmm1, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgew_v8i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgew_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi998:			; NoVLX-NEXT: .Lcfi838:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi999:			; NoVLX-NEXT: .Lcfi839:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1000:			; NoVLX-NEXT: .Lcfi840:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpnltw (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltw (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgew_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgew_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1001:			; NoVLX-NEXT: .Lcfi841:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1002:			; NoVLX-NEXT: .Lcfi842:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1003:			; NoVLX-NEXT: .Lcfi843:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vmovdqa (%rsi), %xmm1			; NoVLX-NEXT: vmovdqa (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmplew %ymm0, %ymm1, %k0			; VLX-NEXT: vpcmplew %ymm0, %ymm1, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgew_v16i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpsgew_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1004:			; NoVLX-NEXT: .Lcfi844:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1005:			; NoVLX-NEXT: .Lcfi845:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1006:			; NoVLX-NEXT: .Lcfi846:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1007:			; NoVLX-NEXT: .Lcfi847:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1008:			; NoVLX-NEXT: .Lcfi848:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1009:			; NoVLX-NEXT: .Lcfi849:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1010:			; NoVLX-NEXT: .Lcfi850:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1011:			; NoVLX-NEXT: .Lcfi851:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 19 Lines
	; VLX-NEXT: vpcmpnltw (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpnltw (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgew_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgew_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1012:			; NoVLX-NEXT: .Lcfi852:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1013:			; NoVLX-NEXT: .Lcfi853:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1014:			; NoVLX-NEXT: .Lcfi854:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1015:			; NoVLX-NEXT: .Lcfi855:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1016:			; NoVLX-NEXT: .Lcfi856:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1017:			; NoVLX-NEXT: .Lcfi857:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1018:			; NoVLX-NEXT: .Lcfi858:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1019:			; NoVLX-NEXT: .Lcfi859:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa (%rdi), %ymm1			; NoVLX-NEXT: vmovdqa (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 21 Lines
	; VLX-NEXT: vpcmplew %ymm0, %ymm1, %k0 {%k1}			; VLX-NEXT: vpcmplew %ymm0, %ymm1, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgew_v16i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgew_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1020:			; NoVLX-NEXT: .Lcfi860:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1021:			; NoVLX-NEXT: .Lcfi861:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1022:			; NoVLX-NEXT: .Lcfi862:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1023:			; NoVLX-NEXT: .Lcfi863:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1024:			; NoVLX-NEXT: .Lcfi864:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1025:			; NoVLX-NEXT: .Lcfi865:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1026:			; NoVLX-NEXT: .Lcfi866:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1027:			; NoVLX-NEXT: .Lcfi867:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 22 Lines
	; VLX-NEXT: vpcmpnltw (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltw (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgew_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgew_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1028:			; NoVLX-NEXT: .Lcfi868:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1029:			; NoVLX-NEXT: .Lcfi869:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1030:			; NoVLX-NEXT: .Lcfi870:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1031:			; NoVLX-NEXT: .Lcfi871:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1032:			; NoVLX-NEXT: .Lcfi872:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1033:			; NoVLX-NEXT: .Lcfi873:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1034:			; NoVLX-NEXT: .Lcfi874:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1035:			; NoVLX-NEXT: .Lcfi875:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa (%rsi), %ymm1			; NoVLX-NEXT: vmovdqa (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 23 Lines
	; VLX-NEXT: vpcmplew %ymm0, %ymm1, %k0			; VLX-NEXT: vpcmplew %ymm0, %ymm1, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgew_v16i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsgew_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1036:			; NoVLX-NEXT: .Lcfi876:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1037:			; NoVLX-NEXT: .Lcfi877:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1038:			; NoVLX-NEXT: .Lcfi878:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1039:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1040:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1041:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1042:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1043:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <4 x i64> %__a to <16 x i16>			%0 = bitcast <4 x i64> %__a to <16 x i16>
	%1 = bitcast <4 x i64> %__b to <16 x i16>			%1 = bitcast <4 x i64> %__b to <16 x i16>
	%2 = icmp sge <16 x i16> %0, %1			%2 = icmp sge <16 x i16> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_vpcmpsgew_v16i1_v64i1_mask_mem(<4 x i64> %__a, <4 x i64>* %__b) local_unnamed_addr {			define zeroext i64 @test_vpcmpsgew_v16i1_v64i1_mask_mem(<4 x i64> %__a, <4 x i64>* %__b) local_unnamed_addr {
	; VLX-LABEL: test_vpcmpsgew_v16i1_v64i1_mask_mem:			; VLX-LABEL: test_vpcmpsgew_v16i1_v64i1_mask_mem:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpnltw (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpnltw (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgew_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgew_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1044:			; NoVLX-NEXT: .Lcfi879:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1045:			; NoVLX-NEXT: .Lcfi880:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1046:			; NoVLX-NEXT: .Lcfi881:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1047:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1048:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1049:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1050:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1051:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa (%rdi), %ymm1			; NoVLX-NEXT: vmovdqa (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <4 x i64> %__a to <16 x i16>			%0 = bitcast <4 x i64> %__a to <16 x i16>
	%load = load <4 x i64>, <4 x i64>* %__b			%load = load <4 x i64>, <4 x i64>* %__b
	%1 = bitcast <4 x i64> %load to <16 x i16>			%1 = bitcast <4 x i64> %load to <16 x i16>
	%2 = icmp sge <16 x i16> %0, %1			%2 = icmp sge <16 x i16> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_masked_vpcmpsgew_v16i1_v64i1_mask(i16 zeroext %__u, <4 x i64> %__a, <4 x i64> %__b) local_unnamed_addr {			define zeroext i64 @test_masked_vpcmpsgew_v16i1_v64i1_mask(i16 zeroext %__u, <4 x i64> %__a, <4 x i64> %__b) local_unnamed_addr {
	; VLX-LABEL: test_masked_vpcmpsgew_v16i1_v64i1_mask:			; VLX-LABEL: test_masked_vpcmpsgew_v16i1_v64i1_mask:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmplew %ymm0, %ymm1, %k0 {%k1}			; VLX-NEXT: vpcmplew %ymm0, %ymm1, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgew_v16i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgew_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1052:			; NoVLX-NEXT: .Lcfi882:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1053:			; NoVLX-NEXT: .Lcfi883:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1054:			; NoVLX-NEXT: .Lcfi884:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1055:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1056:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1057:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1058:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1059:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <4 x i64> %__a to <16 x i16>			%0 = bitcast <4 x i64> %__a to <16 x i16>
	%1 = bitcast <4 x i64> %__b to <16 x i16>			%1 = bitcast <4 x i64> %__b to <16 x i16>
	%2 = icmp sge <16 x i16> %0, %1			%2 = icmp sge <16 x i16> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	%4 = and <16 x i1> %2, %3			%4 = and <16 x i1> %2, %3
	Show All 9 Lines
	; VLX-NEXT: vpcmpnltw (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltw (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgew_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgew_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1060:			; NoVLX-NEXT: .Lcfi885:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1061:			; NoVLX-NEXT: .Lcfi886:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1062:			; NoVLX-NEXT: .Lcfi887:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1063:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1064:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1065:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1066:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1067:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa (%rsi), %ymm1			; NoVLX-NEXT: vmovdqa (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <4 x i64> %__a to <16 x i16>			%0 = bitcast <4 x i64> %__a to <16 x i16>
	%load = load <4 x i64>, <4 x i64>* %__b			%load = load <4 x i64>, <4 x i64>* %__b
	%1 = bitcast <4 x i64> %load to <16 x i16>			%1 = bitcast <4 x i64> %load to <16 x i16>
	%2 = icmp sge <16 x i16> %0, %1			%2 = icmp sge <16 x i16> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	Show All 10 Lines
	; VLX-NEXT: vpcmplew %zmm0, %zmm1, %k0			; VLX-NEXT: vpcmplew %zmm0, %zmm1, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgew_v32i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsgew_v32i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1068:			; NoVLX-NEXT: .Lcfi888:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1069:			; NoVLX-NEXT: .Lcfi889:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1070:			; NoVLX-NEXT: .Lcfi890:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm3			; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm2
	; NoVLX-NEXT: vmovq %xmm3, %rax			; NoVLX-NEXT: vmovq %xmm2, %rax
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: movq %rax, %rdx			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: vmovd %eax, %xmm2			; NoVLX-NEXT: vmovd %eax, %xmm3
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm5			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vextracti32x4 $2, %zmm1, %xmm8
	; NoVLX-NEXT: vextracti32x4 $3, %zmm1, %xmm4
	; NoVLX-NEXT: vextracti32x4 $1, %zmm1, %xmm6
	; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm7
	; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm2
	; NoVLX-NEXT: shrq $32, %rdx			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %edx, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm3, %xmm3
	; NoVLX-NEXT: vpextrq $1, %xmm3, %rax			; NoVLX-NEXT: vpextrq $1, %xmm2, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vmovq %xmm0, %rcx			; NoVLX-NEXT: vmovq %xmm0, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm5			; NoVLX-NEXT: vmovd %ecx, %xmm3
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpextrq $1, %xmm0, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm0			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: vmovq %xmm2, %rcx			; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm4
				; NoVLX-NEXT: vmovq %xmm4, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm5			; NoVLX-NEXT: vmovd %ecx, %xmm5
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: vpextrq $1, %xmm2, %rax			; NoVLX-NEXT: vpextrq $1, %xmm4, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm4
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm4, %xmm4
	; NoVLX-NEXT: vmovq %xmm7, %rcx			; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm0
				; NoVLX-NEXT: vmovq %xmm0, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm5			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm5
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: vpextrq $1, %xmm7, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: vextracti32x4 $1, %zmm1, %xmm6
	; NoVLX-NEXT: vmovq %xmm6, %rcx			; NoVLX-NEXT: vmovq %xmm6, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm7			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm5
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm0
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrq $1, %xmm6, %rax			; NoVLX-NEXT: vpextrq $1, %xmm6, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vmovq %xmm1, %rcx			; NoVLX-NEXT: vmovq %xmm1, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm6			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm6
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm0
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrq $1, %xmm1, %rax			; NoVLX-NEXT: vpextrq $1, %xmm1, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm1			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vmovq %xmm4, %rcx			; NoVLX-NEXT: vextracti32x4 $3, %zmm1, %xmm7
				; NoVLX-NEXT: vmovq %xmm7, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm8
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm0
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrq $1, %xmm4, %rax			; NoVLX-NEXT: vpextrq $1, %xmm7, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
				; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vmovq %xmm8, %rcx			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm7
				; NoVLX-NEXT: vextracti32x4 $2, %zmm1, %xmm0
				; NoVLX-NEXT: vmovq %xmm0, %rax
				; NoVLX-NEXT: movl %eax, %ecx
				; NoVLX-NEXT: shrl $16, %ecx
				; NoVLX-NEXT: vmovd %eax, %xmm1
				; NoVLX-NEXT: vpinsrw $1, %ecx, %xmm1, %xmm1
				; NoVLX-NEXT: movq %rax, %rcx
				; NoVLX-NEXT: shrq $32, %rcx
				; NoVLX-NEXT: vpinsrw $2, %ecx, %xmm1, %xmm1
				; NoVLX-NEXT: vpextrq $1, %xmm0, %rcx
				; NoVLX-NEXT: vinserti128 $1, %xmm2, %ymm3, %ymm0
				; NoVLX-NEXT: vinserti128 $1, %xmm4, %ymm5, %ymm3
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $3, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm4			; NoVLX-NEXT: vpinsrw $4, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $5, %eax, %xmm1, %xmm1
				; NoVLX-NEXT: vinserti128 $1, %xmm6, %ymm8, %ymm2
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $6, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpextrq $1, %xmm8, %rax
	; NoVLX-NEXT: vinserti128 $1, %xmm3, %ymm0, %ymm0
	; NoVLX-NEXT: vinserti128 $1, %xmm5, %ymm7, %ymm3
	; NoVLX-NEXT: vinserti128 $1, %xmm6, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm1			; NoVLX-NEXT: vpinsrw $7, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: vinserti128 $1, %xmm7, %ymm1, %ymm1
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: vpcmpgtw %ymm3, %ymm1, %ymm3
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vinserti128 $1, %xmm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtw %ymm3, %ymm1, %ymm2
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm2, %ymm2			; NoVLX-NEXT: vpxor %ymm1, %ymm3, %ymm3
	; NoVLX-NEXT: vpmovsxwd %ymm2, %zmm2			; NoVLX-NEXT: vpmovsxwd %ymm3, %zmm3
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2			; NoVLX-NEXT: vpslld $31, %zmm3, %zmm3
	; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0			; NoVLX-NEXT: vptestmd %zmm3, %zmm3, %k0
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm3
	; NoVLX-NEXT: vpinsrb $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $1, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $2, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $3, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $3, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $6, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $6, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $9, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $9, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $10, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $10, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $13, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $14, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $14, %eax, %xmm3, %xmm3
				; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm2, %ymm2
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm3, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm2, %zmm2			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2
	; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vpxor %ymm1, %ymm2, %ymm1
				; NoVLX-NEXT: vpmovsxwd %ymm1, %zmm1
				; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
				; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm0			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $1, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $2, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $3, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $10, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $14, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %eax, %xmm1, %xmm1
				; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm1, %xmm0
				; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %ecx			; NoVLX-NEXT: movl (%rsp), %ecx
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 18 Lines
	; VLX-NEXT: vpcmpnltw (%rdi), %zmm0, %k0			; VLX-NEXT: vpcmpnltw (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgew_v32i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgew_v32i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1071:			; NoVLX-NEXT: .Lcfi891:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1072:			; NoVLX-NEXT: .Lcfi892:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1073:			; NoVLX-NEXT: .Lcfi893:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm2			; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm1
	; NoVLX-NEXT: vmovq %xmm2, %rax			; NoVLX-NEXT: vmovq %xmm1, %rax
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: movq %rax, %rdx			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: vmovd %eax, %xmm1			; NoVLX-NEXT: vmovd %eax, %xmm2
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm1, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm1
	; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm4
	; NoVLX-NEXT: shrq $32, %rdx			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %edx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm2, %rax			; NoVLX-NEXT: vpextrq $1, %xmm1, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm1
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: vmovq %xmm0, %rcx			; NoVLX-NEXT: vmovq %xmm0, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm0, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm0			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vmovq %xmm4, %rcx			; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm3
				; NoVLX-NEXT: vmovq %xmm3, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm4
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vpextrq $1, %xmm4, %rax			; NoVLX-NEXT: vpextrq $1, %xmm3, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm3
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: vmovq %xmm1, %rcx			; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm0
				; NoVLX-NEXT: vmovq %xmm0, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm4			; NoVLX-NEXT: vmovd %ecx, %xmm4
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vpextrq $1, %xmm1, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm1			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vinserti128 $1, %xmm3, %ymm1, %ymm1			; NoVLX-NEXT: vinserti128 $1, %xmm1, %ymm2, %ymm1
				; NoVLX-NEXT: vinserti128 $1, %xmm3, %ymm0, %ymm0
	; NoVLX-NEXT: vmovdqa (%rdi), %ymm2			; NoVLX-NEXT: vmovdqa (%rdi), %ymm2
	; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm2, %ymm0			; NoVLX-NEXT: vmovdqa 32(%rdi), %ymm3
	; NoVLX-NEXT: vmovdqa 32(%rdi), %ymm2			; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm3, %ymm3
	; NoVLX-NEXT: vpcmpgtw %ymm1, %ymm2, %ymm2			; NoVLX-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm0, %ymm3, %ymm3
	; NoVLX-NEXT: vpxor %ymm1, %ymm2, %ymm2			; NoVLX-NEXT: vpmovsxwd %ymm3, %zmm3
	; NoVLX-NEXT: vpmovsxwd %ymm2, %zmm2			; NoVLX-NEXT: vpslld $31, %zmm3, %zmm3
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2			; NoVLX-NEXT: vptestmd %zmm3, %zmm3, %k0
	; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm3
	; NoVLX-NEXT: vpinsrb $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $1, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $2, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $3, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $3, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $6, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $6, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $9, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $9, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $10, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $10, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $13, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $14, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $14, %eax, %xmm3, %xmm3
				; NoVLX-NEXT: vpcmpgtw %ymm1, %ymm2, %ymm2
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm3, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm2, %zmm2			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0			; NoVLX-NEXT: vpxor %ymm0, %ymm2, %ymm0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $14, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k1
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %ecx			; NoVLX-NEXT: movl (%rsp), %ecx
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 20 Lines
	; VLX-NEXT: vpcmplew %zmm0, %zmm1, %k0 {%k1}			; VLX-NEXT: vpcmplew %zmm0, %zmm1, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgew_v32i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgew_v32i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1074:			; NoVLX-NEXT: .Lcfi894:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1075:			; NoVLX-NEXT: .Lcfi895:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1076:			; NoVLX-NEXT: .Lcfi896:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm2			; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm2
	; NoVLX-NEXT: vmovq %xmm2, %rax			; NoVLX-NEXT: vmovq %xmm2, %rax
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: movq %rax, %rdx			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: vmovd %eax, %xmm3			; NoVLX-NEXT: vmovd %eax, %xmm3
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm4			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vextracti32x4 $1, %zmm1, %xmm8
	; NoVLX-NEXT: vextracti32x4 $2, %zmm1, %xmm5
	; NoVLX-NEXT: vextracti32x4 $3, %zmm1, %xmm7
	; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm6
	; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm3
	; NoVLX-NEXT: shrq $32, %rdx			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %edx, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm3, %xmm3
	; NoVLX-NEXT: vpextrq $1, %xmm2, %rax			; NoVLX-NEXT: vpextrq $1, %xmm2, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
				; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm3
	; NoVLX-NEXT: vmovq %xmm3, %rcx			; NoVLX-NEXT: vmovq %xmm3, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm9			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm8
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm4			; NoVLX-NEXT: vmovd %ecx, %xmm4
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vpextrq $1, %xmm3, %rax			; NoVLX-NEXT: vpextrq $1, %xmm3, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm3
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: vmovq %xmm6, %rcx			; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm4
				; NoVLX-NEXT: vmovq %xmm4, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm4			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm5
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: vpextrq $1, %xmm6, %rax			; NoVLX-NEXT: vpextrq $1, %xmm4, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm4
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm4, %xmm4
	; NoVLX-NEXT: vmovq %xmm0, %rcx			; NoVLX-NEXT: vmovq %xmm0, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm6			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm5
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: vpextrq $1, %xmm0, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm0			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vmovq %xmm7, %rcx			; NoVLX-NEXT: vextracti32x4 $3, %zmm1, %xmm5
	; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpextrq $1, %xmm7, %rax
	; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: vmovq %xmm5, %rcx			; NoVLX-NEXT: vmovq %xmm5, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm7			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm6
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm6, %xmm6
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm6, %xmm6
	; NoVLX-NEXT: vpextrq $1, %xmm5, %rax			; NoVLX-NEXT: vpextrq $1, %xmm5, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm6, %xmm5
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm5, %xmm5
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm5, %xmm5
	; NoVLX-NEXT: vmovq %xmm8, %rcx			; NoVLX-NEXT: vextracti32x4 $2, %zmm1, %xmm6
				; NoVLX-NEXT: vmovq %xmm6, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm5			; NoVLX-NEXT: vmovd %ecx, %xmm7
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm7, %xmm7
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm7, %xmm7
	; NoVLX-NEXT: vpextrq $1, %xmm8, %rax			; NoVLX-NEXT: vpextrq $1, %xmm6, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm7, %xmm6
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm6, %xmm6
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm6, %xmm6
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm6, %xmm6
	; NoVLX-NEXT: vmovq %xmm1, %rcx			; NoVLX-NEXT: vextracti32x4 $1, %zmm1, %xmm7
				; NoVLX-NEXT: vmovq %xmm7, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm6, %xmm6
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm1, %rax			; NoVLX-NEXT: vpextrq $1, %xmm7, %rax
	; NoVLX-NEXT: vinserti128 $1, %xmm9, %ymm4, %ymm1
	; NoVLX-NEXT: vinserti128 $1, %xmm6, %ymm0, %ymm4
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2
	; NoVLX-NEXT: vinserti128 $1, %xmm7, %ymm3, %ymm3
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: vpmovdb %zmm0, %xmm0
	; NoVLX-NEXT: vpcmpgtw %ymm1, %ymm3, %ymm3
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k2} {z}
	; NoVLX-NEXT: vpmovdb %zmm1, %xmm1
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vinserti128 $1, %xmm5, %ymm2, %ymm2			; NoVLX-NEXT: vmovq %xmm1, %rax
				; NoVLX-NEXT: movl %eax, %ecx
				; NoVLX-NEXT: shrl $16, %ecx
				; NoVLX-NEXT: vmovd %eax, %xmm7
				; NoVLX-NEXT: vpinsrw $1, %ecx, %xmm7, %xmm7
				; NoVLX-NEXT: movq %rax, %rcx
				; NoVLX-NEXT: shrq $32, %rcx
				; NoVLX-NEXT: vpinsrw $2, %ecx, %xmm7, %xmm7
				; NoVLX-NEXT: vpextrq $1, %xmm1, %rcx
				; NoVLX-NEXT: vinserti128 $1, %xmm8, %ymm3, %ymm1
				; NoVLX-NEXT: vinserti128 $1, %xmm4, %ymm0, %ymm4
				; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1
				; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2
				; NoVLX-NEXT: vinserti128 $1, %xmm5, %ymm6, %ymm3
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
				; NoVLX-NEXT: vpmovdb %zmm0, %xmm0
				; NoVLX-NEXT: vpcmpgtw %ymm1, %ymm3, %ymm3
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k2} {z}
				; NoVLX-NEXT: vpmovdb %zmm1, %xmm1
				; NoVLX-NEXT: shrq $48, %rax
				; NoVLX-NEXT: vpinsrw $3, %eax, %xmm7, %xmm5
				; NoVLX-NEXT: movl %ecx, %eax
				; NoVLX-NEXT: shrl $16, %eax
				; NoVLX-NEXT: vpinsrw $4, %ecx, %xmm5, %xmm5
				; NoVLX-NEXT: vpinsrw $5, %eax, %xmm5, %xmm5
				; NoVLX-NEXT: movq %rcx, %rax
				; NoVLX-NEXT: shrq $48, %rcx
				; NoVLX-NEXT: shrq $32, %rax
				; NoVLX-NEXT: vpinsrw $6, %eax, %xmm5, %xmm5
				; NoVLX-NEXT: vpinsrw $7, %ecx, %xmm5, %xmm5
				; NoVLX-NEXT: vinserti128 $1, %xmm2, %ymm5, %ymm2
	; NoVLX-NEXT: vpcmpgtw %ymm4, %ymm2, %ymm2			; NoVLX-NEXT: vpcmpgtw %ymm4, %ymm2, %ymm2
	; NoVLX-NEXT: vpcmpeqd %ymm4, %ymm4, %ymm4			; NoVLX-NEXT: vpcmpeqd %ymm4, %ymm4, %ymm4
	; NoVLX-NEXT: vpxor %ymm4, %ymm2, %ymm2			; NoVLX-NEXT: vpxor %ymm4, %ymm2, %ymm2
	; NoVLX-NEXT: vpmovsxwd %ymm2, %zmm2			; NoVLX-NEXT: vpmovsxwd %ymm2, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2
	; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0			; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	▲ Show 20 Lines • Show All 163 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpnltw (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltw (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgew_v32i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgew_v32i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1077:			; NoVLX-NEXT: .Lcfi897:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1078:			; NoVLX-NEXT: .Lcfi898:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1079:			; NoVLX-NEXT: .Lcfi899:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm1			; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm1
	; NoVLX-NEXT: vmovq %xmm1, %rax			; NoVLX-NEXT: vmovq %xmm1, %rax
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: movq %rax, %rdx			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: vmovd %eax, %xmm2			; NoVLX-NEXT: vmovd %eax, %xmm2
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm3
	; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm4
	; NoVLX-NEXT: shrq $32, %rdx			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %edx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm1, %rax			; NoVLX-NEXT: vpextrq $1, %xmm1, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm1			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm1
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: vmovq %xmm4, %rcx			; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm2
				; NoVLX-NEXT: vmovq %xmm2, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm3
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpextrq $1, %xmm4, %rax			; NoVLX-NEXT: vpextrq $1, %xmm2, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
				; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm3
	; NoVLX-NEXT: vmovq %xmm3, %rcx			; NoVLX-NEXT: vmovq %xmm3, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm4			; NoVLX-NEXT: vmovd %ecx, %xmm4
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	▲ Show 20 Lines • Show All 221 Lines • ▼ Show 20 Lines
	;			;
	; NoVLX-LABEL: test_vpcmpsged_v4i1_v8i1_mask:			; NoVLX-LABEL: test_vpcmpsged_v4i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	Show All 40 Lines
	; NoVLX-LABEL: test_vpcmpsged_v4i1_v8i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsged_v4i1_v8i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vmovdqa (%rdi), %xmm1			; NoVLX-NEXT: vmovdqa (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	Show All 39 Lines
	; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v8i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v8i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v8i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vmovdqa (%rsi), %xmm1			; NoVLX-NEXT: vmovdqa (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX-LABEL: test_vpcmpsged_v4i1_v8i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsged_v4i1_v8i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v8i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v8i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	;			;
	; NoVLX-LABEL: test_vpcmpsged_v4i1_v16i1_mask:			; NoVLX-LABEL: test_vpcmpsged_v4i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 39 Lines
	; NoVLX-LABEL: test_vpcmpsged_v4i1_v16i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsged_v4i1_v16i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vmovdqa (%rdi), %xmm1			; NoVLX-NEXT: vmovdqa (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 38 Lines
	; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v16i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v16i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v16i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vmovdqa (%rsi), %xmm1			; NoVLX-NEXT: vmovdqa (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; NoVLX-LABEL: test_vpcmpsged_v4i1_v16i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsged_v4i1_v16i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v16i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v16i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 39 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpled %xmm0, %xmm1, %k0			; VLX-NEXT: vpcmpled %xmm0, %xmm1, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsged_v4i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpsged_v4i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1080:			; NoVLX-NEXT: .Lcfi900:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1081:			; NoVLX-NEXT: .Lcfi901:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1082:			; NoVLX-NEXT: .Lcfi902:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	Show All 23 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpnltd (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpnltd (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsged_v4i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsged_v4i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1083:			; NoVLX-NEXT: .Lcfi903:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1084:			; NoVLX-NEXT: .Lcfi904:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1085:			; NoVLX-NEXT: .Lcfi905:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vmovdqa (%rdi), %xmm1			; NoVLX-NEXT: vmovdqa (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 26 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpled %xmm0, %xmm1, %k0 {%k1}			; VLX-NEXT: vpcmpled %xmm0, %xmm1, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1086:			; NoVLX-NEXT: .Lcfi906:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1087:			; NoVLX-NEXT: .Lcfi907:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1088:			; NoVLX-NEXT: .Lcfi908:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 23 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpnltd (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltd (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1089:			; NoVLX-NEXT: .Lcfi909:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1090:			; NoVLX-NEXT: .Lcfi910:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1091:			; NoVLX-NEXT: .Lcfi911:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vmovdqa (%rsi), %xmm1			; NoVLX-NEXT: vmovdqa (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 25 Lines
	; VLX-NEXT: vpbroadcastd (%rdi), %xmm1			; VLX-NEXT: vpbroadcastd (%rdi), %xmm1
	; VLX-NEXT: vpcmpled %xmm0, %xmm1, %k0			; VLX-NEXT: vpcmpled %xmm0, %xmm1, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsged_v4i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsged_v4i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1092:			; NoVLX-NEXT: .Lcfi912:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1093:			; NoVLX-NEXT: .Lcfi913:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1094:			; NoVLX-NEXT: .Lcfi914:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 28 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpled %xmm0, %xmm1, %k0 {%k1}			; VLX-NEXT: vpcmpled %xmm0, %xmm1, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1095:			; NoVLX-NEXT: .Lcfi915:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1096:			; NoVLX-NEXT: .Lcfi916:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1097:			; NoVLX-NEXT: .Lcfi917:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 25 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpled %xmm0, %xmm1, %k0			; VLX-NEXT: vpcmpled %xmm0, %xmm1, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsged_v4i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsged_v4i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1098:			; NoVLX-NEXT: .Lcfi918:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1099:			; NoVLX-NEXT: .Lcfi919:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1100:			; NoVLX-NEXT: .Lcfi920:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 29 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpnltd (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpnltd (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsged_v4i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsged_v4i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1101:			; NoVLX-NEXT: .Lcfi921:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1102:			; NoVLX-NEXT: .Lcfi922:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1103:			; NoVLX-NEXT: .Lcfi923:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vmovdqa (%rdi), %xmm1			; NoVLX-NEXT: vmovdqa (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	Show All 32 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpled %xmm0, %xmm1, %k0 {%k1}			; VLX-NEXT: vpcmpled %xmm0, %xmm1, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1104:			; NoVLX-NEXT: .Lcfi924:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1105:			; NoVLX-NEXT: .Lcfi925:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1106:			; NoVLX-NEXT: .Lcfi926:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
				; NoVLX-NEXT: vpandn %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 27 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpnltd (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltd (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1107:			; NoVLX-NEXT: .Lcfi927:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1108:			; NoVLX-NEXT: .Lcfi928:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1109:			; NoVLX-NEXT: .Lcfi929:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vmovdqa (%rsi), %xmm1			; NoVLX-NEXT: vmovdqa (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
				; NoVLX-NEXT: vpandn %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 29 Lines
	; VLX-NEXT: vpbroadcastd (%rdi), %xmm1			; VLX-NEXT: vpbroadcastd (%rdi), %xmm1
	; VLX-NEXT: vpcmpled %xmm0, %xmm1, %k0			; VLX-NEXT: vpcmpled %xmm0, %xmm1, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsged_v4i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsged_v4i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1110:			; NoVLX-NEXT: .Lcfi930:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1111:			; NoVLX-NEXT: .Lcfi931:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1112:			; NoVLX-NEXT: .Lcfi932:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	Show All 34 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpled %xmm0, %xmm1, %k0 {%k1}			; VLX-NEXT: vpcmpled %xmm0, %xmm1, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsged_v4i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1113:			; NoVLX-NEXT: .Lcfi933:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1114:			; NoVLX-NEXT: .Lcfi934:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1115:			; NoVLX-NEXT: .Lcfi935:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
				; NoVLX-NEXT: vpandn %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	▲ Show 20 Lines • Show All 220 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpled %ymm0, %ymm1, %k0			; VLX-NEXT: vpcmpled %ymm0, %ymm1, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsged_v8i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpsged_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1116:			; NoVLX-NEXT: .Lcfi936:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1117:			; NoVLX-NEXT: .Lcfi937:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1118:			; NoVLX-NEXT: .Lcfi938:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>			; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0			; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 14 Lines
	; VLX-NEXT: vpcmpnltd (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpnltd (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsged_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsged_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1119:			; NoVLX-NEXT: .Lcfi939:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1120:			; NoVLX-NEXT: .Lcfi940:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1121:			; NoVLX-NEXT: .Lcfi941:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vmovdqa (%rdi), %ymm1			; NoVLX-NEXT: vmovdqa (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0			; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 16 Lines
	; VLX-NEXT: vpcmpled %ymm0, %ymm1, %k0 {%k1}			; VLX-NEXT: vpcmpled %ymm0, %ymm1, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v8i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsged_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1122:			; NoVLX-NEXT: .Lcfi942:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1123:			; NoVLX-NEXT: .Lcfi943:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1124:			; NoVLX-NEXT: .Lcfi944:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>			; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0			; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX-NEXT: vpcmpnltd (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltd (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsged_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1125:			; NoVLX-NEXT: .Lcfi945:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1126:			; NoVLX-NEXT: .Lcfi946:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1127:			; NoVLX-NEXT: .Lcfi947:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vmovdqa (%rsi), %ymm1			; NoVLX-NEXT: vmovdqa (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0			; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 19 Lines
	; VLX-NEXT: vpcmpled %ymm0, %ymm1, %k0			; VLX-NEXT: vpcmpled %ymm0, %ymm1, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsged_v8i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsged_v8i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1128:			; NoVLX-NEXT: .Lcfi948:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1129:			; NoVLX-NEXT: .Lcfi949:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1130:			; NoVLX-NEXT: .Lcfi950:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpbroadcastd (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0			; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 18 Lines
	; VLX-NEXT: vpcmpled %ymm0, %ymm1, %k0 {%k1}			; VLX-NEXT: vpcmpled %ymm0, %ymm1, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v8i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsged_v8i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1131:			; NoVLX-NEXT: .Lcfi951:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1132:			; NoVLX-NEXT: .Lcfi952:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1133:			; NoVLX-NEXT: .Lcfi953:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpbroadcastd (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0			; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k0, %k1, %k0			; NoVLX-NEXT: kandw %k0, %k1, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 19 Lines
	; VLX-NEXT: vpcmpled %ymm0, %ymm1, %k0			; VLX-NEXT: vpcmpled %ymm0, %ymm1, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsged_v8i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsged_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1134:			; NoVLX-NEXT: .Lcfi954:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1135:			; NoVLX-NEXT: .Lcfi955:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1136:			; NoVLX-NEXT: .Lcfi956:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>			; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0			; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpnltd (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpnltd (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsged_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsged_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1137:			; NoVLX-NEXT: .Lcfi957:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1138:			; NoVLX-NEXT: .Lcfi958:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1139:			; NoVLX-NEXT: .Lcfi959:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vmovdqa (%rdi), %ymm1			; NoVLX-NEXT: vmovdqa (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0			; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpled %ymm0, %ymm1, %k0 {%k1}			; VLX-NEXT: vpcmpled %ymm0, %ymm1, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v8i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsged_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1140:			; NoVLX-NEXT: .Lcfi960:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1141:			; NoVLX-NEXT: .Lcfi961:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1142:			; NoVLX-NEXT: .Lcfi962:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>			; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0			; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpnltd (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltd (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsged_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1143:			; NoVLX-NEXT: .Lcfi963:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1144:			; NoVLX-NEXT: .Lcfi964:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1145:			; NoVLX-NEXT: .Lcfi965:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vmovdqa (%rsi), %ymm1			; NoVLX-NEXT: vmovdqa (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0			; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpled %ymm0, %ymm1, %k0			; VLX-NEXT: vpcmpled %ymm0, %ymm1, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsged_v8i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsged_v8i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1146:			; NoVLX-NEXT: .Lcfi966:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1147:			; NoVLX-NEXT: .Lcfi967:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1148:			; NoVLX-NEXT: .Lcfi968:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpbroadcastd (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0			; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpled %ymm0, %ymm1, %k0 {%k1}			; VLX-NEXT: vpcmpled %ymm0, %ymm1, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v8i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsged_v8i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1149:			; NoVLX-NEXT: .Lcfi969:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1150:			; NoVLX-NEXT: .Lcfi970:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1151:			; NoVLX-NEXT: .Lcfi971:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpbroadcastd (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0			; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k0, %k1, %k0			; NoVLX-NEXT: kandw %k0, %k1, %k0
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpled %zmm0, %zmm1, %k0			; VLX-NEXT: vpcmpled %zmm0, %zmm1, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsged_v16i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpsged_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1152:			; NoVLX-NEXT: .Lcfi972:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1153:			; NoVLX-NEXT: .Lcfi973:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1154:			; NoVLX-NEXT: .Lcfi974:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1155:			; NoVLX-NEXT: .Lcfi975:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1156:			; NoVLX-NEXT: .Lcfi976:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1157:			; NoVLX-NEXT: .Lcfi977:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1158:			; NoVLX-NEXT: .Lcfi978:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1159:			; NoVLX-NEXT: .Lcfi979:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0			; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 19 Lines
	; VLX-NEXT: vpcmpnltd (%rdi), %zmm0, %k0			; VLX-NEXT: vpcmpnltd (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsged_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsged_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1160:			; NoVLX-NEXT: .Lcfi980:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1161:			; NoVLX-NEXT: .Lcfi981:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1162:			; NoVLX-NEXT: .Lcfi982:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1163:			; NoVLX-NEXT: .Lcfi983:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1164:			; NoVLX-NEXT: .Lcfi984:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1165:			; NoVLX-NEXT: .Lcfi985:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1166:			; NoVLX-NEXT: .Lcfi986:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1167:			; NoVLX-NEXT: .Lcfi987:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpnltd (%rdi), %zmm0, %k0			; NoVLX-NEXT: vpcmpnltd (%rdi), %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 21 Lines
	; VLX-NEXT: vpcmpled %zmm0, %zmm1, %k0 {%k1}			; VLX-NEXT: vpcmpled %zmm0, %zmm1, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v16i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsged_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1168:			; NoVLX-NEXT: .Lcfi988:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1169:			; NoVLX-NEXT: .Lcfi989:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1170:			; NoVLX-NEXT: .Lcfi990:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1171:			; NoVLX-NEXT: .Lcfi991:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1172:			; NoVLX-NEXT: .Lcfi992:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1173:			; NoVLX-NEXT: .Lcfi993:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1174:			; NoVLX-NEXT: .Lcfi994:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1175:			; NoVLX-NEXT: .Lcfi995:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0 {%k1}			; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 22 Lines
	; VLX-NEXT: vpcmpnltd (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltd (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsged_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1176:			; NoVLX-NEXT: .Lcfi996:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1177:			; NoVLX-NEXT: .Lcfi997:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1178:			; NoVLX-NEXT: .Lcfi998:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1179:			; NoVLX-NEXT: .Lcfi999:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1180:			; NoVLX-NEXT: .Lcfi1000:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1181:			; NoVLX-NEXT: .Lcfi1001:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1182:			; NoVLX-NEXT: .Lcfi1002:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1183:			; NoVLX-NEXT: .Lcfi1003:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpnltd (%rsi), %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpnltd (%rsi), %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 24 Lines
	; VLX-NEXT: vpcmpled %zmm0, %zmm1, %k0			; VLX-NEXT: vpcmpled %zmm0, %zmm1, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsged_v16i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsged_v16i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1184:			; NoVLX-NEXT: .Lcfi1004:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1185:			; NoVLX-NEXT: .Lcfi1005:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1186:			; NoVLX-NEXT: .Lcfi1006:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1187:			; NoVLX-NEXT: .Lcfi1007:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1188:			; NoVLX-NEXT: .Lcfi1008:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1189:			; NoVLX-NEXT: .Lcfi1009:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1190:			; NoVLX-NEXT: .Lcfi1010:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1191:			; NoVLX-NEXT: .Lcfi1011:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpbroadcastd (%rdi), %zmm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %zmm1
	; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0			; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 23 Lines
	; VLX-NEXT: vpcmpled %zmm0, %zmm1, %k0 {%k1}			; VLX-NEXT: vpcmpled %zmm0, %zmm1, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v16i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsged_v16i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1192:			; NoVLX-NEXT: .Lcfi1012:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1193:			; NoVLX-NEXT: .Lcfi1013:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1194:			; NoVLX-NEXT: .Lcfi1014:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1195:			; NoVLX-NEXT: .Lcfi1015:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1196:			; NoVLX-NEXT: .Lcfi1016:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1197:			; NoVLX-NEXT: .Lcfi1017:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1198:			; NoVLX-NEXT: .Lcfi1018:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1199:			; NoVLX-NEXT: .Lcfi1019:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpbroadcastd (%rsi), %zmm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %zmm1
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0 {%k1}			; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 24 Lines
	; VLX-NEXT: vpcmpled %zmm0, %zmm1, %k0			; VLX-NEXT: vpcmpled %zmm0, %zmm1, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsged_v16i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsged_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1200:			; NoVLX-NEXT: .Lcfi1020:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1201:			; NoVLX-NEXT: .Lcfi1021:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1202:			; NoVLX-NEXT: .Lcfi1022:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1203:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1204:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1205:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1206:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1207:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0			; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%1 = bitcast <8 x i64> %__b to <16 x i32>			%1 = bitcast <8 x i64> %__b to <16 x i32>
	%2 = icmp sge <16 x i32> %0, %1			%2 = icmp sge <16 x i32> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0,i32 1,i32 2,i32 3,i32 4,i32 5,i32 6,i32 7,i32 8,i32 9,i32 10,i32 11,i32 12,i32 13,i32 14,i32 15,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0,i32 1,i32 2,i32 3,i32 4,i32 5,i32 6,i32 7,i32 8,i32 9,i32 10,i32 11,i32 12,i32 13,i32 14,i32 15,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_vpcmpsged_v16i1_v64i1_mask_mem(<8 x i64> %__a, <8 x i64>* %__b) local_unnamed_addr {			define zeroext i64 @test_vpcmpsged_v16i1_v64i1_mask_mem(<8 x i64> %__a, <8 x i64>* %__b) local_unnamed_addr {
	; VLX-LABEL: test_vpcmpsged_v16i1_v64i1_mask_mem:			; VLX-LABEL: test_vpcmpsged_v16i1_v64i1_mask_mem:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpnltd (%rdi), %zmm0, %k0			; VLX-NEXT: vpcmpnltd (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsged_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsged_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1208:			; NoVLX-NEXT: .Lcfi1023:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1209:			; NoVLX-NEXT: .Lcfi1024:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1210:			; NoVLX-NEXT: .Lcfi1025:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1211:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1212:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1213:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1214:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1215:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpnltd (%rdi), %zmm0, %k0			; NoVLX-NEXT: vpcmpnltd (%rdi), %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%load = load <8 x i64>, <8 x i64>* %__b			%load = load <8 x i64>, <8 x i64>* %__b
	%1 = bitcast <8 x i64> %load to <16 x i32>			%1 = bitcast <8 x i64> %load to <16 x i32>
	%2 = icmp sge <16 x i32> %0, %1			%2 = icmp sge <16 x i32> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0,i32 1,i32 2,i32 3,i32 4,i32 5,i32 6,i32 7,i32 8,i32 9,i32 10,i32 11,i32 12,i32 13,i32 14,i32 15,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0,i32 1,i32 2,i32 3,i32 4,i32 5,i32 6,i32 7,i32 8,i32 9,i32 10,i32 11,i32 12,i32 13,i32 14,i32 15,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_masked_vpcmpsged_v16i1_v64i1_mask(i16 zeroext %__u, <8 x i64> %__a, <8 x i64> %__b) local_unnamed_addr {			define zeroext i64 @test_masked_vpcmpsged_v16i1_v64i1_mask(i16 zeroext %__u, <8 x i64> %__a, <8 x i64> %__b) local_unnamed_addr {
	; VLX-LABEL: test_masked_vpcmpsged_v16i1_v64i1_mask:			; VLX-LABEL: test_masked_vpcmpsged_v16i1_v64i1_mask:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpled %zmm0, %zmm1, %k0 {%k1}			; VLX-NEXT: vpcmpled %zmm0, %zmm1, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v16i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsged_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1216:			; NoVLX-NEXT: .Lcfi1026:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1217:			; NoVLX-NEXT: .Lcfi1027:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1218:			; NoVLX-NEXT: .Lcfi1028:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1219:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1220:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1221:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1222:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1223:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0 {%k1}			; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%1 = bitcast <8 x i64> %__b to <16 x i32>			%1 = bitcast <8 x i64> %__b to <16 x i32>
	%2 = icmp sge <16 x i32> %0, %1			%2 = icmp sge <16 x i32> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	%4 = and <16 x i1> %2, %3			%4 = and <16 x i1> %2, %3
	Show All 9 Lines
	; VLX-NEXT: vpcmpnltd (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltd (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsged_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1224:			; NoVLX-NEXT: .Lcfi1029:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1225:			; NoVLX-NEXT: .Lcfi1030:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1226:			; NoVLX-NEXT: .Lcfi1031:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1227:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1228:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1229:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1230:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1231:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpnltd (%rsi), %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpnltd (%rsi), %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%load = load <8 x i64>, <8 x i64>* %__b			%load = load <8 x i64>, <8 x i64>* %__b
	%1 = bitcast <8 x i64> %load to <16 x i32>			%1 = bitcast <8 x i64> %load to <16 x i32>
	%2 = icmp sge <16 x i32> %0, %1			%2 = icmp sge <16 x i32> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	Show All 11 Lines
	; VLX-NEXT: vpcmpled %zmm0, %zmm1, %k0			; VLX-NEXT: vpcmpled %zmm0, %zmm1, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsged_v16i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsged_v16i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1232:			; NoVLX-NEXT: .Lcfi1032:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1233:			; NoVLX-NEXT: .Lcfi1033:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1234:			; NoVLX-NEXT: .Lcfi1034:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1235:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1236:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1237:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1238:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1239:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpbroadcastd (%rdi), %zmm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %zmm1
	; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0			; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%load = load i32, i32* %__b			%load = load i32, i32* %__b
	%vec = insertelement <16 x i32> undef, i32 %load, i32 0			%vec = insertelement <16 x i32> undef, i32 %load, i32 0
	%1 = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%1 = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	%2 = icmp sge <16 x i32> %0, %1			%2 = icmp sge <16 x i32> %0, %1
	Show All 10 Lines
	; VLX-NEXT: vpcmpled %zmm0, %zmm1, %k0 {%k1}			; VLX-NEXT: vpcmpled %zmm0, %zmm1, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsged_v16i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsged_v16i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1240:			; NoVLX-NEXT: .Lcfi1035:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1241:			; NoVLX-NEXT: .Lcfi1036:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1242:			; NoVLX-NEXT: .Lcfi1037:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1243:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1244:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1245:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1246:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1247:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpbroadcastd (%rsi), %zmm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %zmm1
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0 {%k1}			; NoVLX-NEXT: vpcmpled %zmm0, %zmm1, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%load = load i32, i32* %__b			%load = load i32, i32* %__b
	%vec = insertelement <16 x i32> undef, i32 %load, i32 0			%vec = insertelement <16 x i32> undef, i32 %load, i32 0
	%1 = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%1 = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	%2 = icmp sge <16 x i32> %0, %1			%2 = icmp sge <16 x i32> %0, %1
	▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpleq %xmm0, %xmm1, %k0 {%k1}			; VLX-NEXT: vpcmpleq %xmm0, %xmm1, %k0 {%k1}
	; VLX-NEXT: kmovb %k0, -{{[0-9]+}}(%rsp)			; VLX-NEXT: kmovb %k0, -{{[0-9]+}}(%rsp)
	; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v2i1_v4i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v2i1_v4i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
				; NoVLX-NEXT: vpandn %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero			; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero
	; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0			; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	Show All 15 Lines
	; VLX-NEXT: vpcmpnltq (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltq (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovb %k0, -{{[0-9]+}}(%rsp)			; VLX-NEXT: kmovb %k0, -{{[0-9]+}}(%rsp)
	; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v2i1_v4i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v2i1_v4i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vmovdqa (%rsi), %xmm1			; NoVLX-NEXT: vmovdqa (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
				; NoVLX-NEXT: vpandn %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero			; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero
	; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0			; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpleq %xmm0, %xmm1, %k0 {%k1}			; VLX-NEXT: vpcmpleq %xmm0, %xmm1, %k0 {%k1}
	; VLX-NEXT: kmovb %k0, -{{[0-9]+}}(%rsp)			; VLX-NEXT: kmovb %k0, -{{[0-9]+}}(%rsp)
	; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v2i1_v4i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v2i1_v4i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
				; NoVLX-NEXT: vpandn %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero			; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero
	; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0			; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	Show All 21 Lines
	;			;
	; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v8i1_mask:			; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%1 = bitcast <2 x i64> %__b to <2 x i64>			%1 = bitcast <2 x i64> %__b to <2 x i64>
	Show All 14 Lines
	; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v8i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v8i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vmovdqa (%rdi), %xmm1			; NoVLX-NEXT: vmovdqa (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	Show All 23 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%1 = bitcast <2 x i64> %__b to <2 x i64>			%1 = bitcast <2 x i64> %__b to <2 x i64>
	Show All 26 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	Show All 20 Lines
	; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v8i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v8i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load i64, i64* %__b			%load = load i64, i64* %__b
	Show All 26 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load i64, i64* %__b			%load = load i64, i64* %__b
	Show All 19 Lines
	;			;
	; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v16i1_mask:			; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%1 = bitcast <2 x i64> %__b to <2 x i64>			%1 = bitcast <2 x i64> %__b to <2 x i64>
	Show All 14 Lines
	; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v16i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v16i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vmovdqa (%rdi), %xmm1			; NoVLX-NEXT: vmovdqa (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	Show All 23 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%1 = bitcast <2 x i64> %__b to <2 x i64>			%1 = bitcast <2 x i64> %__b to <2 x i64>
	Show All 26 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	Show All 20 Lines
	; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v16i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v16i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load i64, i64* %__b			%load = load i64, i64* %__b
	Show All 26 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load i64, i64* %__b			%load = load i64, i64* %__b
	Show All 14 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpleq %xmm0, %xmm1, %k0			; VLX-NEXT: vpcmpleq %xmm0, %xmm1, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1248:			; NoVLX-NEXT: .Lcfi1038:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1249:			; NoVLX-NEXT: .Lcfi1039:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1250:			; NoVLX-NEXT: .Lcfi1040:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	Show All 23 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpnltq (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpnltq (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1251:			; NoVLX-NEXT: .Lcfi1041:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1252:			; NoVLX-NEXT: .Lcfi1042:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1253:			; NoVLX-NEXT: .Lcfi1043:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vmovdqa (%rdi), %xmm1			; NoVLX-NEXT: vmovdqa (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 26 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpleq %xmm0, %xmm1, %k0 {%k1}			; VLX-NEXT: vpcmpleq %xmm0, %xmm1, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v2i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v2i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1254:			; NoVLX-NEXT: .Lcfi1044:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1255:			; NoVLX-NEXT: .Lcfi1045:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1256:			; NoVLX-NEXT: .Lcfi1046:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	Show All 35 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpnltq (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltq (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v2i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v2i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1257:			; NoVLX-NEXT: .Lcfi1047:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1258:			; NoVLX-NEXT: .Lcfi1048:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1259:			; NoVLX-NEXT: .Lcfi1049:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vmovdqa (%rsi), %xmm1			; NoVLX-NEXT: vmovdqa (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	Show All 38 Lines
	; VLX-NEXT: vpbroadcastq (%rdi), %xmm1			; VLX-NEXT: vpbroadcastq (%rdi), %xmm1
	; VLX-NEXT: vpcmpleq %xmm0, %xmm1, %k0			; VLX-NEXT: vpcmpleq %xmm0, %xmm1, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1260:			; NoVLX-NEXT: .Lcfi1050:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1261:			; NoVLX-NEXT: .Lcfi1051:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1262:			; NoVLX-NEXT: .Lcfi1052:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 28 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpleq %xmm0, %xmm1, %k0 {%k1}			; VLX-NEXT: vpcmpleq %xmm0, %xmm1, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v2i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v2i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1263:			; NoVLX-NEXT: .Lcfi1053:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1264:			; NoVLX-NEXT: .Lcfi1054:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1265:			; NoVLX-NEXT: .Lcfi1055:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	Show All 38 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpleq %xmm0, %xmm1, %k0			; VLX-NEXT: vpcmpleq %xmm0, %xmm1, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1266:			; NoVLX-NEXT: .Lcfi1056:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1267:			; NoVLX-NEXT: .Lcfi1057:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1268:			; NoVLX-NEXT: .Lcfi1058:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 29 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpnltq (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpnltq (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1269:			; NoVLX-NEXT: .Lcfi1059:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1270:			; NoVLX-NEXT: .Lcfi1060:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1271:			; NoVLX-NEXT: .Lcfi1061:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vmovdqa (%rdi), %xmm1			; NoVLX-NEXT: vmovdqa (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	Show All 32 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpleq %xmm0, %xmm1, %k0 {%k1}			; VLX-NEXT: vpcmpleq %xmm0, %xmm1, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v2i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v2i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1272:			; NoVLX-NEXT: .Lcfi1062:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1273:			; NoVLX-NEXT: .Lcfi1063:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1274:			; NoVLX-NEXT: .Lcfi1064:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
				; NoVLX-NEXT: vpandn %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 27 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpnltq (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltq (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v2i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v2i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1275:			; NoVLX-NEXT: .Lcfi1065:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1276:			; NoVLX-NEXT: .Lcfi1066:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1277:			; NoVLX-NEXT: .Lcfi1067:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vmovdqa (%rsi), %xmm1			; NoVLX-NEXT: vmovdqa (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
				; NoVLX-NEXT: vpandn %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 29 Lines
	; VLX-NEXT: vpbroadcastq (%rdi), %xmm1			; VLX-NEXT: vpbroadcastq (%rdi), %xmm1
	; VLX-NEXT: vpcmpleq %xmm0, %xmm1, %k0			; VLX-NEXT: vpcmpleq %xmm0, %xmm1, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgeq_v2i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1278:			; NoVLX-NEXT: .Lcfi1068:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1279:			; NoVLX-NEXT: .Lcfi1069:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1280:			; NoVLX-NEXT: .Lcfi1070:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; NoVLX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	Show All 34 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpleq %xmm0, %xmm1, %k0 {%k1}			; VLX-NEXT: vpcmpleq %xmm0, %xmm1, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v2i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v2i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1281:			; NoVLX-NEXT: .Lcfi1071:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1282:			; NoVLX-NEXT: .Lcfi1072:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1283:			; NoVLX-NEXT: .Lcfi1073:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpandn %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
				; NoVLX-NEXT: vpandn %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 36 Lines
	; NoVLX-LABEL: test_vpcmpsgeq_v4i1_v8i1_mask:			; NoVLX-LABEL: test_vpcmpsgeq_v4i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vmovdqa (%rdi), %ymm1			; NoVLX-NEXT: vmovdqa (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v4i1_v8i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v4i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vmovdqa (%rsi), %ymm1			; NoVLX-NEXT: vmovdqa (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-LABEL: test_vpcmpsgeq_v4i1_v16i1_mask:			; NoVLX-LABEL: test_vpcmpsgeq_v4i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vmovdqa (%rdi), %ymm1			; NoVLX-NEXT: vmovdqa (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v4i1_v16i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v4i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vmovdqa (%rsi), %ymm1			; NoVLX-NEXT: vmovdqa (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 40 Lines
	; VLX-NEXT: vpcmpleq %ymm0, %ymm1, %k0			; VLX-NEXT: vpcmpleq %ymm0, %ymm1, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeq_v4i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpsgeq_v4i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1284:			; NoVLX-NEXT: .Lcfi1074:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1285:			; NoVLX-NEXT: .Lcfi1075:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1286:			; NoVLX-NEXT: .Lcfi1076:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 25 Lines
	; VLX-NEXT: vpcmpnltq (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpnltq (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeq_v4i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgeq_v4i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1287:			; NoVLX-NEXT: .Lcfi1077:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1288:			; NoVLX-NEXT: .Lcfi1078:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1289:			; NoVLX-NEXT: .Lcfi1079:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vmovdqa (%rdi), %ymm1			; NoVLX-NEXT: vmovdqa (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	Show All 28 Lines
	; VLX-NEXT: vpcmpleq %ymm0, %ymm1, %k0 {%k1}			; VLX-NEXT: vpcmpleq %ymm0, %ymm1, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v4i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v4i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1290:			; NoVLX-NEXT: .Lcfi1080:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1291:			; NoVLX-NEXT: .Lcfi1081:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1292:			; NoVLX-NEXT: .Lcfi1082:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 24 Lines
	; VLX-NEXT: vpcmpnltq (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltq (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v4i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v4i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1293:			; NoVLX-NEXT: .Lcfi1083:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1294:			; NoVLX-NEXT: .Lcfi1084:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1295:			; NoVLX-NEXT: .Lcfi1085:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vmovdqa (%rsi), %ymm1			; NoVLX-NEXT: vmovdqa (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 26 Lines
	; VLX-NEXT: vpcmpleq %ymm0, %ymm1, %k0			; VLX-NEXT: vpcmpleq %ymm0, %ymm1, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeq_v4i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgeq_v4i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1296:			; NoVLX-NEXT: .Lcfi1086:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1297:			; NoVLX-NEXT: .Lcfi1087:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1298:			; NoVLX-NEXT: .Lcfi1088:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	Show All 30 Lines
	; VLX-NEXT: vpcmpleq %ymm0, %ymm1, %k0 {%k1}			; VLX-NEXT: vpcmpleq %ymm0, %ymm1, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v4i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v4i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1299:			; NoVLX-NEXT: .Lcfi1089:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1300:			; NoVLX-NEXT: .Lcfi1090:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1301:			; NoVLX-NEXT: .Lcfi1091:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 26 Lines
	; VLX-NEXT: vpcmpleq %ymm0, %ymm1, %k0			; VLX-NEXT: vpcmpleq %ymm0, %ymm1, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeq_v4i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsgeq_v4i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1302:			; NoVLX-NEXT: .Lcfi1092:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1303:			; NoVLX-NEXT: .Lcfi1093:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1304:			; NoVLX-NEXT: .Lcfi1094:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	Show All 31 Lines
	; VLX-NEXT: vpcmpnltq (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpnltq (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeq_v4i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgeq_v4i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1305:			; NoVLX-NEXT: .Lcfi1095:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1306:			; NoVLX-NEXT: .Lcfi1096:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1307:			; NoVLX-NEXT: .Lcfi1097:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vmovdqa (%rdi), %ymm1			; NoVLX-NEXT: vmovdqa (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	Show All 34 Lines
	; VLX-NEXT: vpcmpleq %ymm0, %ymm1, %k0 {%k1}			; VLX-NEXT: vpcmpleq %ymm0, %ymm1, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v4i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v4i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1308:			; NoVLX-NEXT: .Lcfi1098:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1309:			; NoVLX-NEXT: .Lcfi1099:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1310:			; NoVLX-NEXT: .Lcfi1100:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
				; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 29 Lines
	; VLX-NEXT: vpcmpnltq (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltq (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v4i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v4i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1311:			; NoVLX-NEXT: .Lcfi1101:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1312:			; NoVLX-NEXT: .Lcfi1102:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1313:			; NoVLX-NEXT: .Lcfi1103:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vmovdqa (%rsi), %ymm1			; NoVLX-NEXT: vmovdqa (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
				; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 31 Lines
	; VLX-NEXT: vpcmpleq %ymm0, %ymm1, %k0			; VLX-NEXT: vpcmpleq %ymm0, %ymm1, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeq_v4i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgeq_v4i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1314:			; NoVLX-NEXT: .Lcfi1104:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1315:			; NoVLX-NEXT: .Lcfi1105:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1316:			; NoVLX-NEXT: .Lcfi1106:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	Show All 36 Lines
	; VLX-NEXT: vpcmpleq %ymm0, %ymm1, %k0 {%k1}			; VLX-NEXT: vpcmpleq %ymm0, %ymm1, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v4i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v4i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1317:			; NoVLX-NEXT: .Lcfi1107:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1318:			; NoVLX-NEXT: .Lcfi1108:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1319:			; NoVLX-NEXT: .Lcfi1109:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; NoVLX-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
				; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	▲ Show 20 Lines • Show All 199 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0			; VLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeq_v8i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpsgeq_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1320:			; NoVLX-NEXT: .Lcfi1110:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1321:			; NoVLX-NEXT: .Lcfi1111:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1322:			; NoVLX-NEXT: .Lcfi1112:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0			; NoVLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 14 Lines
	; VLX-NEXT: vpcmpnltq (%rdi), %zmm0, %k0			; VLX-NEXT: vpcmpnltq (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeq_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgeq_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1323:			; NoVLX-NEXT: .Lcfi1113:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1324:			; NoVLX-NEXT: .Lcfi1114:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1325:			; NoVLX-NEXT: .Lcfi1115:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpnltq (%rdi), %zmm0, %k0			; NoVLX-NEXT: vpcmpnltq (%rdi), %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 16 Lines
	; VLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0 {%k1}			; VLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v8i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1326:			; NoVLX-NEXT: .Lcfi1116:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1327:			; NoVLX-NEXT: .Lcfi1117:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1328:			; NoVLX-NEXT: .Lcfi1118:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0 {%k1}			; NoVLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX-NEXT: vpcmpnltq (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltq (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1329:			; NoVLX-NEXT: .Lcfi1119:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1330:			; NoVLX-NEXT: .Lcfi1120:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1331:			; NoVLX-NEXT: .Lcfi1121:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpnltq (%rsi), %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpnltq (%rsi), %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 19 Lines
	; VLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0			; VLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeq_v8i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgeq_v8i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1332:			; NoVLX-NEXT: .Lcfi1122:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1333:			; NoVLX-NEXT: .Lcfi1123:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1334:			; NoVLX-NEXT: .Lcfi1124:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rdi), %zmm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %zmm1
	; NoVLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0			; NoVLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 18 Lines
	; VLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0 {%k1}			; VLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v8i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v8i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1335:			; NoVLX-NEXT: .Lcfi1125:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1336:			; NoVLX-NEXT: .Lcfi1126:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1337:			; NoVLX-NEXT: .Lcfi1127:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rsi), %zmm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %zmm1
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0 {%k1}			; NoVLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 19 Lines
	; VLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0			; VLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeq_v8i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpsgeq_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1338:			; NoVLX-NEXT: .Lcfi1128:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1339:			; NoVLX-NEXT: .Lcfi1129:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1340:			; NoVLX-NEXT: .Lcfi1130:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0			; NoVLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpnltq (%rdi), %zmm0, %k0			; VLX-NEXT: vpcmpnltq (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeq_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpsgeq_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1341:			; NoVLX-NEXT: .Lcfi1131:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1342:			; NoVLX-NEXT: .Lcfi1132:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1343:			; NoVLX-NEXT: .Lcfi1133:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpnltq (%rdi), %zmm0, %k0			; NoVLX-NEXT: vpcmpnltq (%rdi), %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0 {%k1}			; VLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v8i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1344:			; NoVLX-NEXT: .Lcfi1134:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1345:			; NoVLX-NEXT: .Lcfi1135:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1346:			; NoVLX-NEXT: .Lcfi1136:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0 {%k1}			; NoVLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpnltq (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpnltq (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1347:			; NoVLX-NEXT: .Lcfi1137:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1348:			; NoVLX-NEXT: .Lcfi1138:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1349:			; NoVLX-NEXT: .Lcfi1139:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpnltq (%rsi), %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpnltq (%rsi), %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0			; VLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpsgeq_v8i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpsgeq_v8i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1350:			; NoVLX-NEXT: .Lcfi1140:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1351:			; NoVLX-NEXT: .Lcfi1141:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1352:			; NoVLX-NEXT: .Lcfi1142:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rdi), %zmm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %zmm1
	; NoVLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0			; NoVLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0 {%k1}			; VLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpsgeq_v8i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpsgeq_v8i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1353:			; NoVLX-NEXT: .Lcfi1143:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1354:			; NoVLX-NEXT: .Lcfi1144:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1355:			; NoVLX-NEXT: .Lcfi1145:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rsi), %zmm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %zmm1
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0 {%k1}			; NoVLX-NEXT: vpcmpleq %zmm0, %zmm1, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltub %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpltub %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultb_v16i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpultb_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1356:			; NoVLX-NEXT: .Lcfi1146:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1357:			; NoVLX-NEXT: .Lcfi1147:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1358:			; NoVLX-NEXT: .Lcfi1148:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1359:			; NoVLX-NEXT: .Lcfi1149:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1360:			; NoVLX-NEXT: .Lcfi1150:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1361:			; NoVLX-NEXT: .Lcfi1151:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1362:			; NoVLX-NEXT: .Lcfi1152:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1363:			; NoVLX-NEXT: .Lcfi1153:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 18 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltub (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpltub (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultb_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultb_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1364:			; NoVLX-NEXT: .Lcfi1154:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1365:			; NoVLX-NEXT: .Lcfi1155:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1366:			; NoVLX-NEXT: .Lcfi1156:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1367:			; NoVLX-NEXT: .Lcfi1157:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1368:			; NoVLX-NEXT: .Lcfi1158:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1369:			; NoVLX-NEXT: .Lcfi1159:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1370:			; NoVLX-NEXT: .Lcfi1160:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1371:			; NoVLX-NEXT: .Lcfi1161:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 20 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltub %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltub %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultb_v16i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultb_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1372:			; NoVLX-NEXT: .Lcfi1162:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1373:			; NoVLX-NEXT: .Lcfi1163:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1374:			; NoVLX-NEXT: .Lcfi1164:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1375:			; NoVLX-NEXT: .Lcfi1165:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1376:			; NoVLX-NEXT: .Lcfi1166:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1377:			; NoVLX-NEXT: .Lcfi1167:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1378:			; NoVLX-NEXT: .Lcfi1168:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1379:			; NoVLX-NEXT: .Lcfi1169:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 21 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltub (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltub (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultb_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultb_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1380:			; NoVLX-NEXT: .Lcfi1170:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1381:			; NoVLX-NEXT: .Lcfi1171:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1382:			; NoVLX-NEXT: .Lcfi1172:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1383:			; NoVLX-NEXT: .Lcfi1173:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1384:			; NoVLX-NEXT: .Lcfi1174:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1385:			; NoVLX-NEXT: .Lcfi1175:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1386:			; NoVLX-NEXT: .Lcfi1176:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1387:			; NoVLX-NEXT: .Lcfi1177:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 22 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltub %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpltub %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultb_v16i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpultb_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1388:			; NoVLX-NEXT: .Lcfi1178:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1389:			; NoVLX-NEXT: .Lcfi1179:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1390:			; NoVLX-NEXT: .Lcfi1180:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1391:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1392:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1393:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1394:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1395:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <16 x i8>			%0 = bitcast <2 x i64> %__a to <16 x i8>
	%1 = bitcast <2 x i64> %__b to <16 x i8>			%1 = bitcast <2 x i64> %__b to <16 x i8>
	%2 = icmp ult <16 x i8> %0, %1			%2 = icmp ult <16 x i8> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_vpcmpultb_v16i1_v64i1_mask_mem(<2 x i64> %__a, <2 x i64>* %__b) local_unnamed_addr {			define zeroext i64 @test_vpcmpultb_v16i1_v64i1_mask_mem(<2 x i64> %__a, <2 x i64>* %__b) local_unnamed_addr {
	; VLX-LABEL: test_vpcmpultb_v16i1_v64i1_mask_mem:			; VLX-LABEL: test_vpcmpultb_v16i1_v64i1_mask_mem:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltub (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpltub (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultb_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultb_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1396:			; NoVLX-NEXT: .Lcfi1181:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1397:			; NoVLX-NEXT: .Lcfi1182:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1398:			; NoVLX-NEXT: .Lcfi1183:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1399:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1400:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1401:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1402:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1403:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <16 x i8>			%0 = bitcast <2 x i64> %__a to <16 x i8>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	%1 = bitcast <2 x i64> %load to <16 x i8>			%1 = bitcast <2 x i64> %load to <16 x i8>
	%2 = icmp ult <16 x i8> %0, %1			%2 = icmp ult <16 x i8> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_masked_vpcmpultb_v16i1_v64i1_mask(i16 zeroext %__u, <2 x i64> %__a, <2 x i64> %__b) local_unnamed_addr {			define zeroext i64 @test_masked_vpcmpultb_v16i1_v64i1_mask(i16 zeroext %__u, <2 x i64> %__a, <2 x i64> %__b) local_unnamed_addr {
	; VLX-LABEL: test_masked_vpcmpultb_v16i1_v64i1_mask:			; VLX-LABEL: test_masked_vpcmpultb_v16i1_v64i1_mask:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltub %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltub %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultb_v16i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultb_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1404:			; NoVLX-NEXT: .Lcfi1184:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1405:			; NoVLX-NEXT: .Lcfi1185:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1406:			; NoVLX-NEXT: .Lcfi1186:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1407:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1408:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1409:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1410:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1411:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <16 x i8>			%0 = bitcast <2 x i64> %__a to <16 x i8>
	%1 = bitcast <2 x i64> %__b to <16 x i8>			%1 = bitcast <2 x i64> %__b to <16 x i8>
	%2 = icmp ult <16 x i8> %0, %1			%2 = icmp ult <16 x i8> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	%4 = and <16 x i1> %2, %3			%4 = and <16 x i1> %2, %3
	%5 = shufflevector <16 x i1> %4, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%5 = shufflevector <16 x i1> %4, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%6 = bitcast <64 x i1> %5 to i64			%6 = bitcast <64 x i1> %5 to i64
	ret i64 %6			ret i64 %6
	}			}

	define zeroext i64 @test_masked_vpcmpultb_v16i1_v64i1_mask_mem(i16 zeroext %__u, <2 x i64> %__a, <2 x i64>* %__b) local_unnamed_addr {			define zeroext i64 @test_masked_vpcmpultb_v16i1_v64i1_mask_mem(i16 zeroext %__u, <2 x i64> %__a, <2 x i64>* %__b) local_unnamed_addr {
	; VLX-LABEL: test_masked_vpcmpultb_v16i1_v64i1_mask_mem:			; VLX-LABEL: test_masked_vpcmpultb_v16i1_v64i1_mask_mem:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltub (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltub (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultb_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultb_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1412:			; NoVLX-NEXT: .Lcfi1187:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1413:			; NoVLX-NEXT: .Lcfi1188:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1414:			; NoVLX-NEXT: .Lcfi1189:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1415:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1416:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1417:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1418:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1419:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtb %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <16 x i8>			%0 = bitcast <2 x i64> %__a to <16 x i8>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	%1 = bitcast <2 x i64> %load to <16 x i8>			%1 = bitcast <2 x i64> %load to <16 x i8>
	%2 = icmp ult <16 x i8> %0, %1			%2 = icmp ult <16 x i8> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	Show All 10 Lines
	; VLX-NEXT: vpcmpltub %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpltub %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultb_v32i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpultb_v32i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1420:			; NoVLX-NEXT: .Lcfi1190:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1421:			; NoVLX-NEXT: .Lcfi1191:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1422:			; NoVLX-NEXT: .Lcfi1192:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vmovdqa {{.*#+}} ymm2 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]			; NoVLX-NEXT: vmovdqa {{.*#+}} ymm2 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtb %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtb %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	Show All 30 Lines
	; VLX-NEXT: vpcmpltub (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpltub (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultb_v32i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultb_v32i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1423:			; NoVLX-NEXT: .Lcfi1193:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1424:			; NoVLX-NEXT: .Lcfi1194:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1425:			; NoVLX-NEXT: .Lcfi1195:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vmovdqa {{.*#+}} ymm1 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]			; NoVLX-NEXT: vmovdqa {{.*#+}} ymm1 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor (%rdi), %ymm1, %ymm1			; NoVLX-NEXT: vpxor (%rdi), %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtb %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtb %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	Show All 32 Lines
	; VLX-NEXT: vpcmpltub %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpltub %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultb_v32i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultb_v32i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1426:			; NoVLX-NEXT: .Lcfi1196:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1427:			; NoVLX-NEXT: .Lcfi1197:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1428:			; NoVLX-NEXT: .Lcfi1198:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vpmovdb %zmm2, %xmm2			; NoVLX-NEXT: vpmovdb %zmm2, %xmm2
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpltub (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpltub (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultb_v32i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultb_v32i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1429:			; NoVLX-NEXT: .Lcfi1199:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1430:			; NoVLX-NEXT: .Lcfi1200:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1431:			; NoVLX-NEXT: .Lcfi1201:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpmovdb %zmm1, %xmm1			; NoVLX-NEXT: vpmovdb %zmm1, %xmm1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k2} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k2} {z}
	; NoVLX-NEXT: vpmovdb %zmm2, %xmm2
	; NoVLX-NEXT: vmovdqa {{.*#+}} ymm3 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]			; NoVLX-NEXT: vmovdqa {{.*#+}} ymm3 = [128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128,128]
	; NoVLX-NEXT: vpxor %ymm3, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm3, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor (%rsi), %ymm3, %ymm3			; NoVLX-NEXT: vpxor (%rsi), %ymm3, %ymm3
				; NoVLX-NEXT: vpmovdb %zmm2, %xmm2
	; NoVLX-NEXT: vpcmpgtb %ymm0, %ymm3, %ymm0			; NoVLX-NEXT: vpcmpgtb %ymm0, %ymm3, %ymm0
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm3			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm3
	; NoVLX-NEXT: vpand %xmm2, %xmm3, %xmm2			; NoVLX-NEXT: vpand %xmm2, %xmm3, %xmm2
	; NoVLX-NEXT: vpmovsxbd %xmm2, %zmm2			; NoVLX-NEXT: vpmovsxbd %xmm2, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2
	; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0			; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 164 Lines • ▼ Show 20 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltuw %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpltuw %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultw_v8i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpultw_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1432:			; NoVLX-NEXT: .Lcfi1202:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1433:			; NoVLX-NEXT: .Lcfi1203:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1434:			; NoVLX-NEXT: .Lcfi1204:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 13 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltuw (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpltuw (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultw_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultw_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1435:			; NoVLX-NEXT: .Lcfi1205:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1436:			; NoVLX-NEXT: .Lcfi1206:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1437:			; NoVLX-NEXT: .Lcfi1207:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [32768,32768,32768,32768,32768,32768,32768,32768]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [32768,32768,32768,32768,32768,32768,32768,32768]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 15 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltuw %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuw %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultw_v8i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultw_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1438:			; NoVLX-NEXT: .Lcfi1208:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1439:			; NoVLX-NEXT: .Lcfi1209:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1440:			; NoVLX-NEXT: .Lcfi1210:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 16 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltuw (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuw (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultw_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultw_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1441:			; NoVLX-NEXT: .Lcfi1211:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1442:			; NoVLX-NEXT: .Lcfi1212:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1443:			; NoVLX-NEXT: .Lcfi1213:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [32768,32768,32768,32768,32768,32768,32768,32768]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [32768,32768,32768,32768,32768,32768,32768,32768]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltuw %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpltuw %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultw_v8i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpultw_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1444:			; NoVLX-NEXT: .Lcfi1214:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1445:			; NoVLX-NEXT: .Lcfi1215:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1446:			; NoVLX-NEXT: .Lcfi1216:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltuw (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpltuw (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultw_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultw_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1447:			; NoVLX-NEXT: .Lcfi1217:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1448:			; NoVLX-NEXT: .Lcfi1218:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1449:			; NoVLX-NEXT: .Lcfi1219:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [32768,32768,32768,32768,32768,32768,32768,32768]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [32768,32768,32768,32768,32768,32768,32768,32768]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltuw %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuw %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultw_v8i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultw_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1450:			; NoVLX-NEXT: .Lcfi1220:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1451:			; NoVLX-NEXT: .Lcfi1221:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1452:			; NoVLX-NEXT: .Lcfi1222:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltuw (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuw (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultw_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultw_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1453:			; NoVLX-NEXT: .Lcfi1223:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1454:			; NoVLX-NEXT: .Lcfi1224:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1455:			; NoVLX-NEXT: .Lcfi1225:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [32768,32768,32768,32768,32768,32768,32768,32768]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [32768,32768,32768,32768,32768,32768,32768,32768]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxwq %xmm0, %zmm0
	▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpltuw %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpltuw %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultw_v16i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpultw_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1456:			; NoVLX-NEXT: .Lcfi1226:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1457:			; NoVLX-NEXT: .Lcfi1227:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1458:			; NoVLX-NEXT: .Lcfi1228:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1459:			; NoVLX-NEXT: .Lcfi1229:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1460:			; NoVLX-NEXT: .Lcfi1230:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1461:			; NoVLX-NEXT: .Lcfi1231:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1462:			; NoVLX-NEXT: .Lcfi1232:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1463:			; NoVLX-NEXT: .Lcfi1233:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa {{.*#+}} ymm2 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]			; NoVLX-NEXT: vmovdqa {{.*#+}} ymm2 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 19 Lines
	; VLX-NEXT: vpcmpltuw (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpltuw (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultw_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultw_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1464:			; NoVLX-NEXT: .Lcfi1234:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1465:			; NoVLX-NEXT: .Lcfi1235:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1466:			; NoVLX-NEXT: .Lcfi1236:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1467:			; NoVLX-NEXT: .Lcfi1237:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1468:			; NoVLX-NEXT: .Lcfi1238:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1469:			; NoVLX-NEXT: .Lcfi1239:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1470:			; NoVLX-NEXT: .Lcfi1240:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1471:			; NoVLX-NEXT: .Lcfi1241:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa {{.*#+}} ymm1 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]			; NoVLX-NEXT: vmovdqa {{.*#+}} ymm1 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor (%rdi), %ymm1, %ymm1			; NoVLX-NEXT: vpxor (%rdi), %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 21 Lines
	; VLX-NEXT: vpcmpltuw %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuw %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultw_v16i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultw_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1472:			; NoVLX-NEXT: .Lcfi1242:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1473:			; NoVLX-NEXT: .Lcfi1243:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1474:			; NoVLX-NEXT: .Lcfi1244:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1475:			; NoVLX-NEXT: .Lcfi1245:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1476:			; NoVLX-NEXT: .Lcfi1246:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1477:			; NoVLX-NEXT: .Lcfi1247:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1478:			; NoVLX-NEXT: .Lcfi1248:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1479:			; NoVLX-NEXT: .Lcfi1249:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa {{.*#+}} ymm2 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]			; NoVLX-NEXT: vmovdqa {{.*#+}} ymm2 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 22 Lines
	; VLX-NEXT: vpcmpltuw (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuw (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultw_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultw_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1480:			; NoVLX-NEXT: .Lcfi1250:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1481:			; NoVLX-NEXT: .Lcfi1251:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1482:			; NoVLX-NEXT: .Lcfi1252:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1483:			; NoVLX-NEXT: .Lcfi1253:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1484:			; NoVLX-NEXT: .Lcfi1254:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1485:			; NoVLX-NEXT: .Lcfi1255:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1486:			; NoVLX-NEXT: .Lcfi1256:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1487:			; NoVLX-NEXT: .Lcfi1257:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa {{.*#+}} ymm1 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]			; NoVLX-NEXT: vmovdqa {{.*#+}} ymm1 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor (%rsi), %ymm1, %ymm1			; NoVLX-NEXT: vpxor (%rsi), %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 23 Lines
	; VLX-NEXT: vpcmpltuw %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpltuw %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultw_v16i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpultw_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1488:			; NoVLX-NEXT: .Lcfi1258:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1489:			; NoVLX-NEXT: .Lcfi1259:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1490:			; NoVLX-NEXT: .Lcfi1260:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1491:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1492:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1493:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1494:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1495:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa {{.*#+}} ymm2 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]			; NoVLX-NEXT: vmovdqa {{.*#+}} ymm2 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <4 x i64> %__a to <16 x i16>			%0 = bitcast <4 x i64> %__a to <16 x i16>
	%1 = bitcast <4 x i64> %__b to <16 x i16>			%1 = bitcast <4 x i64> %__b to <16 x i16>
	%2 = icmp ult <16 x i16> %0, %1			%2 = icmp ult <16 x i16> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_vpcmpultw_v16i1_v64i1_mask_mem(<4 x i64> %__a, <4 x i64>* %__b) local_unnamed_addr {			define zeroext i64 @test_vpcmpultw_v16i1_v64i1_mask_mem(<4 x i64> %__a, <4 x i64>* %__b) local_unnamed_addr {
	; VLX-LABEL: test_vpcmpultw_v16i1_v64i1_mask_mem:			; VLX-LABEL: test_vpcmpultw_v16i1_v64i1_mask_mem:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltuw (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpltuw (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultw_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultw_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1496:			; NoVLX-NEXT: .Lcfi1261:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1497:			; NoVLX-NEXT: .Lcfi1262:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1498:			; NoVLX-NEXT: .Lcfi1263:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1499:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1500:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1501:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1502:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1503:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa {{.*#+}} ymm1 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]			; NoVLX-NEXT: vmovdqa {{.*#+}} ymm1 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor (%rdi), %ymm1, %ymm1			; NoVLX-NEXT: vpxor (%rdi), %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <4 x i64> %__a to <16 x i16>			%0 = bitcast <4 x i64> %__a to <16 x i16>
	%load = load <4 x i64>, <4 x i64>* %__b			%load = load <4 x i64>, <4 x i64>* %__b
	%1 = bitcast <4 x i64> %load to <16 x i16>			%1 = bitcast <4 x i64> %load to <16 x i16>
	%2 = icmp ult <16 x i16> %0, %1			%2 = icmp ult <16 x i16> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_masked_vpcmpultw_v16i1_v64i1_mask(i16 zeroext %__u, <4 x i64> %__a, <4 x i64> %__b) local_unnamed_addr {			define zeroext i64 @test_masked_vpcmpultw_v16i1_v64i1_mask(i16 zeroext %__u, <4 x i64> %__a, <4 x i64> %__b) local_unnamed_addr {
	; VLX-LABEL: test_masked_vpcmpultw_v16i1_v64i1_mask:			; VLX-LABEL: test_masked_vpcmpultw_v16i1_v64i1_mask:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltuw %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuw %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultw_v16i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultw_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1504:			; NoVLX-NEXT: .Lcfi1264:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1505:			; NoVLX-NEXT: .Lcfi1265:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1506:			; NoVLX-NEXT: .Lcfi1266:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1507:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1508:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1509:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1510:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1511:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa {{.*#+}} ymm2 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]			; NoVLX-NEXT: vmovdqa {{.*#+}} ymm2 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <4 x i64> %__a to <16 x i16>			%0 = bitcast <4 x i64> %__a to <16 x i16>
	%1 = bitcast <4 x i64> %__b to <16 x i16>			%1 = bitcast <4 x i64> %__b to <16 x i16>
	%2 = icmp ult <16 x i16> %0, %1			%2 = icmp ult <16 x i16> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	%4 = and <16 x i1> %2, %3			%4 = and <16 x i1> %2, %3
	Show All 9 Lines
	; VLX-NEXT: vpcmpltuw (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuw (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultw_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultw_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1512:			; NoVLX-NEXT: .Lcfi1267:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1513:			; NoVLX-NEXT: .Lcfi1268:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1514:			; NoVLX-NEXT: .Lcfi1269:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1515:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1516:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1517:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1518:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1519:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vmovdqa {{.*#+}} ymm1 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]			; NoVLX-NEXT: vmovdqa {{.*#+}} ymm1 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor (%rsi), %ymm1, %ymm1			; NoVLX-NEXT: vpxor (%rsi), %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <4 x i64> %__a to <16 x i16>			%0 = bitcast <4 x i64> %__a to <16 x i16>
	%load = load <4 x i64>, <4 x i64>* %__b			%load = load <4 x i64>, <4 x i64>* %__b
	%1 = bitcast <4 x i64> %load to <16 x i16>			%1 = bitcast <4 x i64> %load to <16 x i16>
	%2 = icmp ult <16 x i16> %0, %1			%2 = icmp ult <16 x i16> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	Show All 10 Lines
	; VLX-NEXT: vpcmpltuw %zmm1, %zmm0, %k0			; VLX-NEXT: vpcmpltuw %zmm1, %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultw_v32i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpultw_v32i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1520:			; NoVLX-NEXT: .Lcfi1270:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1521:			; NoVLX-NEXT: .Lcfi1271:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1522:			; NoVLX-NEXT: .Lcfi1272:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm3			; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm2
	; NoVLX-NEXT: vmovq %xmm3, %rax			; NoVLX-NEXT: vmovq %xmm2, %rax
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: movq %rax, %rdx			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: vmovd %eax, %xmm2			; NoVLX-NEXT: vmovd %eax, %xmm3
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm5			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vextracti32x4 $2, %zmm1, %xmm8
	; NoVLX-NEXT: vextracti32x4 $3, %zmm1, %xmm4
	; NoVLX-NEXT: vextracti32x4 $1, %zmm1, %xmm6
	; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm7
	; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm2
	; NoVLX-NEXT: shrq $32, %rdx			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %edx, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm3, %xmm3
	; NoVLX-NEXT: vpextrq $1, %xmm3, %rax			; NoVLX-NEXT: vpextrq $1, %xmm2, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vmovq %xmm0, %rcx			; NoVLX-NEXT: vmovq %xmm0, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm9
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm5			; NoVLX-NEXT: vmovd %ecx, %xmm3
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpextrq $1, %xmm0, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm0			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: vmovq %xmm2, %rcx			; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm4
				; NoVLX-NEXT: vmovq %xmm4, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm5			; NoVLX-NEXT: vmovd %ecx, %xmm5
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: vpextrq $1, %xmm2, %rax			; NoVLX-NEXT: vpextrq $1, %xmm4, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm4
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm4, %xmm4
	; NoVLX-NEXT: vmovq %xmm7, %rcx			; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm0
				; NoVLX-NEXT: vmovq %xmm0, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm5			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm5
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: vpextrq $1, %xmm7, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: vextracti32x4 $1, %zmm1, %xmm6
	; NoVLX-NEXT: vmovq %xmm6, %rcx			; NoVLX-NEXT: vmovq %xmm6, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm7			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm5
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm0
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrq $1, %xmm6, %rax			; NoVLX-NEXT: vpextrq $1, %xmm6, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vmovq %xmm1, %rcx			; NoVLX-NEXT: vmovq %xmm1, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm6			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm6
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm0
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrq $1, %xmm1, %rax			; NoVLX-NEXT: vpextrq $1, %xmm1, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm1			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vmovq %xmm4, %rcx			; NoVLX-NEXT: vextracti32x4 $3, %zmm1, %xmm7
				; NoVLX-NEXT: vmovq %xmm7, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm8
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm0
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrq $1, %xmm4, %rax			; NoVLX-NEXT: vpextrq $1, %xmm7, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vmovq %xmm8, %rcx			; NoVLX-NEXT: vextracti32x4 $2, %zmm1, %xmm1
				; NoVLX-NEXT: vmovq %xmm1, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm7
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm4			; NoVLX-NEXT: vmovd %ecx, %xmm0
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm0, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm8, %rax			; NoVLX-NEXT: vpextrq $1, %xmm1, %rax
	; NoVLX-NEXT: vinserti128 $1, %xmm3, %ymm0, %ymm0			; NoVLX-NEXT: vinserti128 $1, %xmm9, %ymm3, %ymm0
	; NoVLX-NEXT: vinserti128 $1, %xmm5, %ymm7, %ymm3
	; NoVLX-NEXT: vinserti128 $1, %xmm6, %ymm1, %ymm1
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm1
				; NoVLX-NEXT: vinserti128 $1, %xmm4, %ymm5, %ymm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm3
	; NoVLX-NEXT: vinserti128 $1, %xmm2, %ymm4, %ymm4			; NoVLX-NEXT: vinserti128 $1, %xmm6, %ymm8, %ymm1
	; NoVLX-NEXT: vmovdqa {{.*#+}} ymm2 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]			; NoVLX-NEXT: vinserti128 $1, %xmm7, %ymm3, %ymm4
	; NoVLX-NEXT: vpxor %ymm2, %ymm3, %ymm3			; NoVLX-NEXT: vmovdqa {{.*#+}} ymm3 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]
	; NoVLX-NEXT: vpxor %ymm2, %ymm4, %ymm4			; NoVLX-NEXT: vpxor %ymm3, %ymm2, %ymm2
	; NoVLX-NEXT: vpcmpgtw %ymm3, %ymm4, %ymm3			; NoVLX-NEXT: vpxor %ymm3, %ymm4, %ymm4
	; NoVLX-NEXT: vpmovsxwd %ymm3, %zmm3			; NoVLX-NEXT: vpcmpgtw %ymm2, %ymm4, %ymm2
	; NoVLX-NEXT: vpslld $31, %zmm3, %zmm3			; NoVLX-NEXT: vpmovsxwd %ymm2, %zmm2
	; NoVLX-NEXT: vptestmd %zmm3, %zmm3, %k0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2
				; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $2, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $3, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $3, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $6, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $6, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $9, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $9, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $10, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $10, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $13, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $14, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $14, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpmovsxbd %xmm3, %zmm3			; NoVLX-NEXT: vpmovsxbd %xmm2, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm3, %zmm3			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2
	; NoVLX-NEXT: vptestmd %zmm3, %zmm3, %k0			; NoVLX-NEXT: vpxor %ymm3, %ymm0, %ymm0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: vpxor %ymm3, %ymm1, %ymm1
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0			; NoVLX-NEXT: vpmovsxwd %ymm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $14, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k1
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %ecx			; NoVLX-NEXT: movl (%rsp), %ecx
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 18 Lines
	; VLX-NEXT: vpcmpltuw (%rdi), %zmm0, %k0			; VLX-NEXT: vpcmpltuw (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultw_v32i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultw_v32i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1523:			; NoVLX-NEXT: .Lcfi1273:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1524:			; NoVLX-NEXT: .Lcfi1274:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1525:			; NoVLX-NEXT: .Lcfi1275:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm2			; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm1
	; NoVLX-NEXT: vmovq %xmm2, %rax			; NoVLX-NEXT: vmovq %xmm1, %rax
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: movq %rax, %rdx			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: vmovd %eax, %xmm1			; NoVLX-NEXT: vmovd %eax, %xmm2
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm1, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm1
	; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm4
	; NoVLX-NEXT: shrq $32, %rdx			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %edx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm2, %rax			; NoVLX-NEXT: vpextrq $1, %xmm1, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm1
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: vmovq %xmm0, %rcx			; NoVLX-NEXT: vmovq %xmm0, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm0, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm0			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vmovq %xmm4, %rcx			; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm3
				; NoVLX-NEXT: vmovq %xmm3, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm4
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vpextrq $1, %xmm4, %rax			; NoVLX-NEXT: vpextrq $1, %xmm3, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm3
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3
	; NoVLX-NEXT: vmovq %xmm1, %rcx			; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm0
				; NoVLX-NEXT: vmovq %xmm0, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm4			; NoVLX-NEXT: vmovd %ecx, %xmm4
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4
	; NoVLX-NEXT: vpextrq $1, %xmm1, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm1			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm4
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vinserti128 $1, %xmm1, %ymm2, %ymm0
	; NoVLX-NEXT: vinserti128 $1, %xmm3, %ymm1, %ymm2			; NoVLX-NEXT: vinserti128 $1, %xmm3, %ymm4, %ymm2
	; NoVLX-NEXT: vmovdqa {{.*#+}} ymm1 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]			; NoVLX-NEXT: vmovdqa {{.*#+}} ymm1 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]
	; NoVLX-NEXT: vpxor %ymm1, %ymm2, %ymm2			; NoVLX-NEXT: vpxor %ymm1, %ymm2, %ymm2
	; NoVLX-NEXT: vpxor 32(%rdi), %ymm1, %ymm3			; NoVLX-NEXT: vpxor 32(%rdi), %ymm1, %ymm3
	; NoVLX-NEXT: vpcmpgtw %ymm2, %ymm3, %ymm2			; NoVLX-NEXT: vpcmpgtw %ymm2, %ymm3, %ymm2
	; NoVLX-NEXT: vpmovsxwd %ymm2, %zmm2			; NoVLX-NEXT: vpmovsxwd %ymm2, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2
	; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0			; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	▲ Show 20 Lines • Show All 163 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpltuw %zmm1, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuw %zmm1, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultw_v32i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultw_v32i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1526:			; NoVLX-NEXT: .Lcfi1276:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1527:			; NoVLX-NEXT: .Lcfi1277:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1528:			; NoVLX-NEXT: .Lcfi1278:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm2			; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm2
	; NoVLX-NEXT: vmovq %xmm2, %rax			; NoVLX-NEXT: vmovq %xmm2, %rax
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: movq %rax, %rdx			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: vmovd %eax, %xmm3			; NoVLX-NEXT: vmovd %eax, %xmm3
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm4			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vextracti32x4 $1, %zmm1, %xmm8			; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm5
	; NoVLX-NEXT: vextracti32x4 $2, %zmm1, %xmm5			; NoVLX-NEXT: vpextrq $1, %xmm5, %rax
	; NoVLX-NEXT: vextracti32x4 $3, %zmm1, %xmm7
	; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm6
	; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm3
	; NoVLX-NEXT: shrq $32, %rdx			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %edx, %xmm4, %xmm4			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm3, %xmm3
	; NoVLX-NEXT: vpextrq $1, %xmm2, %rax			; NoVLX-NEXT: vpextrq $1, %xmm2, %rdx
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm2			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %edx, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $4, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rdx, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vmovq %xmm3, %rcx			; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm4
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: vmovq %xmm4, %rcx
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm9			; NoVLX-NEXT: shrq $48, %rdx
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: vpinsrw $7, %edx, %xmm2, %xmm9
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: movl %ecx, %edx
	; NoVLX-NEXT: vmovd %ecx, %xmm4			; NoVLX-NEXT: shrl $16, %edx
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm4, %xmm4			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: vpinsrw $1, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: movq %rcx, %rdx
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm4, %xmm4			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpextrq $1, %xmm3, %rax			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm2, %xmm2
				; NoVLX-NEXT: vpextrq $1, %xmm4, %rdx
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm4, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %edx, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rdx, %rcx
				; NoVLX-NEXT: shrq $48, %rdx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vmovq %xmm6, %rcx			; NoVLX-NEXT: vpinsrw $7, %edx, %xmm2, %xmm4
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: vmovq %xmm5, %rcx
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm4			; NoVLX-NEXT: movl %ecx, %edx
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: shrl $16, %edx
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vpinsrw $1, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: movq %rcx, %rdx
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: vpextrq $1, %xmm6, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2
				; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: vpinsrw $6, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: vextracti32x4 $3, %zmm1, %xmm7
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vmovq %xmm7, %rcx
	; NoVLX-NEXT: vmovq %xmm0, %rcx			; NoVLX-NEXT: vmovq %xmm0, %rdx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm6			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm5
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %edx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %edx, %xmm2
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rdx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm0, %rax			; NoVLX-NEXT: vpextrq $1, %xmm0, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rdx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm0			; NoVLX-NEXT: vpinsrw $3, %edx, %xmm2, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %edx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %edx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $5, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $6, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vmovq %xmm7, %rcx			; NoVLX-NEXT: movq %rcx, %rdx
				; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: vextracti32x4 $2, %zmm1, %xmm6
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vmovq %xmm6, %rax
	; NoVLX-NEXT: vpextrq $1, %xmm7, %rax			; NoVLX-NEXT: vpextrq $1, %xmm7, %rdx
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %edx, %ecx
				; NoVLX-NEXT: vpinsrw $4, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: movq %rdx, %rcx
	; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vmovq %xmm5, %rcx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm7			; NoVLX-NEXT: shrq $48, %rdx
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: vpinsrw $7, %edx, %xmm2, %xmm8
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: vmovd %eax, %xmm7
				; NoVLX-NEXT: vpinsrw $1, %ecx, %xmm7, %xmm7
				; NoVLX-NEXT: vextracti32x4 $1, %zmm1, %xmm2
				; NoVLX-NEXT: vmovq %xmm2, %rcx
				; NoVLX-NEXT: movq %rax, %rdx
				; NoVLX-NEXT: shrq $32, %rdx
				; NoVLX-NEXT: vpinsrw $2, %edx, %xmm7, %xmm7
				; NoVLX-NEXT: movl %ecx, %edx
				; NoVLX-NEXT: shrl $16, %edx
	; NoVLX-NEXT: vmovd %ecx, %xmm3			; NoVLX-NEXT: vmovd %ecx, %xmm3
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $1, %edx, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rdx
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm3, %xmm3
	; NoVLX-NEXT: vpextrq $1, %xmm5, %rax			; NoVLX-NEXT: vpextrq $1, %xmm2, %rdx
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm2
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %edx, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $4, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rdx, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vmovq %xmm8, %rcx			; NoVLX-NEXT: vmovq %xmm1, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rdx
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm3			; NoVLX-NEXT: vpinsrw $7, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %edx
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %edx
	; NoVLX-NEXT: vmovd %ecx, %xmm5			; NoVLX-NEXT: vmovd %ecx, %xmm3
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $1, %edx, %xmm3, %xmm3
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rdx
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm3, %xmm3
	; NoVLX-NEXT: vpextrq $1, %xmm8, %rax			; NoVLX-NEXT: vpextrq $1, %xmm1, %rdx
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm3, %xmm1
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %edx, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $4, %edx, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rdx, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm5, %xmm5			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: vmovq %xmm1, %rcx			; NoVLX-NEXT: shrq $48, %rdx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: vpinsrw $7, %edx, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm5, %xmm5			; NoVLX-NEXT: vpextrq $1, %xmm6, %rcx
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: vinserti128 $1, %xmm9, %ymm4, %ymm3
	; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm1, %rax
	; NoVLX-NEXT: vinserti128 $1, %xmm9, %ymm4, %ymm8
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2
	; NoVLX-NEXT: vinserti128 $1, %xmm6, %ymm0, %ymm6			; NoVLX-NEXT: vinserti128 $1, %xmm5, %ymm0, %ymm5
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: vpmovdb %zmm0, %xmm0			; NoVLX-NEXT: vpmovdb %zmm0, %xmm0
	; NoVLX-NEXT: vinserti128 $1, %xmm7, %ymm3, %ymm4			; NoVLX-NEXT: vinserti128 $1, %xmm2, %ymm1, %ymm1
				; NoVLX-NEXT: vmovdqa {{.*#+}} ymm4 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]
				; NoVLX-NEXT: vpxor %ymm4, %ymm5, %ymm2
				; NoVLX-NEXT: vpxor %ymm4, %ymm1, %ymm1
				; NoVLX-NEXT: vpcmpgtw %ymm2, %ymm1, %ymm2
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k2} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k2} {z}
				; NoVLX-NEXT: shrq $48, %rax
				; NoVLX-NEXT: vpinsrw $3, %eax, %xmm7, %xmm5
				; NoVLX-NEXT: movl %ecx, %eax
				; NoVLX-NEXT: shrl $16, %eax
				; NoVLX-NEXT: vpinsrw $4, %ecx, %xmm5, %xmm5
				; NoVLX-NEXT: vpinsrw $5, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: vpmovdb %zmm1, %xmm1			; NoVLX-NEXT: vpmovdb %zmm1, %xmm1
				; NoVLX-NEXT: movq %rcx, %rax
				; NoVLX-NEXT: shrq $32, %rax
				; NoVLX-NEXT: vpinsrw $6, %eax, %xmm5, %xmm5
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $7, %ecx, %xmm5, %xmm5
	; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm2, %xmm2
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vinserti128 $1, %xmm5, %ymm2, %ymm2
	; NoVLX-NEXT: vmovdqa {{.*#+}} ymm5 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]
	; NoVLX-NEXT: vpxor %ymm5, %ymm6, %ymm3
	; NoVLX-NEXT: vpxor %ymm5, %ymm2, %ymm2
	; NoVLX-NEXT: vpcmpgtw %ymm3, %ymm2, %ymm2
	; NoVLX-NEXT: vpmovsxwd %ymm2, %zmm2			; NoVLX-NEXT: vpmovsxwd %ymm2, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2
	; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0			; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $13, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $14, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $14, %eax, %xmm2, %xmm2
				; NoVLX-NEXT: vinserti128 $1, %xmm8, %ymm5, %ymm5
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm2, %xmm3			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpxor %ymm5, %ymm8, %ymm2			; NoVLX-NEXT: vpxor %ymm4, %ymm3, %ymm3
	; NoVLX-NEXT: vpxor %ymm5, %ymm4, %ymm4			; NoVLX-NEXT: vpxor %ymm4, %ymm5, %ymm4
	; NoVLX-NEXT: vpcmpgtw %ymm2, %ymm4, %ymm2			; NoVLX-NEXT: vpcmpgtw %ymm3, %ymm4, %ymm3
	; NoVLX-NEXT: vpmovsxwd %ymm2, %zmm2			; NoVLX-NEXT: vpmovsxwd %ymm3, %zmm3
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2			; NoVLX-NEXT: vpslld $31, %zmm3, %zmm3
	; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0			; NoVLX-NEXT: vptestmd %zmm3, %zmm3, %k0
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm2			; NoVLX-NEXT: vmovd %ecx, %xmm3
	; NoVLX-NEXT: vpinsrb $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $1, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $2, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $2, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $3, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $3, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $6, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $6, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $9, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $9, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $10, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $10, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $13, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $14, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $14, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm3, %xmm3
	; NoVLX-NEXT: vpand %xmm1, %xmm2, %xmm1			; NoVLX-NEXT: vpand %xmm1, %xmm3, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpand %xmm0, %xmm3, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm2, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %ecx			; NoVLX-NEXT: movl (%rsp), %ecx
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 21 Lines
	; VLX-NEXT: vpcmpltuw (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuw (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultw_v32i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultw_v32i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1529:			; NoVLX-NEXT: .Lcfi1279:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1530:			; NoVLX-NEXT: .Lcfi1280:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1531:			; NoVLX-NEXT: .Lcfi1281:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movl %edi, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm1			; NoVLX-NEXT: vextracti32x4 $3, %zmm0, %xmm1
	; NoVLX-NEXT: vmovq %xmm1, %rax			; NoVLX-NEXT: vmovq %xmm1, %rax
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: movq %rax, %rdx			; NoVLX-NEXT: movq %rax, %rdx
	; NoVLX-NEXT: vmovd %eax, %xmm2			; NoVLX-NEXT: vmovd %eax, %xmm2
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm3
	; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm4
	; NoVLX-NEXT: shrq $32, %rdx			; NoVLX-NEXT: shrq $32, %rdx
	; NoVLX-NEXT: vpinsrw $2, %edx, %xmm2, %xmm2			; NoVLX-NEXT: vpinsrw $2, %edx, %xmm2, %xmm2
	; NoVLX-NEXT: vpextrq $1, %xmm1, %rax			; NoVLX-NEXT: vpextrq $1, %xmm1, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm1			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm2, %xmm1
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: vmovq %xmm4, %rcx			; NoVLX-NEXT: vextracti32x4 $2, %zmm0, %xmm3
				; NoVLX-NEXT: vmovq %xmm3, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm2			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm2
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	; NoVLX-NEXT: shrq $32, %rax			; NoVLX-NEXT: shrq $32, %rax
	; NoVLX-NEXT: vpinsrw $2, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $2, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpextrq $1, %xmm4, %rax			; NoVLX-NEXT: vpextrq $1, %xmm3, %rax
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm1, %xmm1
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm1, %xmm1
				; NoVLX-NEXT: vextracti32x4 $1, %zmm0, %xmm3
	; NoVLX-NEXT: vmovq %xmm3, %rcx			; NoVLX-NEXT: vmovq %xmm3, %rcx
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm4			; NoVLX-NEXT: vpinsrw $7, %eax, %xmm1, %xmm4
	; NoVLX-NEXT: movl %ecx, %eax			; NoVLX-NEXT: movl %ecx, %eax
	; NoVLX-NEXT: shrl $16, %eax			; NoVLX-NEXT: shrl $16, %eax
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrw $1, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrw $1, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: movq %rcx, %rax			; NoVLX-NEXT: movq %rcx, %rax
	Show All 23 Lines
	; NoVLX-NEXT: shrq $48, %rcx			; NoVLX-NEXT: shrq $48, %rcx
	; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm1, %xmm0			; NoVLX-NEXT: vpinsrw $3, %ecx, %xmm1, %xmm0
	; NoVLX-NEXT: movl %eax, %ecx			; NoVLX-NEXT: movl %eax, %ecx
	; NoVLX-NEXT: shrl $16, %ecx			; NoVLX-NEXT: shrl $16, %ecx
	; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrw $5, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: movq %rax, %rcx			; NoVLX-NEXT: movq %rax, %rcx
	; NoVLX-NEXT: shrq $32, %rcx			; NoVLX-NEXT: shrq $32, %rcx
	; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm6			; NoVLX-NEXT: vpinsrw $6, %ecx, %xmm0, %xmm3
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k1
	; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2			; NoVLX-NEXT: kmovw {{[0-9]+}}(%rsp), %k2
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: vpmovdb %zmm0, %xmm0			; NoVLX-NEXT: vpmovdb %zmm0, %xmm0
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k2} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k2} {z}
	; NoVLX-NEXT: vpmovdb %zmm1, %xmm1			; NoVLX-NEXT: vpmovdb %zmm1, %xmm1
	; NoVLX-NEXT: shrq $48, %rax			; NoVLX-NEXT: shrq $48, %rax
				; NoVLX-NEXT: vpinsrw $7, %eax, %xmm3, %xmm6
	; NoVLX-NEXT: vinserti128 $1, %xmm2, %ymm4, %ymm3			; NoVLX-NEXT: vinserti128 $1, %xmm2, %ymm4, %ymm3
	; NoVLX-NEXT: vpinsrw $7, %eax, %xmm6, %xmm2			; NoVLX-NEXT: vinserti128 $1, %xmm5, %ymm6, %ymm2
	; NoVLX-NEXT: vinserti128 $1, %xmm5, %ymm2, %ymm2
	; NoVLX-NEXT: vmovdqa {{.*#+}} ymm4 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]			; NoVLX-NEXT: vmovdqa {{.*#+}} ymm4 = [32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768,32768]
	; NoVLX-NEXT: vpxor %ymm4, %ymm2, %ymm2			; NoVLX-NEXT: vpxor %ymm4, %ymm2, %ymm2
	; NoVLX-NEXT: vpxor (%rsi), %ymm4, %ymm5			; NoVLX-NEXT: vpxor (%rsi), %ymm4, %ymm5
	; NoVLX-NEXT: vpcmpgtw %ymm2, %ymm5, %ymm2			; NoVLX-NEXT: vpcmpgtw %ymm2, %ymm5, %ymm2
	; NoVLX-NEXT: vpmovsxwd %ymm2, %zmm2			; NoVLX-NEXT: vpmovsxwd %ymm2, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm2
	; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0			; NoVLX-NEXT: vptestmd %zmm2, %zmm2, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	▲ Show 20 Lines • Show All 172 Lines • ▼ Show 20 Lines
	; NoVLX-LABEL: test_vpcmpultd_v4i1_v8i1_mask:			; NoVLX-LABEL: test_vpcmpultd_v4i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	Show All 40 Lines
	; NoVLX-LABEL: test_vpcmpultd_v4i1_v8i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultd_v4i1_v8i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; NoVLX-LABEL: test_masked_vpcmpultd_v4i1_v8i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultd_v4i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; NoVLX-LABEL: test_masked_vpcmpultd_v4i1_v8i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultd_v4i1_v8i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX-LABEL: test_vpcmpultd_v4i1_v16i1_mask:			; NoVLX-LABEL: test_vpcmpultd_v4i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 39 Lines
	; NoVLX-LABEL: test_vpcmpultd_v4i1_v16i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultd_v4i1_v16i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; NoVLX-LABEL: test_masked_vpcmpultd_v4i1_v16i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultd_v4i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; NoVLX-LABEL: test_masked_vpcmpultd_v4i1_v16i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultd_v4i1_v16i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 39 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltud %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpltud %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultd_v4i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpultd_v4i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1532:			; NoVLX-NEXT: .Lcfi1282:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1533:			; NoVLX-NEXT: .Lcfi1283:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1534:			; NoVLX-NEXT: .Lcfi1284:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 24 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltud (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpltud (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultd_v4i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultd_v4i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1535:			; NoVLX-NEXT: .Lcfi1285:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1536:			; NoVLX-NEXT: .Lcfi1286:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1537:			; NoVLX-NEXT: .Lcfi1287:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 26 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltud %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltud %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultd_v4i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultd_v4i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1538:			; NoVLX-NEXT: .Lcfi1288:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1539:			; NoVLX-NEXT: .Lcfi1289:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1540:			; NoVLX-NEXT: .Lcfi1290:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 23 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltud (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltud (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultd_v4i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultd_v4i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1541:			; NoVLX-NEXT: .Lcfi1291:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1542:			; NoVLX-NEXT: .Lcfi1292:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1543:			; NoVLX-NEXT: .Lcfi1293:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 24 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltud (%rdi){1to4}, %xmm0, %k0			; VLX-NEXT: vpcmpltud (%rdi){1to4}, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultd_v4i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpultd_v4i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1544:			; NoVLX-NEXT: .Lcfi1294:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1545:			; NoVLX-NEXT: .Lcfi1295:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1546:			; NoVLX-NEXT: .Lcfi1296:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	Show All 28 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltud (%rsi){1to4}, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltud (%rsi){1to4}, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultd_v4i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpultd_v4i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1547:			; NoVLX-NEXT: .Lcfi1297:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1548:			; NoVLX-NEXT: .Lcfi1298:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1549:			; NoVLX-NEXT: .Lcfi1299:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 25 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltud %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpltud %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultd_v4i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpultd_v4i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1550:			; NoVLX-NEXT: .Lcfi1300:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1551:			; NoVLX-NEXT: .Lcfi1301:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1552:			; NoVLX-NEXT: .Lcfi1302:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	Show All 30 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltud (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpltud (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultd_v4i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultd_v4i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1553:			; NoVLX-NEXT: .Lcfi1303:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1554:			; NoVLX-NEXT: .Lcfi1304:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1555:			; NoVLX-NEXT: .Lcfi1305:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [2147483648,2147483648,2147483648,2147483648]
				; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm2
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm2, %xmm0
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 25 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltud %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltud %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultd_v4i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultd_v4i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1556:			; NoVLX-NEXT: .Lcfi1306:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1557:			; NoVLX-NEXT: .Lcfi1307:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1558:			; NoVLX-NEXT: .Lcfi1308:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
				; NoVLX-NEXT: vpand %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 27 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltud (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltud (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultd_v4i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultd_v4i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1559:			; NoVLX-NEXT: .Lcfi1309:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1560:			; NoVLX-NEXT: .Lcfi1310:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1561:			; NoVLX-NEXT: .Lcfi1311:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
				; NoVLX-NEXT: vpand %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 28 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltud (%rdi){1to4}, %xmm0, %k0			; VLX-NEXT: vpcmpltud (%rdi){1to4}, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultd_v4i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpultd_v4i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1562:			; NoVLX-NEXT: .Lcfi1312:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1563:			; NoVLX-NEXT: .Lcfi1313:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1564:			; NoVLX-NEXT: .Lcfi1314:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %xmm1
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	Show All 34 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltud (%rsi){1to4}, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltud (%rsi){1to4}, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultd_v4i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpultd_v4i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1565:			; NoVLX-NEXT: .Lcfi1315:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1566:			; NoVLX-NEXT: .Lcfi1316:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1567:			; NoVLX-NEXT: .Lcfi1317:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %xmm1
	; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]			; NoVLX-NEXT: vpbroadcastd {{.*#+}} xmm2 = [2147483648,2147483648,2147483648,2147483648]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0
				; NoVLX-NEXT: vpand %xmm0, %xmm2, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	▲ Show 20 Lines • Show All 218 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpltud %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpltud %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultd_v8i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpultd_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1568:			; NoVLX-NEXT: .Lcfi1318:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1569:			; NoVLX-NEXT: .Lcfi1319:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1570:			; NoVLX-NEXT: .Lcfi1320:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>			; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 14 Lines
	; VLX-NEXT: vpcmpltud (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpltud (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultd_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultd_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1571:			; NoVLX-NEXT: .Lcfi1321:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1572:			; NoVLX-NEXT: .Lcfi1322:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1573:			; NoVLX-NEXT: .Lcfi1323:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vmovdqa (%rdi), %ymm1			; NoVLX-NEXT: vmovdqa (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 16 Lines
	; VLX-NEXT: vpcmpltud %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpltud %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultd_v8i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultd_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1574:			; NoVLX-NEXT: .Lcfi1324:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1575:			; NoVLX-NEXT: .Lcfi1325:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1576:			; NoVLX-NEXT: .Lcfi1326:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>			; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX-NEXT: vpcmpltud (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpltud (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultd_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultd_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1577:			; NoVLX-NEXT: .Lcfi1327:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1578:			; NoVLX-NEXT: .Lcfi1328:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1579:			; NoVLX-NEXT: .Lcfi1329:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vmovdqa (%rsi), %ymm1			; NoVLX-NEXT: vmovdqa (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 18 Lines
	; VLX-NEXT: vpcmpltud (%rdi){1to8}, %ymm0, %k0			; VLX-NEXT: vpcmpltud (%rdi){1to8}, %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultd_v8i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpultd_v8i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1580:			; NoVLX-NEXT: .Lcfi1330:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1581:			; NoVLX-NEXT: .Lcfi1331:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1582:			; NoVLX-NEXT: .Lcfi1332:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpbroadcastd (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX-NEXT: vpcmpltud (%rsi){1to8}, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpltud (%rsi){1to8}, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultd_v8i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpultd_v8i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1583:			; NoVLX-NEXT: .Lcfi1333:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1584:			; NoVLX-NEXT: .Lcfi1334:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1585:			; NoVLX-NEXT: .Lcfi1335:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpbroadcastd (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k0, %k1, %k0			; NoVLX-NEXT: kandw %k0, %k1, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 19 Lines
	; VLX-NEXT: vpcmpltud %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpltud %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultd_v8i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpultd_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1586:			; NoVLX-NEXT: .Lcfi1336:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1587:			; NoVLX-NEXT: .Lcfi1337:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1588:			; NoVLX-NEXT: .Lcfi1338:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>			; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpltud (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpltud (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultd_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultd_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1589:			; NoVLX-NEXT: .Lcfi1339:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1590:			; NoVLX-NEXT: .Lcfi1340:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1591:			; NoVLX-NEXT: .Lcfi1341:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vmovdqa (%rdi), %ymm1			; NoVLX-NEXT: vmovdqa (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpltud %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpltud %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultd_v8i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultd_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1592:			; NoVLX-NEXT: .Lcfi1342:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1593:			; NoVLX-NEXT: .Lcfi1343:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1594:			; NoVLX-NEXT: .Lcfi1344:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>			; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpltud (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpltud (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultd_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultd_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1595:			; NoVLX-NEXT: .Lcfi1345:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1596:			; NoVLX-NEXT: .Lcfi1346:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1597:			; NoVLX-NEXT: .Lcfi1347:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vmovdqa (%rsi), %ymm1			; NoVLX-NEXT: vmovdqa (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpltud (%rdi){1to8}, %ymm0, %k0			; VLX-NEXT: vpcmpltud (%rdi){1to8}, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultd_v8i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpultd_v8i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1598:			; NoVLX-NEXT: .Lcfi1348:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1599:			; NoVLX-NEXT: .Lcfi1349:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1600:			; NoVLX-NEXT: .Lcfi1350:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpbroadcastd (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastd (%rdi), %ymm1
	; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpltud (%rsi){1to8}, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpltud (%rsi){1to8}, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultd_v8i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpultd_v8i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1601:			; NoVLX-NEXT: .Lcfi1351:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1602:			; NoVLX-NEXT: .Lcfi1352:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1603:			; NoVLX-NEXT: .Lcfi1353:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vpbroadcastd (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastd (%rsi), %ymm1
	; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k0, %k1, %k0			; NoVLX-NEXT: kandw %k0, %k1, %k0
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0			; VLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultd_v16i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpultd_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1604:			; NoVLX-NEXT: .Lcfi1354:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1605:			; NoVLX-NEXT: .Lcfi1355:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1606:			; NoVLX-NEXT: .Lcfi1356:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1607:			; NoVLX-NEXT: .Lcfi1357:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1608:			; NoVLX-NEXT: .Lcfi1358:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1609:			; NoVLX-NEXT: .Lcfi1359:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1610:			; NoVLX-NEXT: .Lcfi1360:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1611:			; NoVLX-NEXT: .Lcfi1361:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 19 Lines
	; VLX-NEXT: vpcmpltud (%rdi), %zmm0, %k0			; VLX-NEXT: vpcmpltud (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultd_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultd_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1612:			; NoVLX-NEXT: .Lcfi1362:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1613:			; NoVLX-NEXT: .Lcfi1363:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1614:			; NoVLX-NEXT: .Lcfi1364:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1615:			; NoVLX-NEXT: .Lcfi1365:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1616:			; NoVLX-NEXT: .Lcfi1366:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1617:			; NoVLX-NEXT: .Lcfi1367:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1618:			; NoVLX-NEXT: .Lcfi1368:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1619:			; NoVLX-NEXT: .Lcfi1369:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpltud (%rdi), %zmm0, %k0			; NoVLX-NEXT: vpcmpltud (%rdi), %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 21 Lines
	; VLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultd_v16i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultd_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1620:			; NoVLX-NEXT: .Lcfi1370:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1621:			; NoVLX-NEXT: .Lcfi1371:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1622:			; NoVLX-NEXT: .Lcfi1372:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1623:			; NoVLX-NEXT: .Lcfi1373:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1624:			; NoVLX-NEXT: .Lcfi1374:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1625:			; NoVLX-NEXT: .Lcfi1375:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1626:			; NoVLX-NEXT: .Lcfi1376:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1627:			; NoVLX-NEXT: .Lcfi1377:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 22 Lines
	; VLX-NEXT: vpcmpltud (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltud (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultd_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultd_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1628:			; NoVLX-NEXT: .Lcfi1378:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1629:			; NoVLX-NEXT: .Lcfi1379:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1630:			; NoVLX-NEXT: .Lcfi1380:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1631:			; NoVLX-NEXT: .Lcfi1381:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1632:			; NoVLX-NEXT: .Lcfi1382:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1633:			; NoVLX-NEXT: .Lcfi1383:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1634:			; NoVLX-NEXT: .Lcfi1384:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1635:			; NoVLX-NEXT: .Lcfi1385:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpltud (%rsi), %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpltud (%rsi), %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 23 Lines
	; VLX-NEXT: vpcmpltud (%rdi){1to16}, %zmm0, %k0			; VLX-NEXT: vpcmpltud (%rdi){1to16}, %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultd_v16i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpultd_v16i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1636:			; NoVLX-NEXT: .Lcfi1386:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1637:			; NoVLX-NEXT: .Lcfi1387:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1638:			; NoVLX-NEXT: .Lcfi1388:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1639:			; NoVLX-NEXT: .Lcfi1389:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1640:			; NoVLX-NEXT: .Lcfi1390:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1641:			; NoVLX-NEXT: .Lcfi1391:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1642:			; NoVLX-NEXT: .Lcfi1392:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1643:			; NoVLX-NEXT: .Lcfi1393:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpltud (%rdi){1to16}, %zmm0, %k0			; NoVLX-NEXT: vpcmpltud (%rdi){1to16}, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 22 Lines
	; VLX-NEXT: vpcmpltud (%rsi){1to16}, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltud (%rsi){1to16}, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultd_v16i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpultd_v16i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1644:			; NoVLX-NEXT: .Lcfi1394:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1645:			; NoVLX-NEXT: .Lcfi1395:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1646:			; NoVLX-NEXT: .Lcfi1396:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1647:			; NoVLX-NEXT: .Lcfi1397:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1648:			; NoVLX-NEXT: .Lcfi1398:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1649:			; NoVLX-NEXT: .Lcfi1399:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1650:			; NoVLX-NEXT: .Lcfi1400:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1651:			; NoVLX-NEXT: .Lcfi1401:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpltud (%rsi){1to16}, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpltud (%rsi){1to16}, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 24 Lines
	; VLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0			; VLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultd_v16i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpultd_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1652:			; NoVLX-NEXT: .Lcfi1402:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1653:			; NoVLX-NEXT: .Lcfi1403:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1654:			; NoVLX-NEXT: .Lcfi1404:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1655:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1656:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1657:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1658:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1659:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%1 = bitcast <8 x i64> %__b to <16 x i32>			%1 = bitcast <8 x i64> %__b to <16 x i32>
	%2 = icmp ult <16 x i32> %0, %1			%2 = icmp ult <16 x i32> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0,i32 1,i32 2,i32 3,i32 4,i32 5,i32 6,i32 7,i32 8,i32 9,i32 10,i32 11,i32 12,i32 13,i32 14,i32 15,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0,i32 1,i32 2,i32 3,i32 4,i32 5,i32 6,i32 7,i32 8,i32 9,i32 10,i32 11,i32 12,i32 13,i32 14,i32 15,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_vpcmpultd_v16i1_v64i1_mask_mem(<8 x i64> %__a, <8 x i64>* %__b) local_unnamed_addr {			define zeroext i64 @test_vpcmpultd_v16i1_v64i1_mask_mem(<8 x i64> %__a, <8 x i64>* %__b) local_unnamed_addr {
	; VLX-LABEL: test_vpcmpultd_v16i1_v64i1_mask_mem:			; VLX-LABEL: test_vpcmpultd_v16i1_v64i1_mask_mem:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltud (%rdi), %zmm0, %k0			; VLX-NEXT: vpcmpltud (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultd_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultd_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1660:			; NoVLX-NEXT: .Lcfi1405:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1661:			; NoVLX-NEXT: .Lcfi1406:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1662:			; NoVLX-NEXT: .Lcfi1407:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1663:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1664:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1665:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1666:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1667:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpltud (%rdi), %zmm0, %k0			; NoVLX-NEXT: vpcmpltud (%rdi), %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%load = load <8 x i64>, <8 x i64>* %__b			%load = load <8 x i64>, <8 x i64>* %__b
	%1 = bitcast <8 x i64> %load to <16 x i32>			%1 = bitcast <8 x i64> %load to <16 x i32>
	%2 = icmp ult <16 x i32> %0, %1			%2 = icmp ult <16 x i32> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0,i32 1,i32 2,i32 3,i32 4,i32 5,i32 6,i32 7,i32 8,i32 9,i32 10,i32 11,i32 12,i32 13,i32 14,i32 15,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0,i32 1,i32 2,i32 3,i32 4,i32 5,i32 6,i32 7,i32 8,i32 9,i32 10,i32 11,i32 12,i32 13,i32 14,i32 15,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_masked_vpcmpultd_v16i1_v64i1_mask(i16 zeroext %__u, <8 x i64> %__a, <8 x i64> %__b) local_unnamed_addr {			define zeroext i64 @test_masked_vpcmpultd_v16i1_v64i1_mask(i16 zeroext %__u, <8 x i64> %__a, <8 x i64> %__b) local_unnamed_addr {
	; VLX-LABEL: test_masked_vpcmpultd_v16i1_v64i1_mask:			; VLX-LABEL: test_masked_vpcmpultd_v16i1_v64i1_mask:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultd_v16i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultd_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1668:			; NoVLX-NEXT: .Lcfi1408:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1669:			; NoVLX-NEXT: .Lcfi1409:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1670:			; NoVLX-NEXT: .Lcfi1410:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1671:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1672:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1673:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1674:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1675:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpltud %zmm1, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%1 = bitcast <8 x i64> %__b to <16 x i32>			%1 = bitcast <8 x i64> %__b to <16 x i32>
	%2 = icmp ult <16 x i32> %0, %1			%2 = icmp ult <16 x i32> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	%4 = and <16 x i1> %2, %3			%4 = and <16 x i1> %2, %3
	Show All 9 Lines
	; VLX-NEXT: vpcmpltud (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltud (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultd_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultd_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1676:			; NoVLX-NEXT: .Lcfi1411:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1677:			; NoVLX-NEXT: .Lcfi1412:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1678:			; NoVLX-NEXT: .Lcfi1413:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1679:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1680:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1681:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1682:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1683:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpltud (%rsi), %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpltud (%rsi), %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%load = load <8 x i64>, <8 x i64>* %__b			%load = load <8 x i64>, <8 x i64>* %__b
	%1 = bitcast <8 x i64> %load to <16 x i32>			%1 = bitcast <8 x i64> %load to <16 x i32>
	%2 = icmp ult <16 x i32> %0, %1			%2 = icmp ult <16 x i32> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	Show All 10 Lines
	; VLX-NEXT: vpcmpltud (%rdi){1to16}, %zmm0, %k0			; VLX-NEXT: vpcmpltud (%rdi){1to16}, %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultd_v16i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpultd_v16i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1684:			; NoVLX-NEXT: .Lcfi1414:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1685:			; NoVLX-NEXT: .Lcfi1415:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1686:			; NoVLX-NEXT: .Lcfi1416:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1687:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1688:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1689:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1690:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1691:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vpcmpltud (%rdi){1to16}, %zmm0, %k0			; NoVLX-NEXT: vpcmpltud (%rdi){1to16}, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%load = load i32, i32* %__b			%load = load i32, i32* %__b
	%vec = insertelement <16 x i32> undef, i32 %load, i32 0			%vec = insertelement <16 x i32> undef, i32 %load, i32 0
	%1 = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%1 = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	%2 = icmp ult <16 x i32> %0, %1			%2 = icmp ult <16 x i32> %0, %1
	Show All 9 Lines
	; VLX-NEXT: vpcmpltud (%rsi){1to16}, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltud (%rsi){1to16}, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultd_v16i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpultd_v16i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1692:			; NoVLX-NEXT: .Lcfi1417:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1693:			; NoVLX-NEXT: .Lcfi1418:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1694:			; NoVLX-NEXT: .Lcfi1419:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1695:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1696:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1697:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1698:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1699:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpltud (%rsi){1to16}, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpltud (%rsi){1to16}, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x i32>			%0 = bitcast <8 x i64> %__a to <16 x i32>
	%load = load i32, i32* %__b			%load = load i32, i32* %__b
	%vec = insertelement <16 x i32> undef, i32 %load, i32 0			%vec = insertelement <16 x i32> undef, i32 %load, i32 0
	%1 = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%1 = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	%2 = icmp ult <16 x i32> %0, %1			%2 = icmp ult <16 x i32> %0, %1
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpltuq (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpltuq (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovb %k0, -{{[0-9]+}}(%rsp)			; VLX-NEXT: kmovb %k0, -{{[0-9]+}}(%rsp)
	; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultq_v2i1_v4i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultq_v2i1_v4i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
				; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm2
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm2, %xmm0
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero			; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero
	; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0			; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	Show All 15 Lines
	; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v2i1_v4i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultq_v2i1_v4i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
				; NoVLX-NEXT: vpand %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero			; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero
	; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0			; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	Show All 17 Lines
	; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v2i1_v4i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultq_v2i1_v4i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
				; NoVLX-NEXT: vpand %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero			; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero
	; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0			; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v2i1_v4i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpultq_v2i1_v4i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
				; NoVLX-NEXT: vpand %xmm0, %xmm2, %xmm0
	; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero			; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero
	; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0			; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	Show All 22 Lines
	; NoVLX-LABEL: test_vpcmpultq_v2i1_v8i1_mask:			; NoVLX-LABEL: test_vpcmpultq_v2i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%1 = bitcast <2 x i64> %__b to <2 x i64>			%1 = bitcast <2 x i64> %__b to <2 x i64>
	Show All 14 Lines
	; NoVLX-LABEL: test_vpcmpultq_v2i1_v8i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultq_v2i1_v8i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	Show All 26 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%1 = bitcast <2 x i64> %__b to <2 x i64>			%1 = bitcast <2 x i64> %__b to <2 x i64>
	Show All 28 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	Show All 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load i64, i64* %__b			%load = load i64, i64* %__b
	Show All 28 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load i64, i64* %__b			%load = load i64, i64* %__b
	Show All 20 Lines
	; NoVLX-LABEL: test_vpcmpultq_v2i1_v16i1_mask:			; NoVLX-LABEL: test_vpcmpultq_v2i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%1 = bitcast <2 x i64> %__b to <2 x i64>			%1 = bitcast <2 x i64> %__b to <2 x i64>
	Show All 14 Lines
	; NoVLX-LABEL: test_vpcmpultq_v2i1_v16i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultq_v2i1_v16i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	Show All 26 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%1 = bitcast <2 x i64> %__b to <2 x i64>			%1 = bitcast <2 x i64> %__b to <2 x i64>
	Show All 28 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	Show All 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load i64, i64* %__b			%load = load i64, i64* %__b
	Show All 28 Lines
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x i64>			%0 = bitcast <2 x i64> %__a to <2 x i64>
	%load = load i64, i64* %__b			%load = load i64, i64* %__b
	Show All 14 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltuq %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpltuq %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultq_v2i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpultq_v2i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1700:			; NoVLX-NEXT: .Lcfi1420:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1701:			; NoVLX-NEXT: .Lcfi1421:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1702:			; NoVLX-NEXT: .Lcfi1422:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 24 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltuq (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpltuq (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultq_v2i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultq_v2i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1703:			; NoVLX-NEXT: .Lcfi1423:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1704:			; NoVLX-NEXT: .Lcfi1424:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1705:			; NoVLX-NEXT: .Lcfi1425:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 26 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltuq %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuq %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v2i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultq_v2i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1706:			; NoVLX-NEXT: .Lcfi1426:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1707:			; NoVLX-NEXT: .Lcfi1427:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1708:			; NoVLX-NEXT: .Lcfi1428:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	Show All 38 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltuq (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuq (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v2i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultq_v2i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1709:			; NoVLX-NEXT: .Lcfi1429:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1710:			; NoVLX-NEXT: .Lcfi1430:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1711:			; NoVLX-NEXT: .Lcfi1431:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	Show All 39 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltuq (%rdi){1to2}, %xmm0, %k0			; VLX-NEXT: vpcmpltuq (%rdi){1to2}, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultq_v2i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpultq_v2i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1712:			; NoVLX-NEXT: .Lcfi1432:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1713:			; NoVLX-NEXT: .Lcfi1433:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1714:			; NoVLX-NEXT: .Lcfi1434:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	Show All 28 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltuq (%rsi){1to2}, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuq (%rsi){1to2}, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v2i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpultq_v2i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1715:			; NoVLX-NEXT: .Lcfi1435:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1716:			; NoVLX-NEXT: .Lcfi1436:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1717:			; NoVLX-NEXT: .Lcfi1437:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltuq %xmm1, %xmm0, %k0			; VLX-NEXT: vpcmpltuq %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultq_v2i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpultq_v2i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1718:			; NoVLX-NEXT: .Lcfi1438:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1719:			; NoVLX-NEXT: .Lcfi1439:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1720:			; NoVLX-NEXT: .Lcfi1440:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	Show All 30 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltuq (%rdi), %xmm0, %k0			; VLX-NEXT: vpcmpltuq (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultq_v2i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultq_v2i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1721:			; NoVLX-NEXT: .Lcfi1441:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1722:			; NoVLX-NEXT: .Lcfi1442:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1723:			; NoVLX-NEXT: .Lcfi1443:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
				; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm2
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rdi), %xmm1, %xmm1			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm2, %xmm0
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 25 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltuq %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuq %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v2i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultq_v2i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1724:			; NoVLX-NEXT: .Lcfi1444:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1725:			; NoVLX-NEXT: .Lcfi1445:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1726:			; NoVLX-NEXT: .Lcfi1446:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
				; NoVLX-NEXT: vpand %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 27 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltuq (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuq (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v2i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultq_v2i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1727:			; NoVLX-NEXT: .Lcfi1447:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1728:			; NoVLX-NEXT: .Lcfi1448:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1729:			; NoVLX-NEXT: .Lcfi1449:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1			; NoVLX-NEXT: vpxor (%rsi), %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
				; NoVLX-NEXT: vpand %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 28 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vpcmpltuq (%rdi){1to2}, %xmm0, %k0			; VLX-NEXT: vpcmpltuq (%rdi){1to2}, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultq_v2i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpultq_v2i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1730:			; NoVLX-NEXT: .Lcfi1450:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1731:			; NoVLX-NEXT: .Lcfi1451:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1732:			; NoVLX-NEXT: .Lcfi1452:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %xmm1
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	Show All 34 Lines
	; VLX-NEXT: kmovd %edi, %k1			; VLX-NEXT: kmovd %edi, %k1
	; VLX-NEXT: vpcmpltuq (%rsi){1to2}, %xmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuq (%rsi){1to2}, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v2i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpultq_v2i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1733:			; NoVLX-NEXT: .Lcfi1453:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1734:			; NoVLX-NEXT: .Lcfi1454:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1735:			; NoVLX-NEXT: .Lcfi1455:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %xmm1
	; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; NoVLX-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm2
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm2, %xmm2
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
				; NoVLX-NEXT: vpand %xmm0, %xmm2, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	Show All 37 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm1 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm1 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor (%rdi), %ymm1, %ymm1			; NoVLX-NEXT: vpxor (%rdi), %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm1 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm1 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor (%rsi), %ymm1, %ymm1			; NoVLX-NEXT: vpxor (%rsi), %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm1 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm1 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor (%rdi), %ymm1, %ymm1			; NoVLX-NEXT: vpxor (%rdi), %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm1 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm1 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor (%rsi), %ymm1, %ymm1			; NoVLX-NEXT: vpxor (%rsi), %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 40 Lines
	; VLX-NEXT: vpcmpltuq %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpltuq %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultq_v4i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpultq_v4i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1736:			; NoVLX-NEXT: .Lcfi1456:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1737:			; NoVLX-NEXT: .Lcfi1457:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1738:			; NoVLX-NEXT: .Lcfi1458:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	Show All 26 Lines
	; VLX-NEXT: vpcmpltuq (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpltuq (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultq_v4i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultq_v4i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1739:			; NoVLX-NEXT: .Lcfi1459:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1740:			; NoVLX-NEXT: .Lcfi1460:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1741:			; NoVLX-NEXT: .Lcfi1461:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm1 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm1 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor (%rdi), %ymm1, %ymm1			; NoVLX-NEXT: vpxor (%rdi), %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	Show All 28 Lines
	; VLX-NEXT: vpcmpltuq %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuq %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v4i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultq_v4i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1742:			; NoVLX-NEXT: .Lcfi1462:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1743:			; NoVLX-NEXT: .Lcfi1463:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1744:			; NoVLX-NEXT: .Lcfi1464:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 24 Lines
	; VLX-NEXT: vpcmpltuq (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuq (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v4i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultq_v4i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1745:			; NoVLX-NEXT: .Lcfi1465:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1746:			; NoVLX-NEXT: .Lcfi1466:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1747:			; NoVLX-NEXT: .Lcfi1467:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm1 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm1 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor (%rsi), %ymm1, %ymm1			; NoVLX-NEXT: vpxor (%rsi), %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 25 Lines
	; VLX-NEXT: vpcmpltuq (%rdi){1to4}, %ymm0, %k0			; VLX-NEXT: vpcmpltuq (%rdi){1to4}, %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultq_v4i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpultq_v4i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1748:			; NoVLX-NEXT: .Lcfi1468:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1749:			; NoVLX-NEXT: .Lcfi1469:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1750:			; NoVLX-NEXT: .Lcfi1470:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	Show All 30 Lines
	; VLX-NEXT: vpcmpltuq (%rsi){1to4}, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuq (%rsi){1to4}, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v4i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpultq_v4i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1751:			; NoVLX-NEXT: .Lcfi1471:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1752:			; NoVLX-NEXT: .Lcfi1472:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1753:			; NoVLX-NEXT: .Lcfi1473:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kshiftrw $15, %k1, %k0
				; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0			; NoVLX-NEXT: vptestmd %zmm1, %zmm1, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 26 Lines
	; VLX-NEXT: vpcmpltuq %ymm1, %ymm0, %k0			; VLX-NEXT: vpcmpltuq %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultq_v4i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpultq_v4i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1754:			; NoVLX-NEXT: .Lcfi1474:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1755:			; NoVLX-NEXT: .Lcfi1475:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1756:			; NoVLX-NEXT: .Lcfi1476:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	Show All 32 Lines
	; VLX-NEXT: vpcmpltuq (%rdi), %ymm0, %k0			; VLX-NEXT: vpcmpltuq (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultq_v4i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultq_v4i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1757:			; NoVLX-NEXT: .Lcfi1477:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1758:			; NoVLX-NEXT: .Lcfi1478:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1759:			; NoVLX-NEXT: .Lcfi1479:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm1 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm1 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor (%rdi), %ymm1, %ymm1			; NoVLX-NEXT: vpxor (%rdi), %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	Show All 34 Lines
	; VLX-NEXT: vpcmpltuq %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuq %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v4i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultq_v4i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1760:			; NoVLX-NEXT: .Lcfi1480:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1761:			; NoVLX-NEXT: .Lcfi1481:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1762:			; NoVLX-NEXT: .Lcfi1482:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
				; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 29 Lines
	; VLX-NEXT: vpcmpltuq (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuq (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v4i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultq_v4i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1763:			; NoVLX-NEXT: .Lcfi1483:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1764:			; NoVLX-NEXT: .Lcfi1484:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1765:			; NoVLX-NEXT: .Lcfi1485:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm1 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm1 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
				; NoVLX-NEXT: vpxor (%rsi), %ymm1, %ymm2
	; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor (%rsi), %ymm1, %ymm1			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm2, %ymm0
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
				; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 30 Lines
	; VLX-NEXT: vpcmpltuq (%rdi){1to4}, %ymm0, %k0			; VLX-NEXT: vpcmpltuq (%rdi){1to4}, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultq_v4i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpultq_v4i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1766:			; NoVLX-NEXT: .Lcfi1486:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1767:			; NoVLX-NEXT: .Lcfi1487:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1768:			; NoVLX-NEXT: .Lcfi1488:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rdi), %ymm1
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	Show All 36 Lines
	; VLX-NEXT: vpcmpltuq (%rsi){1to4}, %ymm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuq (%rsi){1to4}, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v4i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpultq_v4i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1769:			; NoVLX-NEXT: .Lcfi1489:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1770:			; NoVLX-NEXT: .Lcfi1490:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1771:			; NoVLX-NEXT: .Lcfi1491:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1			; NoVLX-NEXT: vpbroadcastq (%rsi), %ymm1
	; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; NoVLX-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1			; NoVLX-NEXT: vpxor %ymm2, %ymm1, %ymm1
	; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0			; NoVLX-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kmovw %edi, %k0			; NoVLX-NEXT: kmovw %edi, %k0
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kshiftlw $13, %k0, %k2			; NoVLX-NEXT: kshiftlw $13, %k0, %k2
	; NoVLX-NEXT: kshiftrw $15, %k2, %k2			; NoVLX-NEXT: kshiftrw $15, %k2, %k2
	; NoVLX-NEXT: kshiftlw $15, %k0, %k3			; NoVLX-NEXT: kshiftlw $15, %k0, %k3
	; NoVLX-NEXT: kshiftrw $15, %k3, %k3			; NoVLX-NEXT: kshiftrw $15, %k3, %k3
	; NoVLX-NEXT: kshiftlw $14, %k0, %k0			; NoVLX-NEXT: kshiftlw $14, %k0, %k0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: kmovw %k3, %ecx			; NoVLX-NEXT: kmovw %k3, %ecx
	; NoVLX-NEXT: vmovd %ecx, %xmm1			; NoVLX-NEXT: vmovd %ecx, %xmm1
	; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $4, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k2, %eax			; NoVLX-NEXT: kmovw %k2, %eax
	; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $8, %eax, %xmm1, %xmm1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1			; NoVLX-NEXT: vpinsrb $12, %eax, %xmm1, %xmm1
				; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0			; NoVLX-NEXT: vpand %xmm0, %xmm1, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	▲ Show 20 Lines • Show All 195 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpltuq %zmm1, %zmm0, %k0			; VLX-NEXT: vpcmpltuq %zmm1, %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultq_v8i1_v32i1_mask:			; NoVLX-LABEL: test_vpcmpultq_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1772:			; NoVLX-NEXT: .Lcfi1492:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1773:			; NoVLX-NEXT: .Lcfi1493:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1774:			; NoVLX-NEXT: .Lcfi1494:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpltuq %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpltuq %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 14 Lines
	; VLX-NEXT: vpcmpltuq (%rdi), %zmm0, %k0			; VLX-NEXT: vpcmpltuq (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultq_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultq_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1775:			; NoVLX-NEXT: .Lcfi1495:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1776:			; NoVLX-NEXT: .Lcfi1496:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1777:			; NoVLX-NEXT: .Lcfi1497:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpltuq (%rdi), %zmm0, %k0			; NoVLX-NEXT: vpcmpltuq (%rdi), %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 16 Lines
	; VLX-NEXT: vpcmpltuq %zmm1, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuq %zmm1, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v8i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultq_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1778:			; NoVLX-NEXT: .Lcfi1498:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1779:			; NoVLX-NEXT: .Lcfi1499:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1780:			; NoVLX-NEXT: .Lcfi1500:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpltuq %zmm1, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpltuq %zmm1, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX-NEXT: vpcmpltuq (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuq (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultq_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1781:			; NoVLX-NEXT: .Lcfi1501:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1782:			; NoVLX-NEXT: .Lcfi1502:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1783:			; NoVLX-NEXT: .Lcfi1503:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpltuq (%rsi), %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpltuq (%rsi), %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 18 Lines
	; VLX-NEXT: vpcmpltuq (%rdi){1to8}, %zmm0, %k0			; VLX-NEXT: vpcmpltuq (%rdi){1to8}, %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultq_v8i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpultq_v8i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1784:			; NoVLX-NEXT: .Lcfi1504:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1785:			; NoVLX-NEXT: .Lcfi1505:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1786:			; NoVLX-NEXT: .Lcfi1506:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vpcmpltuq (%rdi){1to8}, %zmm0, %k0			; NoVLX-NEXT: vpcmpltuq (%rdi){1to8}, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX-NEXT: vpcmpltuq (%rsi){1to8}, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuq (%rsi){1to8}, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v8i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpultq_v8i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1787:			; NoVLX-NEXT: .Lcfi1507:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1788:			; NoVLX-NEXT: .Lcfi1508:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1789:			; NoVLX-NEXT: .Lcfi1509:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpltuq (%rsi){1to8}, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpltuq (%rsi){1to8}, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vpxor %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 19 Lines
	; VLX-NEXT: vpcmpltuq %zmm1, %zmm0, %k0			; VLX-NEXT: vpcmpltuq %zmm1, %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultq_v8i1_v64i1_mask:			; NoVLX-LABEL: test_vpcmpultq_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1790:			; NoVLX-NEXT: .Lcfi1510:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1791:			; NoVLX-NEXT: .Lcfi1511:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1792:			; NoVLX-NEXT: .Lcfi1512:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpltuq %zmm1, %zmm0, %k0			; NoVLX-NEXT: vpcmpltuq %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpltuq (%rdi), %zmm0, %k0			; VLX-NEXT: vpcmpltuq (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultq_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vpcmpultq_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1793:			; NoVLX-NEXT: .Lcfi1513:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1794:			; NoVLX-NEXT: .Lcfi1514:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1795:			; NoVLX-NEXT: .Lcfi1515:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpltuq (%rdi), %zmm0, %k0			; NoVLX-NEXT: vpcmpltuq (%rdi), %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpltuq %zmm1, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuq %zmm1, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v8i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vpcmpultq_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1796:			; NoVLX-NEXT: .Lcfi1516:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1797:			; NoVLX-NEXT: .Lcfi1517:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1798:			; NoVLX-NEXT: .Lcfi1518:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpltuq %zmm1, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpltuq %zmm1, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpltuq (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuq (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vpcmpultq_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1799:			; NoVLX-NEXT: .Lcfi1519:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1800:			; NoVLX-NEXT: .Lcfi1520:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1801:			; NoVLX-NEXT: .Lcfi1521:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpltuq (%rsi), %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpltuq (%rsi), %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpltuq (%rdi){1to8}, %zmm0, %k0			; VLX-NEXT: vpcmpltuq (%rdi){1to8}, %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vpcmpultq_v8i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vpcmpultq_v8i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1802:			; NoVLX-NEXT: .Lcfi1522:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1803:			; NoVLX-NEXT: .Lcfi1523:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1804:			; NoVLX-NEXT: .Lcfi1524:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vpcmpltuq (%rdi){1to8}, %zmm0, %k0			; NoVLX-NEXT: vpcmpltuq (%rdi){1to8}, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vpcmpltuq (%rsi){1to8}, %zmm0, %k0 {%k1}			; VLX-NEXT: vpcmpltuq (%rsi){1to8}, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vpcmpultq_v8i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vpcmpultq_v8i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1805:			; NoVLX-NEXT: .Lcfi1525:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1806:			; NoVLX-NEXT: .Lcfi1526:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1807:			; NoVLX-NEXT: .Lcfi1527:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vpcmpltuq (%rsi){1to8}, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vpcmpltuq (%rsi){1to8}, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v4i1_v8i1_mask:			; NoVLX-LABEL: test_vcmpoeqps_v4i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	Show All 37 Lines
	; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v4i1_v8i1_mask_mem:			; NoVLX-LABEL: test_vcmpoeqps_v4i1_v8i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vcmpeqps (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqps (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	Show All 39 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v4i1_v8i1_mask_mem_b:			; NoVLX-LABEL: test_vcmpoeqps_v4i1_v8i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vbroadcastss (%rdi), %xmm1			; NoVLX-NEXT: vbroadcastss (%rdi), %xmm1
	; NoVLX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm2, %ymm2			; NoVLX-NEXT: vpmovqd %zmm2, %ymm2
	; NoVLX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vandps %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vandps %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm1, %ymm1			; NoVLX-NEXT: vpmovqd %zmm1, %ymm1
	; NoVLX-NEXT: vcmpeqps (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqps (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: vandps %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vandps %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm1, %ymm1			; NoVLX-NEXT: vpmovqd %zmm1, %ymm1
	; NoVLX-NEXT: vbroadcastss (%rsi), %xmm2			; NoVLX-NEXT: vbroadcastss (%rsi), %xmm2
	; NoVLX-NEXT: vcmpeqps %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqps %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vandps %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vandps %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v4i1_v16i1_mask:			; NoVLX-LABEL: test_vcmpoeqps_v4i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 36 Lines
	; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v4i1_v16i1_mask_mem:			; NoVLX-LABEL: test_vcmpoeqps_v4i1_v16i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vcmpeqps (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqps (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 38 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v4i1_v16i1_mask_mem_b:			; NoVLX-LABEL: test_vcmpoeqps_v4i1_v16i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vbroadcastss (%rdi), %xmm1			; NoVLX-NEXT: vbroadcastss (%rdi), %xmm1
	; NoVLX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm2, %ymm2			; NoVLX-NEXT: vpmovqd %zmm2, %ymm2
	; NoVLX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vandps %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vandps %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm1, %ymm1			; NoVLX-NEXT: vpmovqd %zmm1, %ymm1
	; NoVLX-NEXT: vcmpeqps (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqps (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: vandps %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vandps %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm1, %ymm1			; NoVLX-NEXT: vpmovqd %zmm1, %ymm1
	; NoVLX-NEXT: vbroadcastss (%rsi), %xmm2			; NoVLX-NEXT: vbroadcastss (%rsi), %xmm2
	; NoVLX-NEXT: vcmpeqps %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqps %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vandps %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vandps %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 39 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vcmpeqps %xmm1, %xmm0, %k0			; VLX-NEXT: vcmpeqps %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v4i1_v32i1_mask:			; NoVLX-LABEL: test_vcmpoeqps_v4i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1808:			; NoVLX-NEXT: .Lcfi1528:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1809:			; NoVLX-NEXT: .Lcfi1529:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1810:			; NoVLX-NEXT: .Lcfi1530:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 21 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vcmpeqps (%rdi), %xmm0, %k0			; VLX-NEXT: vcmpeqps (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v4i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vcmpoeqps_v4i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1811:			; NoVLX-NEXT: .Lcfi1531:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1812:			; NoVLX-NEXT: .Lcfi1532:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1813:			; NoVLX-NEXT: .Lcfi1533:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vcmpeqps (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqps (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 22 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vcmpeqps (%rdi){1to4}, %xmm0, %k0			; VLX-NEXT: vcmpeqps (%rdi){1to4}, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v4i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vcmpoeqps_v4i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1814:			; NoVLX-NEXT: .Lcfi1534:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1815:			; NoVLX-NEXT: .Lcfi1535:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1816:			; NoVLX-NEXT: .Lcfi1536:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vbroadcastss (%rdi), %xmm1			; NoVLX-NEXT: vbroadcastss (%rdi), %xmm1
	; NoVLX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	Show All 26 Lines
	; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1			; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1
	; VLX-NEXT: vcmpeqps %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqps %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqps_v4i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vcmpoeqps_v4i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1817:			; NoVLX-NEXT: .Lcfi1537:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1818:			; NoVLX-NEXT: .Lcfi1538:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1819:			; NoVLX-NEXT: .Lcfi1539:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm2, %ymm2			; NoVLX-NEXT: vpmovqd %zmm2, %ymm2
	Show All 31 Lines
	; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1			; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1
	; VLX-NEXT: vcmpeqps (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqps (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqps_v4i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vcmpoeqps_v4i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1820:			; NoVLX-NEXT: .Lcfi1540:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1821:			; NoVLX-NEXT: .Lcfi1541:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1822:			; NoVLX-NEXT: .Lcfi1542:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm1, %ymm1			; NoVLX-NEXT: vpmovqd %zmm1, %ymm1
	Show All 32 Lines
	; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1			; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1
	; VLX-NEXT: vcmpeqps (%rsi){1to4}, %xmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqps (%rsi){1to4}, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqps_v4i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vcmpoeqps_v4i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1823:			; NoVLX-NEXT: .Lcfi1543:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1824:			; NoVLX-NEXT: .Lcfi1544:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1825:			; NoVLX-NEXT: .Lcfi1545:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm1, %ymm1			; NoVLX-NEXT: vpmovqd %zmm1, %ymm1
	Show All 34 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vcmpeqps %xmm1, %xmm0, %k0			; VLX-NEXT: vcmpeqps %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v4i1_v64i1_mask:			; NoVLX-LABEL: test_vcmpoeqps_v4i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1826:			; NoVLX-NEXT: .Lcfi1546:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1827:			; NoVLX-NEXT: .Lcfi1547:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1828:			; NoVLX-NEXT: .Lcfi1548:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 27 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vcmpeqps (%rdi), %xmm0, %k0			; VLX-NEXT: vcmpeqps (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v4i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vcmpoeqps_v4i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1829:			; NoVLX-NEXT: .Lcfi1549:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1830:			; NoVLX-NEXT: .Lcfi1550:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1831:			; NoVLX-NEXT: .Lcfi1551:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vcmpeqps (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqps (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 28 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vcmpeqps (%rdi){1to4}, %xmm0, %k0			; VLX-NEXT: vcmpeqps (%rdi){1to4}, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v4i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vcmpoeqps_v4i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1832:			; NoVLX-NEXT: .Lcfi1552:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1833:			; NoVLX-NEXT: .Lcfi1553:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1834:			; NoVLX-NEXT: .Lcfi1554:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vbroadcastss (%rdi), %xmm1			; NoVLX-NEXT: vbroadcastss (%rdi), %xmm1
	; NoVLX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 32 Lines
	; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1			; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1
	; VLX-NEXT: vcmpeqps %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqps %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqps_v4i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vcmpoeqps_v4i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1835:			; NoVLX-NEXT: .Lcfi1555:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1836:			; NoVLX-NEXT: .Lcfi1556:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1837:			; NoVLX-NEXT: .Lcfi1557:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm2, %ymm2			; NoVLX-NEXT: vpmovqd %zmm2, %ymm2
	Show All 37 Lines
	; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1			; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1
	; VLX-NEXT: vcmpeqps (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqps (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqps_v4i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vcmpoeqps_v4i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1838:			; NoVLX-NEXT: .Lcfi1558:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1839:			; NoVLX-NEXT: .Lcfi1559:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1840:			; NoVLX-NEXT: .Lcfi1560:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm1, %ymm1
	; NoVLX-NEXT: vcmpeqps (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqps (%rsi), %xmm0, %xmm0
				; NoVLX-NEXT: vpmovqd %zmm1, %ymm1
	; NoVLX-NEXT: vandps %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vandps %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 29 Lines
	; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1			; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1
	; VLX-NEXT: vcmpeqps (%rsi){1to4}, %xmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqps (%rsi){1to4}, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqps_v4i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vcmpoeqps_v4i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1841:			; NoVLX-NEXT: .Lcfi1561:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1842:			; NoVLX-NEXT: .Lcfi1562:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1843:			; NoVLX-NEXT: .Lcfi1563:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm1, %ymm1			; NoVLX-NEXT: vpmovqd %zmm1, %ymm1
	▲ Show 20 Lines • Show All 229 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vcmpeqps %ymm1, %ymm0, %k0			; VLX-NEXT: vcmpeqps %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v8i1_v32i1_mask:			; NoVLX-LABEL: test_vcmpoeqps_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1844:			; NoVLX-NEXT: .Lcfi1564:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1845:			; NoVLX-NEXT: .Lcfi1565:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1846:			; NoVLX-NEXT: .Lcfi1566:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>			; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0			; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vxorps %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vxorps %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 14 Lines
	; VLX-NEXT: vcmpeqps (%rdi), %ymm0, %k0			; VLX-NEXT: vcmpeqps (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vcmpoeqps_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1847:			; NoVLX-NEXT: .Lcfi1567:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1848:			; NoVLX-NEXT: .Lcfi1568:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1849:			; NoVLX-NEXT: .Lcfi1569:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vmovaps (%rdi), %ymm1			; NoVLX-NEXT: vmovaps (%rdi), %ymm1
	; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0			; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vxorps %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vxorps %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 15 Lines
	; VLX-NEXT: vcmpeqps (%rdi){1to8}, %ymm0, %k0			; VLX-NEXT: vcmpeqps (%rdi){1to8}, %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v8i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vcmpoeqps_v8i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1850:			; NoVLX-NEXT: .Lcfi1570:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1851:			; NoVLX-NEXT: .Lcfi1571:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1852:			; NoVLX-NEXT: .Lcfi1572:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vbroadcastss (%rdi), %ymm1			; NoVLX-NEXT: vbroadcastss (%rdi), %ymm1
	; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0			; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vxorps %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vxorps %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX-NEXT: vcmpeqps %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vcmpeqps %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqps_v8i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vcmpoeqps_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1853:			; NoVLX-NEXT: .Lcfi1573:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1854:			; NoVLX-NEXT: .Lcfi1574:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1855:			; NoVLX-NEXT: .Lcfi1575:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>			; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0			; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vxorps %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vxorps %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX-NEXT: vcmpeqps (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vcmpeqps (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqps_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vcmpoeqps_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1856:			; NoVLX-NEXT: .Lcfi1576:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1857:			; NoVLX-NEXT: .Lcfi1577:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1858:			; NoVLX-NEXT: .Lcfi1578:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vmovaps (%rsi), %ymm1			; NoVLX-NEXT: vmovaps (%rsi), %ymm1
	; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0			; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vxorps %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vxorps %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 18 Lines
	; VLX-NEXT: vcmpeqps (%rsi){1to8}, %ymm0, %k0 {%k1}			; VLX-NEXT: vcmpeqps (%rsi){1to8}, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqps_v8i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vcmpoeqps_v8i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1859:			; NoVLX-NEXT: .Lcfi1579:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1860:			; NoVLX-NEXT: .Lcfi1580:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1861:			; NoVLX-NEXT: .Lcfi1581:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vbroadcastss (%rsi), %ymm1			; NoVLX-NEXT: vbroadcastss (%rsi), %ymm1
	; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0			; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vxorps %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vxorps %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 20 Lines
	; VLX-NEXT: vcmpeqps %ymm1, %ymm0, %k0			; VLX-NEXT: vcmpeqps %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v8i1_v64i1_mask:			; NoVLX-LABEL: test_vcmpoeqps_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1862:			; NoVLX-NEXT: .Lcfi1582:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1863:			; NoVLX-NEXT: .Lcfi1583:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1864:			; NoVLX-NEXT: .Lcfi1584:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>			; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0			; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vcmpeqps (%rdi), %ymm0, %k0			; VLX-NEXT: vcmpeqps (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vcmpoeqps_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1865:			; NoVLX-NEXT: .Lcfi1585:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1866:			; NoVLX-NEXT: .Lcfi1586:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1867:			; NoVLX-NEXT: .Lcfi1587:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vmovaps (%rdi), %ymm1			; NoVLX-NEXT: vmovaps (%rdi), %ymm1
	; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0			; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vcmpeqps (%rdi){1to8}, %ymm0, %k0			; VLX-NEXT: vcmpeqps (%rdi){1to8}, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v8i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vcmpoeqps_v8i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1868:			; NoVLX-NEXT: .Lcfi1588:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1869:			; NoVLX-NEXT: .Lcfi1589:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1870:			; NoVLX-NEXT: .Lcfi1590:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vbroadcastss (%rdi), %ymm1			; NoVLX-NEXT: vbroadcastss (%rdi), %ymm1
	; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0			; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vcmpeqps %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vcmpeqps %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqps_v8i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vcmpoeqps_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1871:			; NoVLX-NEXT: .Lcfi1591:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1872:			; NoVLX-NEXT: .Lcfi1592:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1873:			; NoVLX-NEXT: .Lcfi1593:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>			; NoVLX-NEXT: # kill: %YMM1<def> %YMM1<kill> %ZMM1<def>
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0			; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vcmpeqps (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vcmpeqps (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqps_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vcmpoeqps_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1874:			; NoVLX-NEXT: .Lcfi1594:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1875:			; NoVLX-NEXT: .Lcfi1595:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1876:			; NoVLX-NEXT: .Lcfi1596:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vmovaps (%rsi), %ymm1			; NoVLX-NEXT: vmovaps (%rsi), %ymm1
	; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0			; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vcmpeqps (%rsi){1to8}, %ymm0, %k0 {%k1}			; VLX-NEXT: vcmpeqps (%rsi){1to8}, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqps_v8i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vcmpoeqps_v8i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1877:			; NoVLX-NEXT: .Lcfi1597:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1878:			; NoVLX-NEXT: .Lcfi1598:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1879:			; NoVLX-NEXT: .Lcfi1599:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>			; NoVLX-NEXT: # kill: %YMM0<def> %YMM0<kill> %ZMM0<def>
	; NoVLX-NEXT: vbroadcastss (%rsi), %ymm1			; NoVLX-NEXT: vbroadcastss (%rsi), %ymm1
	; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0			; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: kandw %k1, %k0, %k0			; NoVLX-NEXT: kandw %k1, %k0, %k0
	▲ Show 20 Lines • Show All 66 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0			; VLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v16i1_v32i1_mask:			; NoVLX-LABEL: test_vcmpoeqps_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1880:			; NoVLX-NEXT: .Lcfi1600:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1881:			; NoVLX-NEXT: .Lcfi1601:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1882:			; NoVLX-NEXT: .Lcfi1602:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1883:			; NoVLX-NEXT: .Lcfi1603:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1884:			; NoVLX-NEXT: .Lcfi1604:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1885:			; NoVLX-NEXT: .Lcfi1605:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1886:			; NoVLX-NEXT: .Lcfi1606:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1887:			; NoVLX-NEXT: .Lcfi1607:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0			; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 19 Lines
	; VLX-NEXT: vcmpeqps (%rdi), %zmm0, %k0			; VLX-NEXT: vcmpeqps (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vcmpoeqps_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1888:			; NoVLX-NEXT: .Lcfi1608:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1889:			; NoVLX-NEXT: .Lcfi1609:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1890:			; NoVLX-NEXT: .Lcfi1610:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1891:			; NoVLX-NEXT: .Lcfi1611:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1892:			; NoVLX-NEXT: .Lcfi1612:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1893:			; NoVLX-NEXT: .Lcfi1613:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1894:			; NoVLX-NEXT: .Lcfi1614:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1895:			; NoVLX-NEXT: .Lcfi1615:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vcmpeqps (%rdi), %zmm0, %k0			; NoVLX-NEXT: vcmpeqps (%rdi), %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 20 Lines
	; VLX-NEXT: vcmpeqps (%rdi){1to16}, %zmm0, %k0			; VLX-NEXT: vcmpeqps (%rdi){1to16}, %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v16i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vcmpoeqps_v16i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1896:			; NoVLX-NEXT: .Lcfi1616:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1897:			; NoVLX-NEXT: .Lcfi1617:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1898:			; NoVLX-NEXT: .Lcfi1618:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1899:			; NoVLX-NEXT: .Lcfi1619:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1900:			; NoVLX-NEXT: .Lcfi1620:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1901:			; NoVLX-NEXT: .Lcfi1621:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1902:			; NoVLX-NEXT: .Lcfi1622:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1903:			; NoVLX-NEXT: .Lcfi1623:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vcmpeqps (%rdi){1to16}, %zmm0, %k0			; NoVLX-NEXT: vcmpeqps (%rdi){1to16}, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 22 Lines
	; VLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqps_v16i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vcmpoeqps_v16i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1904:			; NoVLX-NEXT: .Lcfi1624:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1905:			; NoVLX-NEXT: .Lcfi1625:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1906:			; NoVLX-NEXT: .Lcfi1626:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1907:			; NoVLX-NEXT: .Lcfi1627:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1908:			; NoVLX-NEXT: .Lcfi1628:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1909:			; NoVLX-NEXT: .Lcfi1629:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1910:			; NoVLX-NEXT: .Lcfi1630:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1911:			; NoVLX-NEXT: .Lcfi1631:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 22 Lines
	; VLX-NEXT: vcmpeqps (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqps (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqps_v16i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vcmpoeqps_v16i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1912:			; NoVLX-NEXT: .Lcfi1632:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1913:			; NoVLX-NEXT: .Lcfi1633:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1914:			; NoVLX-NEXT: .Lcfi1634:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1915:			; NoVLX-NEXT: .Lcfi1635:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1916:			; NoVLX-NEXT: .Lcfi1636:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1917:			; NoVLX-NEXT: .Lcfi1637:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1918:			; NoVLX-NEXT: .Lcfi1638:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1919:			; NoVLX-NEXT: .Lcfi1639:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vcmpeqps (%rsi), %zmm0, %k0 {%k1}			; NoVLX-NEXT: vcmpeqps (%rsi), %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	Show All 23 Lines
	; VLX-NEXT: vcmpeqps (%rsi){1to16}, %zmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqps (%rsi){1to16}, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqps_v16i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vcmpoeqps_v16i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1920:			; NoVLX-NEXT: .Lcfi1640:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1921:			; NoVLX-NEXT: .Lcfi1641:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1922:			; NoVLX-NEXT: .Lcfi1642:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15			; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14			; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13			; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12			; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx			; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: .Lcfi1923:			; NoVLX-NEXT: .Lcfi1643:
	; NoVLX-NEXT: .cfi_offset %rbx, -56			; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1924:			; NoVLX-NEXT: .Lcfi1644:
	; NoVLX-NEXT: .cfi_offset %r12, -48			; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1925:			; NoVLX-NEXT: .Lcfi1645:
	; NoVLX-NEXT: .cfi_offset %r13, -40			; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1926:			; NoVLX-NEXT: .Lcfi1646:
	; NoVLX-NEXT: .cfi_offset %r14, -32			; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1927:			; NoVLX-NEXT: .Lcfi1647:
	; NoVLX-NEXT: .cfi_offset %r15, -24			; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vcmpeqps (%rsi){1to16}, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vcmpeqps (%rsi){1to16}, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %r8d
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: leaq -40(%rbp), %rsp
	▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0			; VLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v16i1_v64i1_mask:			; NoVLX-LABEL: test_vcmpoeqps_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1928:			; NoVLX-NEXT: .Lcfi1648:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1929:			; NoVLX-NEXT: .Lcfi1649:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1930:			; NoVLX-NEXT: .Lcfi1650:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1931:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1932:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1933:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1934:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1935:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0			; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x float>			%0 = bitcast <8 x i64> %__a to <16 x float>
	%1 = bitcast <8 x i64> %__b to <16 x float>			%1 = bitcast <8 x i64> %__b to <16 x float>
	%2 = fcmp oeq <16 x float> %0, %1			%2 = fcmp oeq <16 x float> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0,i32 1,i32 2,i32 3,i32 4,i32 5,i32 6,i32 7,i32 8,i32 9,i32 10,i32 11,i32 12,i32 13,i32 14,i32 15,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0,i32 1,i32 2,i32 3,i32 4,i32 5,i32 6,i32 7,i32 8,i32 9,i32 10,i32 11,i32 12,i32 13,i32 14,i32 15,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_vcmpoeqps_v16i1_v64i1_mask_mem(<8 x i64> %__a, <8 x i64>* %__b) local_unnamed_addr {			define zeroext i64 @test_vcmpoeqps_v16i1_v64i1_mask_mem(<8 x i64> %__a, <8 x i64>* %__b) local_unnamed_addr {
	; VLX-LABEL: test_vcmpoeqps_v16i1_v64i1_mask_mem:			; VLX-LABEL: test_vcmpoeqps_v16i1_v64i1_mask_mem:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vcmpeqps (%rdi), %zmm0, %k0			; VLX-NEXT: vcmpeqps (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vcmpoeqps_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1936:			; NoVLX-NEXT: .Lcfi1651:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1937:			; NoVLX-NEXT: .Lcfi1652:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1938:			; NoVLX-NEXT: .Lcfi1653:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1939:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1940:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1941:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1942:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1943:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vcmpeqps (%rdi), %zmm0, %k0			; NoVLX-NEXT: vcmpeqps (%rdi), %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x float>			%0 = bitcast <8 x i64> %__a to <16 x float>
	%load = load <8 x i64>, <8 x i64>* %__b			%load = load <8 x i64>, <8 x i64>* %__b
	%1 = bitcast <8 x i64> %load to <16 x float>			%1 = bitcast <8 x i64> %load to <16 x float>
	%2 = fcmp oeq <16 x float> %0, %1			%2 = fcmp oeq <16 x float> %0, %1
	%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0,i32 1,i32 2,i32 3,i32 4,i32 5,i32 6,i32 7,i32 8,i32 9,i32 10,i32 11,i32 12,i32 13,i32 14,i32 15,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31>			%3 = shufflevector <16 x i1> %2, <16 x i1> zeroinitializer, <64 x i32> <i32 0,i32 1,i32 2,i32 3,i32 4,i32 5,i32 6,i32 7,i32 8,i32 9,i32 10,i32 11,i32 12,i32 13,i32 14,i32 15,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31,i32 16,i32 17,i32 18,i32 19,i32 20,i32 21,i32 22,i32 23,i32 24,i32 25,i32 26,i32 27,i32 28,i32 29,i32 30,i32 31>
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	define zeroext i64 @test_vcmpoeqps_v16i1_v64i1_mask_mem_b(<8 x i64> %__a, float* %__b) local_unnamed_addr {			define zeroext i64 @test_vcmpoeqps_v16i1_v64i1_mask_mem_b(<8 x i64> %__a, float* %__b) local_unnamed_addr {
	; VLX-LABEL: test_vcmpoeqps_v16i1_v64i1_mask_mem_b:			; VLX-LABEL: test_vcmpoeqps_v16i1_v64i1_mask_mem_b:
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vcmpeqps (%rdi){1to16}, %zmm0, %k0			; VLX-NEXT: vcmpeqps (%rdi){1to16}, %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqps_v16i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vcmpoeqps_v16i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1944:			; NoVLX-NEXT: .Lcfi1654:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1945:			; NoVLX-NEXT: .Lcfi1655:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1946:			; NoVLX-NEXT: .Lcfi1656:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1947:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1948:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1949:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1950:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1951:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: vcmpeqps (%rdi){1to16}, %zmm0, %k0			; NoVLX-NEXT: vcmpeqps (%rdi){1to16}, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x float>			%0 = bitcast <8 x i64> %__a to <16 x float>
	%load = load float, float* %__b			%load = load float, float* %__b
	%vec = insertelement <16 x float> undef, float %load, i32 0			%vec = insertelement <16 x float> undef, float %load, i32 0
	%1 = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%1 = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	%2 = fcmp oeq <16 x float> %0, %1			%2 = fcmp oeq <16 x float> %0, %1
	Show All 9 Lines
	; VLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqps_v16i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vcmpoeqps_v16i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1952:			; NoVLX-NEXT: .Lcfi1657:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1953:			; NoVLX-NEXT: .Lcfi1658:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1954:			; NoVLX-NEXT: .Lcfi1659:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1955:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1956:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1957:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1958:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1959:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vcmpeqps %zmm1, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x float>			%0 = bitcast <8 x i64> %__a to <16 x float>
	%1 = bitcast <8 x i64> %__b to <16 x float>			%1 = bitcast <8 x i64> %__b to <16 x float>
	%2 = fcmp oeq <16 x float> %0, %1			%2 = fcmp oeq <16 x float> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	%4 = and <16 x i1> %2, %3			%4 = and <16 x i1> %2, %3
	Show All 9 Lines
	; VLX-NEXT: vcmpeqps (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqps (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqps_v16i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vcmpoeqps_v16i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1960:			; NoVLX-NEXT: .Lcfi1660:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1961:			; NoVLX-NEXT: .Lcfi1661:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1962:			; NoVLX-NEXT: .Lcfi1662:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1963:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1964:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1965:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1966:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1967:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vcmpeqps (%rsi), %zmm0, %k0 {%k1}			; NoVLX-NEXT: vcmpeqps (%rsi), %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x float>			%0 = bitcast <8 x i64> %__a to <16 x float>
	%load = load <8 x i64>, <8 x i64>* %__b			%load = load <8 x i64>, <8 x i64>* %__b
	%1 = bitcast <8 x i64> %load to <16 x float>			%1 = bitcast <8 x i64> %load to <16 x float>
	%2 = fcmp oeq <16 x float> %0, %1			%2 = fcmp oeq <16 x float> %0, %1
	%3 = bitcast i16 %__u to <16 x i1>			%3 = bitcast i16 %__u to <16 x i1>
	Show All 10 Lines
	; VLX-NEXT: vcmpeqps (%rsi){1to16}, %zmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqps (%rsi){1to16}, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqps_v16i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vcmpoeqps_v16i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1968:			; NoVLX-NEXT: .Lcfi1663:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1969:			; NoVLX-NEXT: .Lcfi1664:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1970:			; NoVLX-NEXT: .Lcfi1665:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: pushq %r15
	; NoVLX-NEXT: pushq %r14
	; NoVLX-NEXT: pushq %r13
	; NoVLX-NEXT: pushq %r12
	; NoVLX-NEXT: pushq %rbx
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: .Lcfi1971:
	; NoVLX-NEXT: .cfi_offset %rbx, -56
	; NoVLX-NEXT: .Lcfi1972:
	; NoVLX-NEXT: .cfi_offset %r12, -48
	; NoVLX-NEXT: .Lcfi1973:
	; NoVLX-NEXT: .cfi_offset %r13, -40
	; NoVLX-NEXT: .Lcfi1974:
	; NoVLX-NEXT: .cfi_offset %r14, -32
	; NoVLX-NEXT: .Lcfi1975:
	; NoVLX-NEXT: .cfi_offset %r15, -24
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vcmpeqps (%rsi){1to16}, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vcmpeqps (%rsi){1to16}, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r10d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: vmovd %ecx, %xmm0
				; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r11d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r14d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r15d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r12d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $8, %k0, %k1			; NoVLX-NEXT: kshiftlw $8, %k0, %k1
				; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r13d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $7, %k0, %k1			; NoVLX-NEXT: kshiftlw $7, %k0, %k1
				; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $6, %k0, %k1			; NoVLX-NEXT: kshiftlw $6, %k0, %k1
				; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ebx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $5, %k0, %k1			; NoVLX-NEXT: kshiftlw $5, %k0, %k1
				; NoVLX-NEXT: vpinsrb $8, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $4, %k0, %k1			; NoVLX-NEXT: kshiftlw $4, %k0, %k1
				; NoVLX-NEXT: vpinsrb $9, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $3, %k0, %k1			; NoVLX-NEXT: kshiftlw $3, %k0, %k1
				; NoVLX-NEXT: vpinsrb $10, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $2, %k0, %k1			; NoVLX-NEXT: kshiftlw $2, %k0, %k1
				; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vmovd %r10d, %xmm0			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kmovw %k1, %r10d
	; NoVLX-NEXT: kshiftlw $1, %k0, %k1			; NoVLX-NEXT: kshiftlw $1, %k0, %k1
				; NoVLX-NEXT: vpinsrb $12, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: vpinsrb $1, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vpinsrb $2, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %r11d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %r14d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %r15d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %r12d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $7, %r13d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $8, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $9, %ebx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $10, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $11, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $12, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $13, %r10d, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $13, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $14, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $15, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx			; NoVLX-NEXT: movl {{[0-9]+}}(%rsp), %ecx
	; NoVLX-NEXT: shlq $32, %rcx			; NoVLX-NEXT: shlq $32, %rcx
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: orq %rcx, %rax			; NoVLX-NEXT: orq %rcx, %rax
	; NoVLX-NEXT: leaq -40(%rbp), %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	; NoVLX-NEXT: popq %rbx
	; NoVLX-NEXT: popq %r12
	; NoVLX-NEXT: popq %r13
	; NoVLX-NEXT: popq %r14
	; NoVLX-NEXT: popq %r15
	; NoVLX-NEXT: popq %rbp			; NoVLX-NEXT: popq %rbp
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <8 x i64> %__a to <16 x float>			%0 = bitcast <8 x i64> %__a to <16 x float>
	%load = load float, float* %__b			%load = load float, float* %__b
	%vec = insertelement <16 x float> undef, float %load, i32 0			%vec = insertelement <16 x float> undef, float %load, i32 0
	%1 = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%1 = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	%2 = fcmp oeq <16 x float> %0, %1			%2 = fcmp oeq <16 x float> %0, %1
	▲ Show 20 Lines • Show All 188 Lines • ▼ Show 20 Lines
	; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; VLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqpd_v2i1_v4i1_mask_mem:			; NoVLX-LABEL: test_masked_vcmpoeqpd_v2i1_v4i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: movb %dil, -{{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, -{{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vcmpeqpd (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd (%rsi), %xmm0, %xmm0
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vandpd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vandpd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero			; NoVLX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero
	; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0			; NoVLX-NEXT: vpslld $31, %ymm0, %ymm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %al, -{{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v8i1_mask:			; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x double>			%0 = bitcast <2 x i64> %__a to <2 x double>
	%1 = bitcast <2 x i64> %__b to <2 x double>			%1 = bitcast <2 x i64> %__b to <2 x double>
	Show All 11 Lines
	; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; VLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v8i1_mask_mem:			; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v8i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vcmpeqpd (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x double>			%0 = bitcast <2 x i64> %__a to <2 x double>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	Show All 13 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v8i1_mask_mem_b:			; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v8i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vmovddup {{.*#+}} xmm1 = mem[0,0]			; NoVLX-NEXT: vmovddup {{.*#+}} xmm1 = mem[0,0]
	; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x double>			%0 = bitcast <2 x i64> %__a to <2 x double>
	%load = load double, double* %__b			%load = load double, double* %__b
	Show All 20 Lines
	; NoVLX-NEXT: movb %dil, -{{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, -{{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vandpd %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vandpd %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x double>			%0 = bitcast <2 x i64> %__a to <2 x double>
	%1 = bitcast <2 x i64> %__b to <2 x double>			%1 = bitcast <2 x i64> %__b to <2 x double>
	Show All 20 Lines
	; NoVLX-NEXT: movb %dil, -{{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, -{{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vcmpeqpd (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: vandpd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vandpd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x double>			%0 = bitcast <2 x i64> %__a to <2 x double>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	Show All 22 Lines
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovddup {{.*#+}} xmm2 = mem[0,0]			; NoVLX-NEXT: vmovddup {{.*#+}} xmm2 = mem[0,0]
	; NoVLX-NEXT: vcmpeqpd %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vandpd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vandpd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]			; NoVLX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,2,3,4,5,6,7]
	; NoVLX-NEXT: vpermi2q %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2q %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0			; NoVLX-NEXT: vpsllq $63, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmq %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AL<def> %AL<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x double>			%0 = bitcast <2 x i64> %__a to <2 x double>
	%load = load double, double* %__b			%load = load double, double* %__b
	Show All 17 Lines
	; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v16i1_mask:			; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x double>			%0 = bitcast <2 x i64> %__a to <2 x double>
	%1 = bitcast <2 x i64> %__b to <2 x double>			%1 = bitcast <2 x i64> %__b to <2 x double>
	Show All 11 Lines
	; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; VLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v16i1_mask_mem:			; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v16i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vcmpeqpd (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x double>			%0 = bitcast <2 x i64> %__a to <2 x double>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	Show All 13 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v16i1_mask_mem_b:			; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v16i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vmovddup {{.*#+}} xmm1 = mem[0,0]			; NoVLX-NEXT: vmovddup {{.*#+}} xmm1 = mem[0,0]
	; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x double>			%0 = bitcast <2 x i64> %__a to <2 x double>
	%load = load double, double* %__b			%load = load double, double* %__b
	Show All 20 Lines
	; NoVLX-NEXT: movb %dil, -{{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, -{{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vandpd %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vandpd %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x double>			%0 = bitcast <2 x i64> %__a to <2 x double>
	%1 = bitcast <2 x i64> %__b to <2 x double>			%1 = bitcast <2 x i64> %__b to <2 x double>
	Show All 20 Lines
	; NoVLX-NEXT: movb %dil, -{{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, -{{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vcmpeqpd (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd (%rsi), %xmm0, %xmm0
	; NoVLX-NEXT: vandpd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vandpd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x double>			%0 = bitcast <2 x i64> %__a to <2 x double>
	%load = load <2 x i64>, <2 x i64>* %__b			%load = load <2 x i64>, <2 x i64>* %__b
	Show All 22 Lines
	; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl -{{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovddup {{.*#+}} xmm2 = mem[0,0]			; NoVLX-NEXT: vmovddup {{.*#+}} xmm2 = mem[0,0]
	; NoVLX-NEXT: vcmpeqpd %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vandpd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vandpd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $8, %xmm0, %eax			; NoVLX-NEXT: vpextrb $8, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm2 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	; NoVLX-NEXT: vpermi2d %zmm1, %zmm0, %zmm2			; NoVLX-NEXT: vpermi2d %zmm0, %zmm1, %zmm2
	; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm2, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; NoVLX-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; NoVLX-NEXT: retq			; NoVLX-NEXT: retq
	entry:			entry:
	%0 = bitcast <2 x i64> %__a to <2 x double>			%0 = bitcast <2 x i64> %__a to <2 x double>
	%load = load double, double* %__b			%load = load double, double* %__b
	Show All 14 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vcmpeqpd %xmm1, %xmm0, %k0			; VLX-NEXT: vcmpeqpd %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v32i1_mask:			; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1976:			; NoVLX-NEXT: .Lcfi1666:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1977:			; NoVLX-NEXT: .Lcfi1667:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1978:			; NoVLX-NEXT: .Lcfi1668:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 21 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vcmpeqpd (%rdi), %xmm0, %k0			; VLX-NEXT: vcmpeqpd (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1979:			; NoVLX-NEXT: .Lcfi1669:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1980:			; NoVLX-NEXT: .Lcfi1670:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1981:			; NoVLX-NEXT: .Lcfi1671:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vcmpeqpd (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 22 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vcmpeqpd (%rdi){1to2}, %xmm0, %k0			; VLX-NEXT: vcmpeqpd (%rdi){1to2}, %xmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1982:			; NoVLX-NEXT: .Lcfi1672:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1983:			; NoVLX-NEXT: .Lcfi1673:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1984:			; NoVLX-NEXT: .Lcfi1674:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vmovddup {{.*#+}} xmm1 = mem[0,0]			; NoVLX-NEXT: vmovddup {{.*#+}} xmm1 = mem[0,0]
	; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	Show All 26 Lines
	; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1			; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1
	; VLX-NEXT: vcmpeqpd %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqpd %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqpd_v2i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vcmpoeqpd_v2i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1985:			; NoVLX-NEXT: .Lcfi1675:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1986:			; NoVLX-NEXT: .Lcfi1676:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1987:			; NoVLX-NEXT: .Lcfi1677:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0
	Show All 30 Lines
	; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1			; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1
	; VLX-NEXT: vcmpeqpd (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqpd (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqpd_v2i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vcmpoeqpd_v2i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1988:			; NoVLX-NEXT: .Lcfi1678:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1989:			; NoVLX-NEXT: .Lcfi1679:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1990:			; NoVLX-NEXT: .Lcfi1680:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vcmpeqpd (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd (%rsi), %xmm0, %xmm0
	Show All 31 Lines
	; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1			; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1
	; VLX-NEXT: vcmpeqpd (%rsi){1to2}, %xmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqpd (%rsi){1to2}, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqpd_v2i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vcmpoeqpd_v2i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1991:			; NoVLX-NEXT: .Lcfi1681:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1992:			; NoVLX-NEXT: .Lcfi1682:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1993:			; NoVLX-NEXT: .Lcfi1683:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovddup {{.*#+}} xmm2 = mem[0,0]			; NoVLX-NEXT: vmovddup {{.*#+}} xmm2 = mem[0,0]
	Show All 33 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vcmpeqpd %xmm1, %xmm0, %k0			; VLX-NEXT: vcmpeqpd %xmm1, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v64i1_mask:			; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1994:			; NoVLX-NEXT: .Lcfi1684:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1995:			; NoVLX-NEXT: .Lcfi1685:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1996:			; NoVLX-NEXT: .Lcfi1686:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 27 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vcmpeqpd (%rdi), %xmm0, %k0			; VLX-NEXT: vcmpeqpd (%rdi), %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi1997:			; NoVLX-NEXT: .Lcfi1687:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi1998:			; NoVLX-NEXT: .Lcfi1688:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi1999:			; NoVLX-NEXT: .Lcfi1689:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vcmpeqpd (%rdi), %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd (%rdi), %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	Show All 28 Lines
	; VLX: # BB#0: # %entry			; VLX: # BB#0: # %entry
	; VLX-NEXT: vcmpeqpd (%rdi){1to2}, %xmm0, %k0			; VLX-NEXT: vcmpeqpd (%rdi){1to2}, %xmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vcmpoeqpd_v2i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2000:			; NoVLX-NEXT: .Lcfi1690:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2001:			; NoVLX-NEXT: .Lcfi1691:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2002:			; NoVLX-NEXT: .Lcfi1692:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vmovddup {{.*#+}} xmm1 = mem[0,0]			; NoVLX-NEXT: vmovddup {{.*#+}} xmm1 = mem[0,0]
	; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 32 Lines
	; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1			; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1
	; VLX-NEXT: vcmpeqpd %xmm1, %xmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqpd %xmm1, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqpd_v2i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vcmpoeqpd_v2i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2003:			; NoVLX-NEXT: .Lcfi1693:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2004:			; NoVLX-NEXT: .Lcfi1694:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2005:			; NoVLX-NEXT: .Lcfi1695:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm0
	Show All 36 Lines
	; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1			; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1
	; VLX-NEXT: vcmpeqpd (%rsi), %xmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqpd (%rsi), %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqpd_v2i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vcmpoeqpd_v2i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2006:			; NoVLX-NEXT: .Lcfi1696:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2007:			; NoVLX-NEXT: .Lcfi1697:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2008:			; NoVLX-NEXT: .Lcfi1698:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vcmpeqpd (%rsi), %xmm0, %xmm0			; NoVLX-NEXT: vcmpeqpd (%rsi), %xmm0, %xmm0
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vandpd %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vandpd %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,8],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1			; NoVLX-NEXT: vpslld $31, %zmm1, %zmm1
	Show All 29 Lines
	; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1			; VLX-NEXT: kmovb -{{[0-9]+}}(%rsp), %k1
	; VLX-NEXT: vcmpeqpd (%rsi){1to2}, %xmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqpd (%rsi){1to2}, %xmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqpd_v2i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vcmpoeqpd_v2i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2009:			; NoVLX-NEXT: .Lcfi1699:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2010:			; NoVLX-NEXT: .Lcfi1700:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2011:			; NoVLX-NEXT: .Lcfi1701:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vmovddup {{.*#+}} xmm2 = mem[0,0]			; NoVLX-NEXT: vmovddup {{.*#+}} xmm2 = mem[0,0]
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v8i1_mask:			; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v8i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	Show All 39 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v8i1_mask_mem:			; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v8i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vcmpeqpd (%rdi), %ymm0, %ymm0			; NoVLX-NEXT: vcmpeqpd (%rdi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v8i1_mask_mem_b:			; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v8i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vbroadcastsd (%rdi), %ymm1			; NoVLX-NEXT: vbroadcastsd (%rdi), %ymm1
	; NoVLX-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm2, %ymm2			; NoVLX-NEXT: vpmovqd %zmm2, %ymm2
	; NoVLX-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpand %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm1, %ymm1			; NoVLX-NEXT: vpmovqd %zmm1, %ymm1
	; NoVLX-NEXT: vcmpeqpd (%rsi), %ymm0, %ymm0			; NoVLX-NEXT: vcmpeqpd (%rsi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm1, %ymm1			; NoVLX-NEXT: vpmovqd %zmm1, %ymm1
	; NoVLX-NEXT: vbroadcastsd (%rsi), %ymm2			; NoVLX-NEXT: vbroadcastsd (%rsi), %ymm2
	; NoVLX-NEXT: vcmpeqpd %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vcmpeqpd %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kshiftlw $7, %k0, %k0			; NoVLX-NEXT: kshiftlw $7, %k0, %k0
	; NoVLX-NEXT: kshiftrw $7, %k0, %k0			; NoVLX-NEXT: kshiftrw $7, %k0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v16i1_mask:			; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v16i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 38 Lines
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v16i1_mask_mem:			; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v16i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vcmpeqpd (%rdi), %ymm0, %ymm0			; NoVLX-NEXT: vcmpeqpd (%rdi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 40 Lines
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v16i1_mask_mem_b:			; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v16i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: vbroadcastsd (%rdi), %ymm1			; NoVLX-NEXT: vbroadcastsd (%rdi), %ymm1
	; NoVLX-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm2, %ymm2			; NoVLX-NEXT: vpmovqd %zmm2, %ymm2
	; NoVLX-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpand %xmm2, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm2, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm1, %ymm1			; NoVLX-NEXT: vpmovqd %zmm1, %ymm1
	; NoVLX-NEXT: vcmpeqpd (%rsi), %ymm0, %ymm0			; NoVLX-NEXT: vcmpeqpd (%rsi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm1, %ymm1			; NoVLX-NEXT: vpmovqd %zmm1, %ymm1
	; NoVLX-NEXT: vbroadcastsd (%rsi), %ymm2			; NoVLX-NEXT: vbroadcastsd (%rsi), %ymm2
	; NoVLX-NEXT: vcmpeqpd %ymm2, %ymm0, %ymm0			; NoVLX-NEXT: vcmpeqpd %ymm2, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0			; NoVLX-NEXT: vpand %xmm1, %xmm0, %xmm0
	; NoVLX-NEXT: vpextrb $4, %xmm0, %eax			; NoVLX-NEXT: vpextrb $4, %xmm0, %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpextrb $0, %xmm0, %eax			; NoVLX-NEXT: vpextrb $0, %xmm0, %eax
				; NoVLX-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: andl $1, %eax			; NoVLX-NEXT: andl $1, %eax
	; NoVLX-NEXT: kmovw %eax, %k0			; NoVLX-NEXT: kmovw %eax, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kshiftrw $1, %k1, %k1			; NoVLX-NEXT: kshiftrw $1, %k1, %k1
	; NoVLX-NEXT: kshiftlw $1, %k1, %k1			; NoVLX-NEXT: kshiftlw $1, %k1, %k1
	; NoVLX-NEXT: korw %k0, %k1, %k1			; NoVLX-NEXT: korw %k0, %k1, %k1
	; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogd $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]			; NoVLX-NEXT: vmovdqa32 {{.*#+}} zmm3 = [0,16,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
	Show All 40 Lines
	; VLX-NEXT: vcmpeqpd %ymm1, %ymm0, %k0			; VLX-NEXT: vcmpeqpd %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v32i1_mask:			; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2012:			; NoVLX-NEXT: .Lcfi1702:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2013:			; NoVLX-NEXT: .Lcfi1703:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2014:			; NoVLX-NEXT: .Lcfi1704:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	Show All 23 Lines
	; VLX-NEXT: vcmpeqpd (%rdi), %ymm0, %k0			; VLX-NEXT: vcmpeqpd (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2015:			; NoVLX-NEXT: .Lcfi1705:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2016:			; NoVLX-NEXT: .Lcfi1706:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2017:			; NoVLX-NEXT: .Lcfi1707:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vcmpeqpd (%rdi), %ymm0, %ymm0			; NoVLX-NEXT: vcmpeqpd (%rdi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1			; NoVLX-NEXT: vpmovsxbd %xmm1, %zmm1
	Show All 24 Lines
	; VLX-NEXT: vcmpeqpd (%rdi){1to4}, %ymm0, %k0			; VLX-NEXT: vcmpeqpd (%rdi){1to4}, %ymm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2018:			; NoVLX-NEXT: .Lcfi1708:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2019:			; NoVLX-NEXT: .Lcfi1709:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2020:			; NoVLX-NEXT: .Lcfi1710:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vbroadcastsd (%rdi), %ymm1			; NoVLX-NEXT: vbroadcastsd (%rdi), %ymm1
	; NoVLX-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; NoVLX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,4,8,12],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1			; NoVLX-NEXT: vextracti128 $1, %ymm0, %xmm1
	Show All 28 Lines
	; VLX-NEXT: vcmpeqpd %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vcmpeqpd %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqpd_v4i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vcmpoeqpd_v4i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2021:			; NoVLX-NEXT: .Lcfi1711:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2022:			; NoVLX-NEXT: .Lcfi1712:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2023:			; NoVLX-NEXT: .Lcfi1713:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm2, %ymm2			; NoVLX-NEXT: vpmovqd %zmm2, %ymm2
	Show All 33 Lines
	; VLX-NEXT: vcmpeqpd (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vcmpeqpd (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqpd_v4i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vcmpoeqpd_v4i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2024:			; NoVLX-NEXT: .Lcfi1714:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2025:			; NoVLX-NEXT: .Lcfi1715:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2026:			; NoVLX-NEXT: .Lcfi1716:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm1, %ymm1			; NoVLX-NEXT: vpmovqd %zmm1, %ymm1
	Show All 34 Lines
	; VLX-NEXT: vcmpeqpd (%rsi){1to4}, %ymm0, %k0 {%k1}			; VLX-NEXT: vcmpeqpd (%rsi){1to4}, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqpd_v4i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vcmpoeqpd_v4i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2027:			; NoVLX-NEXT: .Lcfi1717:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2028:			; NoVLX-NEXT: .Lcfi1718:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2029:			; NoVLX-NEXT: .Lcfi1719:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm1, %ymm1			; NoVLX-NEXT: vpmovqd %zmm1, %ymm1
	Show All 36 Lines
	; VLX-NEXT: vcmpeqpd %ymm1, %ymm0, %k0			; VLX-NEXT: vcmpeqpd %ymm1, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v64i1_mask:			; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2030:			; NoVLX-NEXT: .Lcfi1720:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2031:			; NoVLX-NEXT: .Lcfi1721:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2032:			; NoVLX-NEXT: .Lcfi1722:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 29 Lines
	; VLX-NEXT: vcmpeqpd (%rdi), %ymm0, %k0			; VLX-NEXT: vcmpeqpd (%rdi), %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2033:			; NoVLX-NEXT: .Lcfi1723:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2034:			; NoVLX-NEXT: .Lcfi1724:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2035:			; NoVLX-NEXT: .Lcfi1725:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vcmpeqpd (%rdi), %ymm0, %ymm0			; NoVLX-NEXT: vcmpeqpd (%rdi), %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 30 Lines
	; VLX-NEXT: vcmpeqpd (%rdi){1to4}, %ymm0, %k0			; VLX-NEXT: vcmpeqpd (%rdi){1to4}, %ymm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vcmpoeqpd_v4i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2036:			; NoVLX-NEXT: .Lcfi1726:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2037:			; NoVLX-NEXT: .Lcfi1727:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2038:			; NoVLX-NEXT: .Lcfi1728:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vbroadcastsd (%rdi), %ymm1			; NoVLX-NEXT: vbroadcastsd (%rdi), %ymm1
	; NoVLX-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm0			; NoVLX-NEXT: vcmpeqpd %ymm1, %ymm0, %ymm0
	; NoVLX-NEXT: vpmovqd %zmm0, %ymm0			; NoVLX-NEXT: vpmovqd %zmm0, %ymm0
	; NoVLX-NEXT: kxorw %k0, %k0, %k0			; NoVLX-NEXT: kxorw %k0, %k0, %k0
	; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k0, {{[0-9]+}}(%rsp)
	Show All 34 Lines
	; VLX-NEXT: vcmpeqpd %ymm1, %ymm0, %k0 {%k1}			; VLX-NEXT: vcmpeqpd %ymm1, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqpd_v4i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vcmpoeqpd_v4i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2039:			; NoVLX-NEXT: .Lcfi1729:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2040:			; NoVLX-NEXT: .Lcfi1730:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2041:			; NoVLX-NEXT: .Lcfi1731:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm2, %zmm2, %zmm2 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm2, %ymm2			; NoVLX-NEXT: vpmovqd %zmm2, %ymm2
	Show All 39 Lines
	; VLX-NEXT: vcmpeqpd (%rsi), %ymm0, %k0 {%k1}			; VLX-NEXT: vcmpeqpd (%rsi), %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqpd_v4i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vcmpoeqpd_v4i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2042:			; NoVLX-NEXT: .Lcfi1732:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2043:			; NoVLX-NEXT: .Lcfi1733:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2044:			; NoVLX-NEXT: .Lcfi1734:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm1, %ymm1			; NoVLX-NEXT: vpmovqd %zmm1, %ymm1
	Show All 40 Lines
	; VLX-NEXT: vcmpeqpd (%rsi){1to4}, %ymm0, %k0 {%k1}			; VLX-NEXT: vcmpeqpd (%rsi){1to4}, %ymm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqpd_v4i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vcmpoeqpd_v4i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2045:			; NoVLX-NEXT: .Lcfi1735:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2046:			; NoVLX-NEXT: .Lcfi1736:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2047:			; NoVLX-NEXT: .Lcfi1737:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $96, %rsp			; NoVLX-NEXT: subq $96, %rsp
	; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: movb %dil, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax			; NoVLX-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
	; NoVLX-NEXT: kmovw %eax, %k1			; NoVLX-NEXT: kmovw %eax, %k1
	; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}			; NoVLX-NEXT: vpternlogq $255, %zmm1, %zmm1, %zmm1 {%k1} {z}
	; NoVLX-NEXT: vpmovqd %zmm1, %ymm1			; NoVLX-NEXT: vpmovqd %zmm1, %ymm1
	▲ Show 20 Lines • Show All 260 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vcmpeqpd %zmm1, %zmm0, %k0			; VLX-NEXT: vcmpeqpd %zmm1, %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v8i1_v32i1_mask:			; NoVLX-LABEL: test_vcmpoeqpd_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2048:			; NoVLX-NEXT: .Lcfi1738:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2049:			; NoVLX-NEXT: .Lcfi1739:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2050:			; NoVLX-NEXT: .Lcfi1740:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vcmpeqpd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vcmpeqpd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vxorpd %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vxorpd %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 14 Lines
	; VLX-NEXT: vcmpeqpd (%rdi), %zmm0, %k0			; VLX-NEXT: vcmpeqpd (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_vcmpoeqpd_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2051:			; NoVLX-NEXT: .Lcfi1741:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2052:			; NoVLX-NEXT: .Lcfi1742:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2053:			; NoVLX-NEXT: .Lcfi1743:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vcmpeqpd (%rdi), %zmm0, %k0			; NoVLX-NEXT: vcmpeqpd (%rdi), %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vxorpd %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vxorpd %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 15 Lines
	; VLX-NEXT: vcmpeqpd (%rdi){1to8}, %zmm0, %k0			; VLX-NEXT: vcmpeqpd (%rdi){1to8}, %zmm0, %k0
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v8i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_vcmpoeqpd_v8i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2054:			; NoVLX-NEXT: .Lcfi1744:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2055:			; NoVLX-NEXT: .Lcfi1745:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2056:			; NoVLX-NEXT: .Lcfi1746:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: vcmpeqpd (%rdi){1to8}, %zmm0, %k0			; NoVLX-NEXT: vcmpeqpd (%rdi){1to8}, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vxorpd %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vxorpd %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX-NEXT: vcmpeqpd %zmm1, %zmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqpd %zmm1, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqpd_v8i1_v32i1_mask:			; NoVLX-LABEL: test_masked_vcmpoeqpd_v8i1_v32i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2057:			; NoVLX-NEXT: .Lcfi1747:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2058:			; NoVLX-NEXT: .Lcfi1748:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2059:			; NoVLX-NEXT: .Lcfi1749:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vcmpeqpd %zmm1, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vcmpeqpd %zmm1, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
				; NoVLX-NEXT: vxorpd %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $4, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: vxorpd %xmm0, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
				; NoVLX-NEXT: kshiftrw $15, %k1, %k1
				; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 17 Lines
	; VLX-NEXT: vcmpeqpd (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqpd (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqpd_v8i1_v32i1_mask_mem:			; NoVLX-LABEL: test_masked_vcmpoeqpd_v8i1_v32i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2060:			; NoVLX-NEXT: .Lcfi1750:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2061:			; NoVLX-NEXT: .Lcfi1751:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2062:			; NoVLX-NEXT: .Lcfi1752:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vcmpeqpd (%rsi), %zmm0, %k0 {%k1}			; NoVLX-NEXT: vcmpeqpd (%rsi), %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vxorpd %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vxorpd %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	Show All 18 Lines
	; VLX-NEXT: vcmpeqpd (%rsi){1to8}, %zmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqpd (%rsi){1to8}, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovd %k0, %eax			; VLX-NEXT: kmovd %k0, %eax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqpd_v8i1_v32i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vcmpoeqpd_v8i1_v32i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2063:			; NoVLX-NEXT: .Lcfi1753:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2064:			; NoVLX-NEXT: .Lcfi1754:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2065:			; NoVLX-NEXT: .Lcfi1755:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $32, %rsp			; NoVLX-NEXT: subq $32, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vcmpeqpd (%rsi){1to8}, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vcmpeqpd (%rsi){1to8}, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kshiftlw $15, %k0, %k1			; NoVLX-NEXT: kshiftlw $15, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r8d			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $14, %k0, %k1			; NoVLX-NEXT: kshiftlw $14, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %r9d			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $13, %k0, %k1			; NoVLX-NEXT: kshiftlw $13, %k0, %k1
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edx			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $12, %k0, %k1			; NoVLX-NEXT: kshiftlw $12, %k0, %k1
				; NoVLX-NEXT: vxorpd %xmm0, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $0, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %esi			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: kshiftlw $11, %k0, %k1			; NoVLX-NEXT: kshiftlw $11, %k0, %k1
				; NoVLX-NEXT: vpinsrb $1, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %edi			; NoVLX-NEXT: kmovw %k1, %ecx
	; NoVLX-NEXT: kshiftlw $10, %k0, %k1			; NoVLX-NEXT: kshiftlw $10, %k0, %k1
				; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %eax			; NoVLX-NEXT: kmovw %k1, %edx
	; NoVLX-NEXT: kshiftlw $9, %k0, %k1			; NoVLX-NEXT: kshiftlw $9, %k0, %k1
				; NoVLX-NEXT: vpinsrb $3, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k1, %k1			; NoVLX-NEXT: kshiftrw $15, %k1, %k1
	; NoVLX-NEXT: kmovw %k1, %ecx			; NoVLX-NEXT: kmovw %k1, %eax
	; NoVLX-NEXT: vxorpd %xmm0, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $4, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $0, %r8d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $1, %r9d, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $2, %edx, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $3, %esi, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $4, %edi, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftlw $8, %k0, %k0			; NoVLX-NEXT: kshiftlw $8, %k0, %k0
				; NoVLX-NEXT: vpinsrb $5, %edx, %xmm0, %xmm0
				; NoVLX-NEXT: vpinsrb $6, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: kshiftrw $15, %k0, %k0			; NoVLX-NEXT: kshiftrw $15, %k0, %k0
	; NoVLX-NEXT: vpinsrb $5, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpinsrb $6, %ecx, %xmm0, %xmm0
	; NoVLX-NEXT: kmovw %k0, %eax			; NoVLX-NEXT: kmovw %k0, %eax
	; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0			; NoVLX-NEXT: vpinsrb $7, %eax, %xmm0, %xmm0
	; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0			; NoVLX-NEXT: vpmovsxbd %xmm0, %zmm0
	; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0			; NoVLX-NEXT: vpslld $31, %zmm0, %zmm0
	; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0			; NoVLX-NEXT: vptestmd %zmm0, %zmm0, %k0
	; NoVLX-NEXT: kmovw %k0, (%rsp)			; NoVLX-NEXT: kmovw %k0, (%rsp)
	; NoVLX-NEXT: movl (%rsp), %eax			; NoVLX-NEXT: movl (%rsp), %eax
	; NoVLX-NEXT: movq %rbp, %rsp			; NoVLX-NEXT: movq %rbp, %rsp
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vcmpeqpd %zmm1, %zmm0, %k0			; VLX-NEXT: vcmpeqpd %zmm1, %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v8i1_v64i1_mask:			; NoVLX-LABEL: test_vcmpoeqpd_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2066:			; NoVLX-NEXT: .Lcfi1756:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2067:			; NoVLX-NEXT: .Lcfi1757:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2068:			; NoVLX-NEXT: .Lcfi1758:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vcmpeqpd %zmm1, %zmm0, %k0			; NoVLX-NEXT: vcmpeqpd %zmm1, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vcmpeqpd (%rdi), %zmm0, %k0			; VLX-NEXT: vcmpeqpd (%rdi), %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_vcmpoeqpd_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2069:			; NoVLX-NEXT: .Lcfi1759:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2070:			; NoVLX-NEXT: .Lcfi1760:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2071:			; NoVLX-NEXT: .Lcfi1761:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vcmpeqpd (%rdi), %zmm0, %k0			; NoVLX-NEXT: vcmpeqpd (%rdi), %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vcmpeqpd (%rdi){1to8}, %zmm0, %k0			; VLX-NEXT: vcmpeqpd (%rdi){1to8}, %zmm0, %k0
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_vcmpoeqpd_v8i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_vcmpoeqpd_v8i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2072:			; NoVLX-NEXT: .Lcfi1762:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2073:			; NoVLX-NEXT: .Lcfi1763:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2074:			; NoVLX-NEXT: .Lcfi1764:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: vcmpeqpd (%rdi){1to8}, %zmm0, %k0			; NoVLX-NEXT: vcmpeqpd (%rdi){1to8}, %zmm0, %k0
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vcmpeqpd %zmm1, %zmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqpd %zmm1, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqpd_v8i1_v64i1_mask:			; NoVLX-LABEL: test_masked_vcmpoeqpd_v8i1_v64i1_mask:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2075:			; NoVLX-NEXT: .Lcfi1765:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2076:			; NoVLX-NEXT: .Lcfi1766:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2077:			; NoVLX-NEXT: .Lcfi1767:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vcmpeqpd %zmm1, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vcmpeqpd %zmm1, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vcmpeqpd (%rsi), %zmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqpd (%rsi), %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqpd_v8i1_v64i1_mask_mem:			; NoVLX-LABEL: test_masked_vcmpoeqpd_v8i1_v64i1_mask_mem:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2078:			; NoVLX-NEXT: .Lcfi1768:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2079:			; NoVLX-NEXT: .Lcfi1769:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2080:			; NoVLX-NEXT: .Lcfi1770:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vcmpeqpd (%rsi), %zmm0, %k0 {%k1}			; NoVLX-NEXT: vcmpeqpd (%rsi), %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; VLX-NEXT: vcmpeqpd (%rsi){1to8}, %zmm0, %k0 {%k1}			; VLX-NEXT: vcmpeqpd (%rsi){1to8}, %zmm0, %k0 {%k1}
	; VLX-NEXT: kmovq %k0, %rax			; VLX-NEXT: kmovq %k0, %rax
	; VLX-NEXT: vzeroupper			; VLX-NEXT: vzeroupper
	; VLX-NEXT: retq			; VLX-NEXT: retq
	;			;
	; NoVLX-LABEL: test_masked_vcmpoeqpd_v8i1_v64i1_mask_mem_b:			; NoVLX-LABEL: test_masked_vcmpoeqpd_v8i1_v64i1_mask_mem_b:
	; NoVLX: # BB#0: # %entry			; NoVLX: # BB#0: # %entry
	; NoVLX-NEXT: pushq %rbp			; NoVLX-NEXT: pushq %rbp
	; NoVLX-NEXT: .Lcfi2081:			; NoVLX-NEXT: .Lcfi1771:
	; NoVLX-NEXT: .cfi_def_cfa_offset 16			; NoVLX-NEXT: .cfi_def_cfa_offset 16
	; NoVLX-NEXT: .Lcfi2082:			; NoVLX-NEXT: .Lcfi1772:
	; NoVLX-NEXT: .cfi_offset %rbp, -16			; NoVLX-NEXT: .cfi_offset %rbp, -16
	; NoVLX-NEXT: movq %rsp, %rbp			; NoVLX-NEXT: movq %rsp, %rbp
	; NoVLX-NEXT: .Lcfi2083:			; NoVLX-NEXT: .Lcfi1773:
	; NoVLX-NEXT: .cfi_def_cfa_register %rbp			; NoVLX-NEXT: .cfi_def_cfa_register %rbp
	; NoVLX-NEXT: andq $-32, %rsp			; NoVLX-NEXT: andq $-32, %rsp
	; NoVLX-NEXT: subq $64, %rsp			; NoVLX-NEXT: subq $64, %rsp
	; NoVLX-NEXT: kmovw %edi, %k1			; NoVLX-NEXT: kmovw %edi, %k1
	; NoVLX-NEXT: vcmpeqpd (%rsi){1to8}, %zmm0, %k0 {%k1}			; NoVLX-NEXT: vcmpeqpd (%rsi){1to8}, %zmm0, %k0 {%k1}
	; NoVLX-NEXT: kxorw %k0, %k0, %k1			; NoVLX-NEXT: kxorw %k0, %k0, %k1
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)			; NoVLX-NEXT: kmovw %k1, {{[0-9]+}}(%rsp)
	▲ Show 20 Lines • Show All 110 Lines • Show Last 20 Lines

test/CodeGen/X86/bmi-schedule.ll

	Show All 14 Lines
	; GENERIC-NEXT: addl %edi, %eax # sched: [1:0.33]			; GENERIC-NEXT: addl %edi, %eax # sched: [1:0.33]
	; GENERIC-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; GENERIC-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_andn_i16:			; HASWELL-LABEL: test_andn_i16:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: andnl %esi, %edi, %eax # sched: [1:0.50]			; HASWELL-NEXT: andnl %esi, %edi, %eax # sched: [1:0.50]
	; HASWELL-NEXT: notl %edi # sched: [1:0.25]			; HASWELL-NEXT: notl %edi # sched: [1:0.25]
	; HASWELL-NEXT: andw (%rdx), %di # sched: [5:0.50]			; HASWELL-NEXT: andw (%rdx), %di # sched: [1:0.50]
	; HASWELL-NEXT: addl %edi, %eax # sched: [1:0.25]			; HASWELL-NEXT: addl %edi, %eax # sched: [1:0.25]
	; HASWELL-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; HASWELL-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_andn_i16:			; BTVER2-LABEL: test_andn_i16:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: andnl %esi, %edi, %eax # sched: [1:0.50]			; BTVER2-NEXT: andnl %esi, %edi, %eax # sched: [1:0.50]
	; BTVER2-NEXT: notl %edi # sched: [1:0.50]			; BTVER2-NEXT: notl %edi # sched: [1:0.50]
	; BTVER2-NEXT: andw (%rdx), %di # sched: [4:1.00]			; BTVER2-NEXT: andw (%rdx), %di # sched: [4:1.00]
	; BTVER2-NEXT: addl %edi, %eax # sched: [1:0.50]			; BTVER2-NEXT: addl %edi, %eax # sched: [1:0.50]
	; BTVER2-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; BTVER2-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	Show All 21 Lines
	; GENERIC-NEXT: andnl %esi, %edi, %ecx # sched: [1:0.33]			; GENERIC-NEXT: andnl %esi, %edi, %ecx # sched: [1:0.33]
	; GENERIC-NEXT: andnl (%rdx), %edi, %eax # sched: [5:0.50]			; GENERIC-NEXT: andnl (%rdx), %edi, %eax # sched: [5:0.50]
	; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_andn_i32:			; HASWELL-LABEL: test_andn_i32:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: andnl %esi, %edi, %ecx # sched: [1:0.50]			; HASWELL-NEXT: andnl %esi, %edi, %ecx # sched: [1:0.50]
	; HASWELL-NEXT: andnl (%rdx), %edi, %eax # sched: [4:0.50]			; HASWELL-NEXT: andnl (%rdx), %edi, %eax # sched: [1:0.50]
	; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]			; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_andn_i32:			; BTVER2-LABEL: test_andn_i32:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: andnl (%rdx), %edi, %eax # sched: [4:1.00]			; BTVER2-NEXT: andnl (%rdx), %edi, %eax # sched: [4:1.00]
	; BTVER2-NEXT: andnl %esi, %edi, %ecx # sched: [1:0.50]			; BTVER2-NEXT: andnl %esi, %edi, %ecx # sched: [1:0.50]
	; BTVER2-NEXT: addl %ecx, %eax # sched: [1:0.50]			; BTVER2-NEXT: addl %ecx, %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 17 Lines
	; GENERIC-NEXT: andnq %rsi, %rdi, %rcx # sched: [1:0.33]			; GENERIC-NEXT: andnq %rsi, %rdi, %rcx # sched: [1:0.33]
	; GENERIC-NEXT: andnq (%rdx), %rdi, %rax # sched: [5:0.50]			; GENERIC-NEXT: andnq (%rdx), %rdi, %rax # sched: [5:0.50]
	; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]			; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_andn_i64:			; HASWELL-LABEL: test_andn_i64:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: andnq %rsi, %rdi, %rcx # sched: [1:0.50]			; HASWELL-NEXT: andnq %rsi, %rdi, %rcx # sched: [1:0.50]
	; HASWELL-NEXT: andnq (%rdx), %rdi, %rax # sched: [4:0.50]			; HASWELL-NEXT: andnq (%rdx), %rdi, %rax # sched: [1:0.50]
	; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]			; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_andn_i64:			; BTVER2-LABEL: test_andn_i64:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: andnq (%rdx), %rdi, %rax # sched: [4:1.00]			; BTVER2-NEXT: andnq (%rdx), %rdi, %rax # sched: [4:1.00]
	; BTVER2-NEXT: andnq %rsi, %rdi, %rcx # sched: [1:0.50]			; BTVER2-NEXT: andnq %rsi, %rdi, %rcx # sched: [1:0.50]
	; BTVER2-NEXT: addq %rcx, %rax # sched: [1:0.50]			; BTVER2-NEXT: addq %rcx, %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 16 Lines
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: bextrl %edi, (%rdx), %ecx			; GENERIC-NEXT: bextrl %edi, (%rdx), %ecx
	; GENERIC-NEXT: bextrl %edi, %esi, %eax			; GENERIC-NEXT: bextrl %edi, %esi, %eax
	; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_bextr_i32:			; HASWELL-LABEL: test_bextr_i32:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: bextrl %edi, (%rdx), %ecx # sched: [6:0.50]			; HASWELL-NEXT: bextrl %edi, (%rdx), %ecx # sched: [2:0.50]
	; HASWELL-NEXT: bextrl %edi, %esi, %eax # sched: [2:0.50]			; HASWELL-NEXT: bextrl %edi, %esi, %eax # sched: [2:0.50]
	; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]			; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_bextr_i32:			; BTVER2-LABEL: test_bextr_i32:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: bextrl %edi, (%rdx), %ecx			; BTVER2-NEXT: bextrl %edi, (%rdx), %ecx
	; BTVER2-NEXT: bextrl %edi, %esi, %eax			; BTVER2-NEXT: bextrl %edi, %esi, %eax
	; BTVER2-NEXT: addl %ecx, %eax # sched: [1:0.50]			; BTVER2-NEXT: addl %ecx, %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 16 Lines
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: bextrq %rdi, (%rdx), %rcx			; GENERIC-NEXT: bextrq %rdi, (%rdx), %rcx
	; GENERIC-NEXT: bextrq %rdi, %rsi, %rax			; GENERIC-NEXT: bextrq %rdi, %rsi, %rax
	; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]			; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_bextr_i64:			; HASWELL-LABEL: test_bextr_i64:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: bextrq %rdi, (%rdx), %rcx # sched: [6:0.50]			; HASWELL-NEXT: bextrq %rdi, (%rdx), %rcx # sched: [2:0.50]
	; HASWELL-NEXT: bextrq %rdi, %rsi, %rax # sched: [2:0.50]			; HASWELL-NEXT: bextrq %rdi, %rsi, %rax # sched: [2:0.50]
	; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]			; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_bextr_i64:			; BTVER2-LABEL: test_bextr_i64:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: bextrq %rdi, (%rdx), %rcx			; BTVER2-NEXT: bextrq %rdi, (%rdx), %rcx
	; BTVER2-NEXT: bextrq %rdi, %rsi, %rax			; BTVER2-NEXT: bextrq %rdi, %rsi, %rax
	; BTVER2-NEXT: addq %rcx, %rax # sched: [1:0.50]			; BTVER2-NEXT: addq %rcx, %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 16 Lines
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: blsil (%rsi), %ecx			; GENERIC-NEXT: blsil (%rsi), %ecx
	; GENERIC-NEXT: blsil %edi, %eax			; GENERIC-NEXT: blsil %edi, %eax
	; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_blsi_i32:			; HASWELL-LABEL: test_blsi_i32:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: blsil (%rsi), %ecx # sched: [4:0.50]			; HASWELL-NEXT: blsil (%rsi), %ecx # sched: [1:0.50]
	; HASWELL-NEXT: blsil %edi, %eax # sched: [1:0.50]			; HASWELL-NEXT: blsil %edi, %eax # sched: [1:0.50]
	; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]			; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_blsi_i32:			; BTVER2-LABEL: test_blsi_i32:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: blsil (%rsi), %ecx			; BTVER2-NEXT: blsil (%rsi), %ecx
	; BTVER2-NEXT: blsil %edi, %eax			; BTVER2-NEXT: blsil %edi, %eax
	; BTVER2-NEXT: addl %ecx, %eax # sched: [1:0.50]			; BTVER2-NEXT: addl %ecx, %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 17 Lines
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: blsiq (%rsi), %rcx			; GENERIC-NEXT: blsiq (%rsi), %rcx
	; GENERIC-NEXT: blsiq %rdi, %rax			; GENERIC-NEXT: blsiq %rdi, %rax
	; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]			; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_blsi_i64:			; HASWELL-LABEL: test_blsi_i64:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: blsiq (%rsi), %rcx # sched: [4:0.50]			; HASWELL-NEXT: blsiq (%rsi), %rcx # sched: [1:0.50]
	; HASWELL-NEXT: blsiq %rdi, %rax # sched: [1:0.50]			; HASWELL-NEXT: blsiq %rdi, %rax # sched: [1:0.50]
	; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]			; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_blsi_i64:			; BTVER2-LABEL: test_blsi_i64:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: blsiq (%rsi), %rcx			; BTVER2-NEXT: blsiq (%rsi), %rcx
	; BTVER2-NEXT: blsiq %rdi, %rax			; BTVER2-NEXT: blsiq %rdi, %rax
	; BTVER2-NEXT: addq %rcx, %rax # sched: [1:0.50]			; BTVER2-NEXT: addq %rcx, %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 17 Lines
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: blsmskl (%rsi), %ecx			; GENERIC-NEXT: blsmskl (%rsi), %ecx
	; GENERIC-NEXT: blsmskl %edi, %eax			; GENERIC-NEXT: blsmskl %edi, %eax
	; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_blsmsk_i32:			; HASWELL-LABEL: test_blsmsk_i32:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: blsmskl (%rsi), %ecx # sched: [4:0.50]			; HASWELL-NEXT: blsmskl (%rsi), %ecx # sched: [1:0.50]
	; HASWELL-NEXT: blsmskl %edi, %eax # sched: [1:0.50]			; HASWELL-NEXT: blsmskl %edi, %eax # sched: [1:0.50]
	; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]			; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_blsmsk_i32:			; BTVER2-LABEL: test_blsmsk_i32:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: blsmskl (%rsi), %ecx			; BTVER2-NEXT: blsmskl (%rsi), %ecx
	; BTVER2-NEXT: blsmskl %edi, %eax			; BTVER2-NEXT: blsmskl %edi, %eax
	; BTVER2-NEXT: addl %ecx, %eax # sched: [1:0.50]			; BTVER2-NEXT: addl %ecx, %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 17 Lines
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: blsmskq (%rsi), %rcx			; GENERIC-NEXT: blsmskq (%rsi), %rcx
	; GENERIC-NEXT: blsmskq %rdi, %rax			; GENERIC-NEXT: blsmskq %rdi, %rax
	; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]			; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_blsmsk_i64:			; HASWELL-LABEL: test_blsmsk_i64:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: blsmskq (%rsi), %rcx # sched: [4:0.50]			; HASWELL-NEXT: blsmskq (%rsi), %rcx # sched: [1:0.50]
	; HASWELL-NEXT: blsmskq %rdi, %rax # sched: [1:0.50]			; HASWELL-NEXT: blsmskq %rdi, %rax # sched: [1:0.50]
	; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]			; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_blsmsk_i64:			; BTVER2-LABEL: test_blsmsk_i64:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: blsmskq (%rsi), %rcx			; BTVER2-NEXT: blsmskq (%rsi), %rcx
	; BTVER2-NEXT: blsmskq %rdi, %rax			; BTVER2-NEXT: blsmskq %rdi, %rax
	; BTVER2-NEXT: addq %rcx, %rax # sched: [1:0.50]			; BTVER2-NEXT: addq %rcx, %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 17 Lines
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: blsrl (%rsi), %ecx			; GENERIC-NEXT: blsrl (%rsi), %ecx
	; GENERIC-NEXT: blsrl %edi, %eax			; GENERIC-NEXT: blsrl %edi, %eax
	; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_blsr_i32:			; HASWELL-LABEL: test_blsr_i32:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: blsrl (%rsi), %ecx # sched: [4:0.50]			; HASWELL-NEXT: blsrl (%rsi), %ecx # sched: [1:0.50]
	; HASWELL-NEXT: blsrl %edi, %eax # sched: [1:0.50]			; HASWELL-NEXT: blsrl %edi, %eax # sched: [1:0.50]
	; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]			; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_blsr_i32:			; BTVER2-LABEL: test_blsr_i32:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: blsrl (%rsi), %ecx			; BTVER2-NEXT: blsrl (%rsi), %ecx
	; BTVER2-NEXT: blsrl %edi, %eax			; BTVER2-NEXT: blsrl %edi, %eax
	; BTVER2-NEXT: addl %ecx, %eax # sched: [1:0.50]			; BTVER2-NEXT: addl %ecx, %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 17 Lines
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: blsrq (%rsi), %rcx			; GENERIC-NEXT: blsrq (%rsi), %rcx
	; GENERIC-NEXT: blsrq %rdi, %rax			; GENERIC-NEXT: blsrq %rdi, %rax
	; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]			; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_blsr_i64:			; HASWELL-LABEL: test_blsr_i64:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: blsrq (%rsi), %rcx # sched: [4:0.50]			; HASWELL-NEXT: blsrq (%rsi), %rcx # sched: [1:0.50]
	; HASWELL-NEXT: blsrq %rdi, %rax # sched: [1:0.50]			; HASWELL-NEXT: blsrq %rdi, %rax # sched: [1:0.50]
	; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]			; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_blsr_i64:			; BTVER2-LABEL: test_blsr_i64:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: blsrq (%rsi), %rcx			; BTVER2-NEXT: blsrq (%rsi), %rcx
	; BTVER2-NEXT: blsrq %rdi, %rax			; BTVER2-NEXT: blsrq %rdi, %rax
	; BTVER2-NEXT: addq %rcx, %rax # sched: [1:0.50]			; BTVER2-NEXT: addq %rcx, %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 18 Lines
	; GENERIC-NEXT: tzcntw (%rsi), %cx			; GENERIC-NEXT: tzcntw (%rsi), %cx
	; GENERIC-NEXT: tzcntw %di, %ax			; GENERIC-NEXT: tzcntw %di, %ax
	; GENERIC-NEXT: orl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: orl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; GENERIC-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cttz_i16:			; HASWELL-LABEL: test_cttz_i16:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: tzcntw (%rsi), %cx # sched: [7:1.00]			; HASWELL-NEXT: tzcntw (%rsi), %cx # sched: [3:1.00]
	; HASWELL-NEXT: tzcntw %di, %ax # sched: [3:1.00]			; HASWELL-NEXT: tzcntw %di, %ax # sched: [3:1.00]
	; HASWELL-NEXT: orl %ecx, %eax # sched: [1:0.25]			; HASWELL-NEXT: orl %ecx, %eax # sched: [1:0.25]
	; HASWELL-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; HASWELL-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cttz_i16:			; BTVER2-LABEL: test_cttz_i16:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: tzcntw (%rsi), %cx			; BTVER2-NEXT: tzcntw (%rsi), %cx
	; BTVER2-NEXT: tzcntw %di, %ax			; BTVER2-NEXT: tzcntw %di, %ax
	; BTVER2-NEXT: orl %ecx, %eax # sched: [1:0.50]			; BTVER2-NEXT: orl %ecx, %eax # sched: [1:0.50]
	; BTVER2-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; BTVER2-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	Show All 18 Lines
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: tzcntl (%rsi), %ecx			; GENERIC-NEXT: tzcntl (%rsi), %ecx
	; GENERIC-NEXT: tzcntl %edi, %eax			; GENERIC-NEXT: tzcntl %edi, %eax
	; GENERIC-NEXT: orl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: orl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cttz_i32:			; HASWELL-LABEL: test_cttz_i32:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: tzcntl (%rsi), %ecx # sched: [7:1.00]			; HASWELL-NEXT: tzcntl (%rsi), %ecx # sched: [3:1.00]
	; HASWELL-NEXT: tzcntl %edi, %eax # sched: [3:1.00]			; HASWELL-NEXT: tzcntl %edi, %eax # sched: [3:1.00]
	; HASWELL-NEXT: orl %ecx, %eax # sched: [1:0.25]			; HASWELL-NEXT: orl %ecx, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cttz_i32:			; BTVER2-LABEL: test_cttz_i32:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: tzcntl (%rsi), %ecx			; BTVER2-NEXT: tzcntl (%rsi), %ecx
	; BTVER2-NEXT: tzcntl %edi, %eax			; BTVER2-NEXT: tzcntl %edi, %eax
	; BTVER2-NEXT: orl %ecx, %eax # sched: [1:0.50]			; BTVER2-NEXT: orl %ecx, %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 16 Lines
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: tzcntq (%rsi), %rcx			; GENERIC-NEXT: tzcntq (%rsi), %rcx
	; GENERIC-NEXT: tzcntq %rdi, %rax			; GENERIC-NEXT: tzcntq %rdi, %rax
	; GENERIC-NEXT: orq %rcx, %rax # sched: [1:0.33]			; GENERIC-NEXT: orq %rcx, %rax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cttz_i64:			; HASWELL-LABEL: test_cttz_i64:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: tzcntq (%rsi), %rcx # sched: [7:1.00]			; HASWELL-NEXT: tzcntq (%rsi), %rcx # sched: [3:1.00]
	; HASWELL-NEXT: tzcntq %rdi, %rax # sched: [3:1.00]			; HASWELL-NEXT: tzcntq %rdi, %rax # sched: [3:1.00]
	; HASWELL-NEXT: orq %rcx, %rax # sched: [1:0.25]			; HASWELL-NEXT: orq %rcx, %rax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cttz_i64:			; BTVER2-LABEL: test_cttz_i64:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: tzcntq (%rsi), %rcx			; BTVER2-NEXT: tzcntq (%rsi), %rcx
	; BTVER2-NEXT: tzcntq %rdi, %rax			; BTVER2-NEXT: tzcntq %rdi, %rax
	; BTVER2-NEXT: orq %rcx, %rax # sched: [1:0.50]			; BTVER2-NEXT: orq %rcx, %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 13 Lines

test/CodeGen/X86/bmi2-schedule.ll

	Show All 9 Lines
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: bzhil %edi, (%rdx), %ecx			; GENERIC-NEXT: bzhil %edi, (%rdx), %ecx
	; GENERIC-NEXT: bzhil %edi, %esi, %eax			; GENERIC-NEXT: bzhil %edi, %esi, %eax
	; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_bzhi_i32:			; HASWELL-LABEL: test_bzhi_i32:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: bzhil %edi, (%rdx), %ecx # sched: [4:0.50]			; HASWELL-NEXT: bzhil %edi, (%rdx), %ecx # sched: [1:0.50]
	; HASWELL-NEXT: bzhil %edi, %esi, %eax # sched: [1:0.50]			; HASWELL-NEXT: bzhil %edi, %esi, %eax # sched: [1:0.50]
	; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]			; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_bzhi_i32:			; ZNVER1-LABEL: test_bzhi_i32:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: bzhil %edi, (%rdx), %ecx			; ZNVER1-NEXT: bzhil %edi, (%rdx), %ecx
	; ZNVER1-NEXT: bzhil %edi, %esi, %eax			; ZNVER1-NEXT: bzhil %edi, %esi, %eax
	; ZNVER1-NEXT: addl %ecx, %eax # sched: [1:0.25]			; ZNVER1-NEXT: addl %ecx, %eax # sched: [1:0.25]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = load i32, i32 *%a2			%1 = load i32, i32 *%a2
	Show All 9 Lines
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: bzhiq %rdi, (%rdx), %rcx			; GENERIC-NEXT: bzhiq %rdi, (%rdx), %rcx
	; GENERIC-NEXT: bzhiq %rdi, %rsi, %rax			; GENERIC-NEXT: bzhiq %rdi, %rsi, %rax
	; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]			; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_bzhi_i64:			; HASWELL-LABEL: test_bzhi_i64:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: bzhiq %rdi, (%rdx), %rcx # sched: [4:0.50]			; HASWELL-NEXT: bzhiq %rdi, (%rdx), %rcx # sched: [1:0.50]
	; HASWELL-NEXT: bzhiq %rdi, %rsi, %rax # sched: [1:0.50]			; HASWELL-NEXT: bzhiq %rdi, %rsi, %rax # sched: [1:0.50]
	; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]			; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_bzhi_i64:			; ZNVER1-LABEL: test_bzhi_i64:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: bzhiq %rdi, (%rdx), %rcx			; ZNVER1-NEXT: bzhiq %rdi, (%rdx), %rcx
	; ZNVER1-NEXT: bzhiq %rdi, %rsi, %rax			; ZNVER1-NEXT: bzhiq %rdi, %rsi, %rax
	; ZNVER1-NEXT: addq %rcx, %rax # sched: [1:0.25]			; ZNVER1-NEXT: addq %rcx, %rax # sched: [1:0.25]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = load i64, i64 *%a2			%1 = load i64, i64 *%a2
	Show All 9 Lines
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: pdepl (%rdx), %edi, %ecx			; GENERIC-NEXT: pdepl (%rdx), %edi, %ecx
	; GENERIC-NEXT: pdepl %esi, %edi, %eax			; GENERIC-NEXT: pdepl %esi, %edi, %eax
	; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pdep_i32:			; HASWELL-LABEL: test_pdep_i32:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: pdepl (%rdx), %edi, %ecx # sched: [7:1.00]			; HASWELL-NEXT: pdepl (%rdx), %edi, %ecx # sched: [3:1.00]
	; HASWELL-NEXT: pdepl %esi, %edi, %eax # sched: [3:1.00]			; HASWELL-NEXT: pdepl %esi, %edi, %eax # sched: [3:1.00]
	; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]			; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_pdep_i32:			; ZNVER1-LABEL: test_pdep_i32:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: pdepl (%rdx), %edi, %ecx			; ZNVER1-NEXT: pdepl (%rdx), %edi, %ecx
	; ZNVER1-NEXT: pdepl %esi, %edi, %eax			; ZNVER1-NEXT: pdepl %esi, %edi, %eax
	; ZNVER1-NEXT: addl %ecx, %eax # sched: [1:0.25]			; ZNVER1-NEXT: addl %ecx, %eax # sched: [1:0.25]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = load i32, i32 *%a2			%1 = load i32, i32 *%a2
	Show All 9 Lines
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: pdepq (%rdx), %rdi, %rcx			; GENERIC-NEXT: pdepq (%rdx), %rdi, %rcx
	; GENERIC-NEXT: pdepq %rsi, %rdi, %rax			; GENERIC-NEXT: pdepq %rsi, %rdi, %rax
	; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]			; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pdep_i64:			; HASWELL-LABEL: test_pdep_i64:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: pdepq (%rdx), %rdi, %rcx # sched: [7:1.00]			; HASWELL-NEXT: pdepq (%rdx), %rdi, %rcx # sched: [3:1.00]
	; HASWELL-NEXT: pdepq %rsi, %rdi, %rax # sched: [3:1.00]			; HASWELL-NEXT: pdepq %rsi, %rdi, %rax # sched: [3:1.00]
	; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]			; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_pdep_i64:			; ZNVER1-LABEL: test_pdep_i64:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: pdepq (%rdx), %rdi, %rcx			; ZNVER1-NEXT: pdepq (%rdx), %rdi, %rcx
	; ZNVER1-NEXT: pdepq %rsi, %rdi, %rax			; ZNVER1-NEXT: pdepq %rsi, %rdi, %rax
	; ZNVER1-NEXT: addq %rcx, %rax # sched: [1:0.25]			; ZNVER1-NEXT: addq %rcx, %rax # sched: [1:0.25]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = load i64, i64 *%a2			%1 = load i64, i64 *%a2
	Show All 9 Lines
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: pextl (%rdx), %edi, %ecx			; GENERIC-NEXT: pextl (%rdx), %edi, %ecx
	; GENERIC-NEXT: pextl %esi, %edi, %eax			; GENERIC-NEXT: pextl %esi, %edi, %eax
	; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pext_i32:			; HASWELL-LABEL: test_pext_i32:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: pextl (%rdx), %edi, %ecx # sched: [7:1.00]			; HASWELL-NEXT: pextl (%rdx), %edi, %ecx # sched: [3:1.00]
	; HASWELL-NEXT: pextl %esi, %edi, %eax # sched: [3:1.00]			; HASWELL-NEXT: pextl %esi, %edi, %eax # sched: [3:1.00]
	; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]			; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_pext_i32:			; ZNVER1-LABEL: test_pext_i32:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: pextl (%rdx), %edi, %ecx			; ZNVER1-NEXT: pextl (%rdx), %edi, %ecx
	; ZNVER1-NEXT: pextl %esi, %edi, %eax			; ZNVER1-NEXT: pextl %esi, %edi, %eax
	; ZNVER1-NEXT: addl %ecx, %eax # sched: [1:0.25]			; ZNVER1-NEXT: addl %ecx, %eax # sched: [1:0.25]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = load i32, i32 *%a2			%1 = load i32, i32 *%a2
	Show All 9 Lines
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: pextq (%rdx), %rdi, %rcx			; GENERIC-NEXT: pextq (%rdx), %rdi, %rcx
	; GENERIC-NEXT: pextq %rsi, %rdi, %rax			; GENERIC-NEXT: pextq %rsi, %rdi, %rax
	; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]			; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pext_i64:			; HASWELL-LABEL: test_pext_i64:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: pextq (%rdx), %rdi, %rcx # sched: [7:1.00]			; HASWELL-NEXT: pextq (%rdx), %rdi, %rcx # sched: [3:1.00]
	; HASWELL-NEXT: pextq %rsi, %rdi, %rax # sched: [3:1.00]			; HASWELL-NEXT: pextq %rsi, %rdi, %rax # sched: [3:1.00]
	; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]			; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; ZNVER1-LABEL: test_pext_i64:			; ZNVER1-LABEL: test_pext_i64:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: pextq (%rdx), %rdi, %rcx			; ZNVER1-NEXT: pextq (%rdx), %rdi, %rcx
	; ZNVER1-NEXT: pextq %rsi, %rdi, %rax			; ZNVER1-NEXT: pextq %rsi, %rdi, %rax
	; ZNVER1-NEXT: addq %rcx, %rax # sched: [1:0.25]			; ZNVER1-NEXT: addq %rcx, %rax # sched: [1:0.25]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%1 = load i64, i64 *%a2			%1 = load i64, i64 *%a2
	%2 = tail call i64 @llvm.x86.bmi.pext.64(i64 %a0, i64 %1)			%2 = tail call i64 @llvm.x86.bmi.pext.64(i64 %a0, i64 %1)
	%3 = tail call i64 @llvm.x86.bmi.pext.64(i64 %a0, i64 %a1)			%3 = tail call i64 @llvm.x86.bmi.pext.64(i64 %a0, i64 %a1)
	%4 = add i64 %2, %3			%4 = add i64 %2, %3
	ret i64 %4			ret i64 %4
	}			}
	declare i64 @llvm.x86.bmi.pext.64(i64, i64)			declare i64 @llvm.x86.bmi.pext.64(i64, i64)

test/CodeGen/X86/f16c-schedule.ll

	Show All 17 Lines
	; IVY: # BB#0:			; IVY: # BB#0:
	; IVY-NEXT: vcvtph2ps (%rdi), %xmm1 # sched: [7:1.00]			; IVY-NEXT: vcvtph2ps (%rdi), %xmm1 # sched: [7:1.00]
	; IVY-NEXT: vcvtph2ps %xmm0, %xmm0 # sched: [3:1.00]			; IVY-NEXT: vcvtph2ps %xmm0, %xmm0 # sched: [3:1.00]
	; IVY-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; IVY-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; IVY-NEXT: retq # sched: [1:1.00]			; IVY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vcvtph2ps_128:			; HASWELL-LABEL: test_vcvtph2ps_128:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtph2ps (%rdi), %xmm1 # sched: [7:1.00]			; HASWELL-NEXT: vcvtph2ps (%rdi), %xmm1 # sched: [1:1.00]
	; HASWELL-NEXT: vcvtph2ps %xmm0, %xmm0 # sched: [4:1.00]			; HASWELL-NEXT: vcvtph2ps %xmm0, %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_vcvtph2ps_128:			; BTVER2-LABEL: test_vcvtph2ps_128:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtph2ps (%rdi), %xmm1 # sched: [8:1.00]			; BTVER2-NEXT: vcvtph2ps (%rdi), %xmm1 # sched: [8:1.00]
	; BTVER2-NEXT: vcvtph2ps %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvtph2ps %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 23 Lines
	; IVY: # BB#0:			; IVY: # BB#0:
	; IVY-NEXT: vcvtph2ps (%rdi), %ymm1 # sched: [7:1.00]			; IVY-NEXT: vcvtph2ps (%rdi), %ymm1 # sched: [7:1.00]
	; IVY-NEXT: vcvtph2ps %xmm0, %ymm0 # sched: [3:1.00]			; IVY-NEXT: vcvtph2ps %xmm0, %ymm0 # sched: [3:1.00]
	; IVY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; IVY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; IVY-NEXT: retq # sched: [1:1.00]			; IVY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vcvtph2ps_256:			; HASWELL-LABEL: test_vcvtph2ps_256:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtph2ps (%rdi), %ymm1 # sched: [7:1.00]			; HASWELL-NEXT: vcvtph2ps (%rdi), %ymm1 # sched: [1:1.00]
	; HASWELL-NEXT: vcvtph2ps %xmm0, %ymm0 # sched: [4:1.00]			; HASWELL-NEXT: vcvtph2ps %xmm0, %ymm0 # sched: [2:1.00]
	; HASWELL-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_vcvtph2ps_256:			; BTVER2-LABEL: test_vcvtph2ps_256:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtph2ps (%rdi), %ymm1 # sched: [8:1.00]			; BTVER2-NEXT: vcvtph2ps (%rdi), %ymm1 # sched: [8:1.00]
	; BTVER2-NEXT: vcvtph2ps %xmm0, %ymm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvtph2ps %xmm0, %ymm0 # sched: [3:1.00]
	; BTVER2-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:2.00]			; BTVER2-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 22 Lines
	; IVY: # BB#0:			; IVY: # BB#0:
	; IVY-NEXT: vcvtps2ph $0, %xmm0, %xmm0 # sched: [3:1.00]			; IVY-NEXT: vcvtps2ph $0, %xmm0, %xmm0 # sched: [3:1.00]
	; IVY-NEXT: vcvtps2ph $0, %xmm1, (%rdi) # sched: [7:1.00]			; IVY-NEXT: vcvtps2ph $0, %xmm1, (%rdi) # sched: [7:1.00]
	; IVY-NEXT: retq # sched: [1:1.00]			; IVY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vcvtps2ph_128:			; HASWELL-LABEL: test_vcvtps2ph_128:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtps2ph $0, %xmm0, %xmm0 # sched: [4:1.00]			; HASWELL-NEXT: vcvtps2ph $0, %xmm0, %xmm0 # sched: [4:1.00]
	; HASWELL-NEXT: vcvtps2ph $0, %xmm1, (%rdi) # sched: [8:1.00]			; HASWELL-NEXT: vcvtps2ph $0, %xmm1, (%rdi) # sched: [4:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_vcvtps2ph_128:			; BTVER2-LABEL: test_vcvtps2ph_128:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtps2ph $0, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvtps2ph $0, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vcvtps2ph $0, %xmm1, (%rdi) # sched: [8:1.00]			; BTVER2-NEXT: vcvtps2ph $0, %xmm1, (%rdi) # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_vcvtps2ph_128:			; ZNVER1-LABEL: test_vcvtps2ph_128:
	Show All 21 Lines
	; IVY: # BB#0:			; IVY: # BB#0:
	; IVY-NEXT: vcvtps2ph $0, %ymm0, %xmm0 # sched: [3:1.00]			; IVY-NEXT: vcvtps2ph $0, %ymm0, %xmm0 # sched: [3:1.00]
	; IVY-NEXT: vcvtps2ph $0, %ymm1, (%rdi) # sched: [7:1.00]			; IVY-NEXT: vcvtps2ph $0, %ymm1, (%rdi) # sched: [7:1.00]
	; IVY-NEXT: vzeroupper			; IVY-NEXT: vzeroupper
	; IVY-NEXT: retq # sched: [1:1.00]			; IVY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vcvtps2ph_256:			; HASWELL-LABEL: test_vcvtps2ph_256:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtps2ph $0, %ymm0, %xmm0 # sched: [4:1.00]			; HASWELL-NEXT: vcvtps2ph $0, %ymm0, %xmm0 # sched: [6:1.00]
	; HASWELL-NEXT: vcvtps2ph $0, %ymm1, (%rdi) # sched: [8:1.00]			; HASWELL-NEXT: vcvtps2ph $0, %ymm1, (%rdi) # sched: [6:1.00]
	; HASWELL-NEXT: vzeroupper # sched: [1:?]			; HASWELL-NEXT: vzeroupper # sched: [4:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_vcvtps2ph_256:			; BTVER2-LABEL: test_vcvtps2ph_256:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtps2ph $0, %ymm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvtps2ph $0, %ymm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vcvtps2ph $0, %ymm1, (%rdi) # sched: [8:1.00]			; BTVER2-NEXT: vcvtps2ph $0, %ymm1, (%rdi) # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_vcvtps2ph_256:			; ZNVER1-LABEL: test_vcvtps2ph_256:
	Show All 11 Lines

test/CodeGen/X86/lea32-schedule.ll

	Show All 39 Lines
	; SANDY-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; SANDY-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; SANDY-NEXT: leal -24(%rdi), %eax # sched: [1:0.50]			; SANDY-NEXT: leal -24(%rdi), %eax # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lea_offset:			; HASWELL-LABEL: test_lea_offset:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; HASWELL-NEXT: leal -24(%rdi), %eax # sched: [1:0.50]			; HASWELL-NEXT: leal -24(%rdi), %eax # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_offset:			; BTVER2-LABEL: test_lea_offset:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; BTVER2-NEXT: leal -24(%rdi), %eax # sched: [1:0.50]			; BTVER2-NEXT: leal -24(%rdi), %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_lea_offset:			; ZNVER1-LABEL: test_lea_offset:
	Show All 35 Lines
	; SANDY-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; SANDY-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; SANDY-NEXT: leal 1024(%rdi), %eax # sched: [1:0.50]			; SANDY-NEXT: leal 1024(%rdi), %eax # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lea_offset_big:			; HASWELL-LABEL: test_lea_offset_big:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; HASWELL-NEXT: leal 1024(%rdi), %eax # sched: [1:0.50]			; HASWELL-NEXT: leal 1024(%rdi), %eax # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_offset_big:			; BTVER2-LABEL: test_lea_offset_big:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; BTVER2-NEXT: leal 1024(%rdi), %eax # sched: [1:0.50]			; BTVER2-NEXT: leal 1024(%rdi), %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_lea_offset_big:			; ZNVER1-LABEL: test_lea_offset_big:
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: leal (%rdi,%rsi), %eax # sched: [1:0.50]			; SANDY-NEXT: leal (%rdi,%rsi), %eax # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lea_add:			; HASWELL-LABEL: test_lea_add:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>			; HASWELL-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>
	; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; HASWELL-NEXT: leal (%rdi,%rsi), %eax # sched: [1:0.50]			; HASWELL-NEXT: leal (%rdi,%rsi), %eax # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_add:			; BTVER2-LABEL: test_lea_add:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>			; BTVER2-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>
	; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; BTVER2-NEXT: leal (%rdi,%rsi), %eax # sched: [1:0.50]			; BTVER2-NEXT: leal (%rdi,%rsi), %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lea_add_offset:			; HASWELL-LABEL: test_lea_add_offset:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>			; HASWELL-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>
	; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; HASWELL-NEXT: leal (%rdi,%rsi), %eax # sched: [1:0.50]			; HASWELL-NEXT: leal (%rdi,%rsi), %eax # sched: [1:0.50]
	; HASWELL-NEXT: addl $16, %eax # sched: [1:0.25]			; HASWELL-NEXT: addl $16, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_add_offset:			; BTVER2-LABEL: test_lea_add_offset:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>			; BTVER2-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>
	; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; BTVER2-NEXT: leal 16(%rdi,%rsi), %eax # sched: [1:0.50]			; BTVER2-NEXT: leal 16(%rdi,%rsi), %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	;			;
	; HASWELL-LABEL: test_lea_add_offset_big:			; HASWELL-LABEL: test_lea_add_offset_big:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>			; HASWELL-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>
	; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; HASWELL-NEXT: leal (%rdi,%rsi), %eax # sched: [1:0.50]			; HASWELL-NEXT: leal (%rdi,%rsi), %eax # sched: [1:0.50]
	; HASWELL-NEXT: addl $-4096, %eax # imm = 0xF000			; HASWELL-NEXT: addl $-4096, %eax # imm = 0xF000
	; HASWELL-NEXT: # sched: [1:0.25]			; HASWELL-NEXT: # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_add_offset_big:			; BTVER2-LABEL: test_lea_add_offset_big:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>			; BTVER2-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>
	; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; BTVER2-NEXT: leal -4096(%rdi,%rsi), %eax # sched: [1:0.50]			; BTVER2-NEXT: leal -4096(%rdi,%rsi), %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 38 Lines
	; SANDY-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; SANDY-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; SANDY-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]			; SANDY-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lea_mul:			; HASWELL-LABEL: test_lea_mul:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; HASWELL-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]			; HASWELL-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_mul:			; BTVER2-LABEL: test_lea_mul:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; BTVER2-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]			; BTVER2-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_lea_mul:			; ZNVER1-LABEL: test_lea_mul:
	Show All 37 Lines
	; SANDY-NEXT: addl $-32, %eax # sched: [1:0.33]			; SANDY-NEXT: addl $-32, %eax # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lea_mul_offset:			; HASWELL-LABEL: test_lea_mul_offset:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; HASWELL-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]			; HASWELL-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]
	; HASWELL-NEXT: addl $-32, %eax # sched: [1:0.25]			; HASWELL-NEXT: addl $-32, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_mul_offset:			; BTVER2-LABEL: test_lea_mul_offset:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; BTVER2-NEXT: leal -32(%rdi,%rdi,2), %eax # sched: [1:0.50]			; BTVER2-NEXT: leal -32(%rdi,%rdi,2), %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_lea_mul_offset:			; ZNVER1-LABEL: test_lea_mul_offset:
	Show All 40 Lines
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lea_mul_offset_big:			; HASWELL-LABEL: test_lea_mul_offset_big:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; HASWELL-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]			; HASWELL-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]
	; HASWELL-NEXT: addl $10000, %eax # imm = 0x2710			; HASWELL-NEXT: addl $10000, %eax # imm = 0x2710
	; HASWELL-NEXT: # sched: [1:0.25]			; HASWELL-NEXT: # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_mul_offset_big:			; BTVER2-LABEL: test_lea_mul_offset_big:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; BTVER2-NEXT: leal 10000(%rdi,%rdi,8), %eax # sched: [1:0.50]			; BTVER2-NEXT: leal 10000(%rdi,%rdi,8), %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_lea_mul_offset_big:			; ZNVER1-LABEL: test_lea_mul_offset_big:
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: leal (%rdi,%rsi,2), %eax # sched: [1:0.50]			; SANDY-NEXT: leal (%rdi,%rsi,2), %eax # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lea_add_scale:			; HASWELL-LABEL: test_lea_add_scale:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>			; HASWELL-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>
	; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; HASWELL-NEXT: leal (%rdi,%rsi,2), %eax # sched: [1:0.50]			; HASWELL-NEXT: leal (%rdi,%rsi,2), %eax # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_add_scale:			; BTVER2-LABEL: test_lea_add_scale:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>			; BTVER2-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>
	; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; BTVER2-NEXT: leal (%rdi,%rsi,2), %eax # sched: [1:0.50]			; BTVER2-NEXT: leal (%rdi,%rsi,2), %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lea_add_scale_offset:			; HASWELL-LABEL: test_lea_add_scale_offset:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>			; HASWELL-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>
	; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; HASWELL-NEXT: leal (%rdi,%rsi,4), %eax # sched: [1:0.50]			; HASWELL-NEXT: leal (%rdi,%rsi,4), %eax # sched: [1:0.50]
	; HASWELL-NEXT: addl $96, %eax # sched: [1:0.25]			; HASWELL-NEXT: addl $96, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_add_scale_offset:			; BTVER2-LABEL: test_lea_add_scale_offset:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>			; BTVER2-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>
	; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; BTVER2-NEXT: leal 96(%rdi,%rsi,4), %eax # sched: [1:0.50]			; BTVER2-NEXT: leal 96(%rdi,%rsi,4), %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	;			;
	; HASWELL-LABEL: test_lea_add_scale_offset_big:			; HASWELL-LABEL: test_lea_add_scale_offset_big:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>			; HASWELL-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>
	; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; HASWELL-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; HASWELL-NEXT: leal (%rdi,%rsi,8), %eax # sched: [1:0.50]			; HASWELL-NEXT: leal (%rdi,%rsi,8), %eax # sched: [1:0.50]
	; HASWELL-NEXT: addl $-1200, %eax # imm = 0xFB50			; HASWELL-NEXT: addl $-1200, %eax # imm = 0xFB50
	; HASWELL-NEXT: # sched: [1:0.25]			; HASWELL-NEXT: # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_add_scale_offset_big:			; BTVER2-LABEL: test_lea_add_scale_offset_big:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>			; BTVER2-NEXT: # kill: %ESI<def> %ESI<kill> %RSI<def>
	; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; BTVER2-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; BTVER2-NEXT: leal -1200(%rdi,%rsi,8), %eax # sched: [1:0.50]			; BTVER2-NEXT: leal -1200(%rdi,%rsi,8), %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 11 Lines

test/CodeGen/X86/lea64-schedule.ll

	Show All 34 Lines
	; SANDY-LABEL: test_lea_offset:			; SANDY-LABEL: test_lea_offset:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: leaq -24(%rdi), %rax # sched: [1:0.50]			; SANDY-NEXT: leaq -24(%rdi), %rax # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lea_offset:			; HASWELL-LABEL: test_lea_offset:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: leaq -24(%rdi), %rax # sched: [1:0.50]			; HASWELL-NEXT: leaq -24(%rdi), %rax # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_offset:			; BTVER2-LABEL: test_lea_offset:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: leaq -24(%rdi), %rax # sched: [1:0.50]			; BTVER2-NEXT: leaq -24(%rdi), %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_lea_offset:			; ZNVER1-LABEL: test_lea_offset:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 28 Lines
	; SANDY-LABEL: test_lea_offset_big:			; SANDY-LABEL: test_lea_offset_big:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: leaq 1024(%rdi), %rax # sched: [1:0.50]			; SANDY-NEXT: leaq 1024(%rdi), %rax # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lea_offset_big:			; HASWELL-LABEL: test_lea_offset_big:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: leaq 1024(%rdi), %rax # sched: [1:0.50]			; HASWELL-NEXT: leaq 1024(%rdi), %rax # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_offset_big:			; BTVER2-LABEL: test_lea_offset_big:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: leaq 1024(%rdi), %rax # sched: [1:0.50]			; BTVER2-NEXT: leaq 1024(%rdi), %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_lea_offset_big:			; ZNVER1-LABEL: test_lea_offset_big:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 29 Lines
	; SANDY-LABEL: test_lea_add:			; SANDY-LABEL: test_lea_add:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: leaq (%rdi,%rsi), %rax # sched: [1:0.50]			; SANDY-NEXT: leaq (%rdi,%rsi), %rax # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lea_add:			; HASWELL-LABEL: test_lea_add:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: leaq (%rdi,%rsi), %rax # sched: [1:0.50]			; HASWELL-NEXT: leaq (%rdi,%rsi), %rax # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_add:			; BTVER2-LABEL: test_lea_add:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: leaq (%rdi,%rsi), %rax # sched: [1:0.50]			; BTVER2-NEXT: leaq (%rdi,%rsi), %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_lea_add:			; ZNVER1-LABEL: test_lea_add:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 30 Lines
	; SANDY-NEXT: leaq (%rdi,%rsi), %rax # sched: [1:0.50]			; SANDY-NEXT: leaq (%rdi,%rsi), %rax # sched: [1:0.50]
	; SANDY-NEXT: addq $16, %rax # sched: [1:0.33]			; SANDY-NEXT: addq $16, %rax # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lea_add_offset:			; HASWELL-LABEL: test_lea_add_offset:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: leaq (%rdi,%rsi), %rax # sched: [1:0.50]			; HASWELL-NEXT: leaq (%rdi,%rsi), %rax # sched: [1:0.50]
	; HASWELL-NEXT: addq $16, %rax # sched: [1:0.25]			; HASWELL-NEXT: addq $16, %rax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_add_offset:			; BTVER2-LABEL: test_lea_add_offset:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: leaq 16(%rdi,%rsi), %rax # sched: [1:0.50]			; BTVER2-NEXT: leaq 16(%rdi,%rsi), %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_lea_add_offset:			; ZNVER1-LABEL: test_lea_add_offset:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 33 Lines
	; SANDY-NEXT: # sched: [1:0.33]			; SANDY-NEXT: # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lea_add_offset_big:			; HASWELL-LABEL: test_lea_add_offset_big:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: leaq (%rdi,%rsi), %rax # sched: [1:0.50]			; HASWELL-NEXT: leaq (%rdi,%rsi), %rax # sched: [1:0.50]
	; HASWELL-NEXT: addq $-4096, %rax # imm = 0xF000			; HASWELL-NEXT: addq $-4096, %rax # imm = 0xF000
	; HASWELL-NEXT: # sched: [1:0.25]			; HASWELL-NEXT: # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_add_offset_big:			; BTVER2-LABEL: test_lea_add_offset_big:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: leaq -4096(%rdi,%rsi), %rax # sched: [1:0.50]			; BTVER2-NEXT: leaq -4096(%rdi,%rsi), %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_lea_add_offset_big:			; ZNVER1-LABEL: test_lea_add_offset_big:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 29 Lines
	; SANDY-LABEL: test_lea_mul:			; SANDY-LABEL: test_lea_mul:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; SANDY-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lea_mul:			; HASWELL-LABEL: test_lea_mul:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; HASWELL-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_mul:			; BTVER2-LABEL: test_lea_mul:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; BTVER2-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_lea_mul:			; ZNVER1-LABEL: test_lea_mul:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 30 Lines
	; SANDY-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; SANDY-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; SANDY-NEXT: addq $-32, %rax # sched: [1:0.33]			; SANDY-NEXT: addq $-32, %rax # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lea_mul_offset:			; HASWELL-LABEL: test_lea_mul_offset:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; HASWELL-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; HASWELL-NEXT: addq $-32, %rax # sched: [1:0.25]			; HASWELL-NEXT: addq $-32, %rax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_mul_offset:			; BTVER2-LABEL: test_lea_mul_offset:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: leaq -32(%rdi,%rdi,2), %rax # sched: [1:0.50]			; BTVER2-NEXT: leaq -32(%rdi,%rdi,2), %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_lea_mul_offset:			; ZNVER1-LABEL: test_lea_mul_offset:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 33 Lines
	; SANDY-NEXT: # sched: [1:0.33]			; SANDY-NEXT: # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lea_mul_offset_big:			; HASWELL-LABEL: test_lea_mul_offset_big:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]			; HASWELL-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]
	; HASWELL-NEXT: addq $10000, %rax # imm = 0x2710			; HASWELL-NEXT: addq $10000, %rax # imm = 0x2710
	; HASWELL-NEXT: # sched: [1:0.25]			; HASWELL-NEXT: # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_mul_offset_big:			; BTVER2-LABEL: test_lea_mul_offset_big:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: leaq 10000(%rdi,%rdi,8), %rax # sched: [1:0.50]			; BTVER2-NEXT: leaq 10000(%rdi,%rdi,8), %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_lea_mul_offset_big:			; ZNVER1-LABEL: test_lea_mul_offset_big:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 29 Lines
	; SANDY-LABEL: test_lea_add_scale:			; SANDY-LABEL: test_lea_add_scale:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: leaq (%rdi,%rsi,2), %rax # sched: [1:0.50]			; SANDY-NEXT: leaq (%rdi,%rsi,2), %rax # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lea_add_scale:			; HASWELL-LABEL: test_lea_add_scale:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: leaq (%rdi,%rsi,2), %rax # sched: [1:0.50]			; HASWELL-NEXT: leaq (%rdi,%rsi,2), %rax # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_add_scale:			; BTVER2-LABEL: test_lea_add_scale:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: leaq (%rdi,%rsi,2), %rax # sched: [1:0.50]			; BTVER2-NEXT: leaq (%rdi,%rsi,2), %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_lea_add_scale:			; ZNVER1-LABEL: test_lea_add_scale:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 31 Lines
	; SANDY-NEXT: leaq (%rdi,%rsi,4), %rax # sched: [1:0.50]			; SANDY-NEXT: leaq (%rdi,%rsi,4), %rax # sched: [1:0.50]
	; SANDY-NEXT: addq $96, %rax # sched: [1:0.33]			; SANDY-NEXT: addq $96, %rax # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lea_add_scale_offset:			; HASWELL-LABEL: test_lea_add_scale_offset:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: leaq (%rdi,%rsi,4), %rax # sched: [1:0.50]			; HASWELL-NEXT: leaq (%rdi,%rsi,4), %rax # sched: [1:0.50]
	; HASWELL-NEXT: addq $96, %rax # sched: [1:0.25]			; HASWELL-NEXT: addq $96, %rax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_add_scale_offset:			; BTVER2-LABEL: test_lea_add_scale_offset:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: leaq 96(%rdi,%rsi,4), %rax # sched: [1:0.50]			; BTVER2-NEXT: leaq 96(%rdi,%rsi,4), %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_lea_add_scale_offset:			; ZNVER1-LABEL: test_lea_add_scale_offset:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 34 Lines
	; SANDY-NEXT: # sched: [1:0.33]			; SANDY-NEXT: # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lea_add_scale_offset_big:			; HASWELL-LABEL: test_lea_add_scale_offset_big:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: leaq (%rdi,%rsi,8), %rax # sched: [1:0.50]			; HASWELL-NEXT: leaq (%rdi,%rsi,8), %rax # sched: [1:0.50]
	; HASWELL-NEXT: addq $-1200, %rax # imm = 0xFB50			; HASWELL-NEXT: addq $-1200, %rax # imm = 0xFB50
	; HASWELL-NEXT: # sched: [1:0.25]			; HASWELL-NEXT: # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lea_add_scale_offset_big:			; BTVER2-LABEL: test_lea_add_scale_offset_big:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: leaq -1200(%rdi,%rsi,8), %rax # sched: [1:0.50]			; BTVER2-NEXT: leaq -1200(%rdi,%rsi,8), %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_lea_add_scale_offset_big:			; ZNVER1-LABEL: test_lea_add_scale_offset_big:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	; ZNVER1-NEXT: leaq -1200(%rdi,%rsi,8), %rax # sched: [1:0.25]			; ZNVER1-NEXT: leaq -1200(%rdi,%rsi,8), %rax # sched: [1:0.25]
	; ZNVER1-NEXT: retq # sched: [5:0.50]			; ZNVER1-NEXT: retq # sched: [5:0.50]
	%3 = shl i64 %1, 3			%3 = shl i64 %1, 3
	%4 = add i64 %0, -1200			%4 = add i64 %0, -1200
	%5 = add i64 %4, %3			%5 = add i64 %4, %3
	ret i64 %5			ret i64 %5
	}			}

test/CodeGen/X86/lzcnt-schedule.ll

	Show All 11 Lines
	; GENERIC-NEXT: lzcntw (%rsi), %cx			; GENERIC-NEXT: lzcntw (%rsi), %cx
	; GENERIC-NEXT: lzcntw %di, %ax			; GENERIC-NEXT: lzcntw %di, %ax
	; GENERIC-NEXT: orl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: orl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; GENERIC-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_ctlz_i16:			; HASWELL-LABEL: test_ctlz_i16:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: lzcntw (%rsi), %cx			; HASWELL-NEXT: lzcntw (%rsi), %cx # sched: [3:1.00]
	; HASWELL-NEXT: lzcntw %di, %ax			; HASWELL-NEXT: lzcntw %di, %ax # sched: [3:1.00]
	; HASWELL-NEXT: orl %ecx, %eax # sched: [1:0.25]			; HASWELL-NEXT: orl %ecx, %eax # sched: [1:0.25]
	; HASWELL-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; HASWELL-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_ctlz_i16:			; BTVER2-LABEL: test_ctlz_i16:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: lzcntw (%rsi), %cx			; BTVER2-NEXT: lzcntw (%rsi), %cx
	; BTVER2-NEXT: lzcntw %di, %ax			; BTVER2-NEXT: lzcntw %di, %ax
	; BTVER2-NEXT: orl %ecx, %eax # sched: [1:0.50]			; BTVER2-NEXT: orl %ecx, %eax # sched: [1:0.50]
	; BTVER2-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; BTVER2-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	Show All 18 Lines
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: lzcntl (%rsi), %ecx			; GENERIC-NEXT: lzcntl (%rsi), %ecx
	; GENERIC-NEXT: lzcntl %edi, %eax			; GENERIC-NEXT: lzcntl %edi, %eax
	; GENERIC-NEXT: orl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: orl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_ctlz_i32:			; HASWELL-LABEL: test_ctlz_i32:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: lzcntl (%rsi), %ecx			; HASWELL-NEXT: lzcntl (%rsi), %ecx # sched: [3:1.00]
	; HASWELL-NEXT: lzcntl %edi, %eax			; HASWELL-NEXT: lzcntl %edi, %eax # sched: [3:1.00]
	; HASWELL-NEXT: orl %ecx, %eax # sched: [1:0.25]			; HASWELL-NEXT: orl %ecx, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_ctlz_i32:			; BTVER2-LABEL: test_ctlz_i32:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: lzcntl (%rsi), %ecx			; BTVER2-NEXT: lzcntl (%rsi), %ecx
	; BTVER2-NEXT: lzcntl %edi, %eax			; BTVER2-NEXT: lzcntl %edi, %eax
	; BTVER2-NEXT: orl %ecx, %eax # sched: [1:0.50]			; BTVER2-NEXT: orl %ecx, %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 16 Lines
	; GENERIC: # BB#0:			; GENERIC: # BB#0:
	; GENERIC-NEXT: lzcntq (%rsi), %rcx			; GENERIC-NEXT: lzcntq (%rsi), %rcx
	; GENERIC-NEXT: lzcntq %rdi, %rax			; GENERIC-NEXT: lzcntq %rdi, %rax
	; GENERIC-NEXT: orq %rcx, %rax # sched: [1:0.33]			; GENERIC-NEXT: orq %rcx, %rax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_ctlz_i64:			; HASWELL-LABEL: test_ctlz_i64:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: lzcntq (%rsi), %rcx			; HASWELL-NEXT: lzcntq (%rsi), %rcx # sched: [3:1.00]
	; HASWELL-NEXT: lzcntq %rdi, %rax			; HASWELL-NEXT: lzcntq %rdi, %rax # sched: [3:1.00]
	; HASWELL-NEXT: orq %rcx, %rax # sched: [1:0.25]			; HASWELL-NEXT: orq %rcx, %rax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_ctlz_i64:			; BTVER2-LABEL: test_ctlz_i64:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: lzcntq (%rsi), %rcx			; BTVER2-NEXT: lzcntq (%rsi), %rcx
	; BTVER2-NEXT: lzcntq %rdi, %rax			; BTVER2-NEXT: lzcntq %rdi, %rax
	; BTVER2-NEXT: orq %rcx, %rax # sched: [1:0.50]			; BTVER2-NEXT: orq %rcx, %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 13 Lines

test/CodeGen/X86/mul-constant-i32.ll

	Show All 11 Lines
	; X86-LABEL: test_mul_by_1:			; X86-LABEL: test_mul_by_1:
	; X86: # BB#0:			; X86: # BB#0:
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_1:			; X64-HSW-LABEL: test_mul_by_1:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: movl %edi, %eax # sched: [1:0.25]			; X64-HSW-NEXT: movl %edi, %eax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_1:			; X64-JAG-LABEL: test_mul_by_1:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: movl %edi, %eax # sched: [1:0.17]			; X64-JAG-NEXT: movl %edi, %eax # sched: [1:0.17]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_1:			; X86-NOOPT-LABEL: test_mul_by_1:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_1:			; HSW-NOOPT-LABEL: test_mul_by_1:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: movl %edi, %eax # sched: [1:0.25]			; HSW-NOOPT-NEXT: movl %edi, %eax # sched: [1:0.25]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_1:			; JAG-NOOPT-LABEL: test_mul_by_1:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: movl %edi, %eax # sched: [1:0.17]			; JAG-NOOPT-NEXT: movl %edi, %eax # sched: [1:0.17]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_1:			; X64-SLM-LABEL: test_mul_by_1:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 14 Lines
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: addl %eax, %eax			; X86-NEXT: addl %eax, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_2:			; X64-HSW-LABEL: test_mul_by_2:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (%rdi,%rdi), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_2:			; X64-JAG-LABEL: test_mul_by_2:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal (%rdi,%rdi), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_2:			; X86-NOOPT-LABEL: test_mul_by_2:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: addl %eax, %eax			; X86-NOOPT-NEXT: addl %eax, %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_2:			; HSW-NOOPT-LABEL: test_mul_by_2:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; HSW-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; HSW-NOOPT-NEXT: leal (%rdi,%rdi), %eax # sched: [1:0.50]			; HSW-NOOPT-NEXT: leal (%rdi,%rdi), %eax # sched: [1:0.50]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_2:			; JAG-NOOPT-LABEL: test_mul_by_2:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; JAG-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; JAG-NOOPT-NEXT: leal (%rdi,%rdi), %eax # sched: [1:0.50]			; JAG-NOOPT-NEXT: leal (%rdi,%rdi), %eax # sched: [1:0.50]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_2:			; X64-SLM-LABEL: test_mul_by_2:
	Show All 16 Lines
	; X86: # BB#0:			; X86: # BB#0:
	; X86-NEXT: imull $3, {{[0-9]+}}(%esp), %eax			; X86-NEXT: imull $3, {{[0-9]+}}(%esp), %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_3:			; X64-HSW-LABEL: test_mul_by_3:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_3:			; X64-JAG-LABEL: test_mul_by_3:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_3:			; X86-NOOPT-LABEL: test_mul_by_3:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $3, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $3, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_3:			; HSW-NOOPT-LABEL: test_mul_by_3:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; HSW-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; HSW-NOOPT-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]			; HSW-NOOPT-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_3:			; JAG-NOOPT-LABEL: test_mul_by_3:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; JAG-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; JAG-NOOPT-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]			; JAG-NOOPT-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_3:			; X64-SLM-LABEL: test_mul_by_3:
	Show All 17 Lines
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: shll $2, %eax			; X86-NEXT: shll $2, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_4:			; X64-HSW-LABEL: test_mul_by_4:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (,%rdi,4), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (,%rdi,4), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_4:			; X64-JAG-LABEL: test_mul_by_4:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal (,%rdi,4), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (,%rdi,4), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_4:			; X86-NOOPT-LABEL: test_mul_by_4:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: shll $2, %eax			; X86-NOOPT-NEXT: shll $2, %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_4:			; HSW-NOOPT-LABEL: test_mul_by_4:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; HSW-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; HSW-NOOPT-NEXT: leal (,%rdi,4), %eax # sched: [1:0.50]			; HSW-NOOPT-NEXT: leal (,%rdi,4), %eax # sched: [1:0.50]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_4:			; JAG-NOOPT-LABEL: test_mul_by_4:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; JAG-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; JAG-NOOPT-NEXT: leal (,%rdi,4), %eax # sched: [1:0.50]			; JAG-NOOPT-NEXT: leal (,%rdi,4), %eax # sched: [1:0.50]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_4:			; X64-SLM-LABEL: test_mul_by_4:
	Show All 16 Lines
	; X86: # BB#0:			; X86: # BB#0:
	; X86-NEXT: imull $5, {{[0-9]+}}(%esp), %eax			; X86-NEXT: imull $5, {{[0-9]+}}(%esp), %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_5:			; X64-HSW-LABEL: test_mul_by_5:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_5:			; X64-JAG-LABEL: test_mul_by_5:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_5:			; X86-NOOPT-LABEL: test_mul_by_5:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $5, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $5, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_5:			; HSW-NOOPT-LABEL: test_mul_by_5:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; HSW-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; HSW-NOOPT-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; HSW-NOOPT-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_5:			; JAG-NOOPT-LABEL: test_mul_by_5:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; JAG-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; JAG-NOOPT-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; JAG-NOOPT-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_5:			; X64-SLM-LABEL: test_mul_by_5:
	Show All 19 Lines
	; X86-NEXT: leal (%eax,%eax,2), %eax			; X86-NEXT: leal (%eax,%eax,2), %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_6:			; X64-HSW-LABEL: test_mul_by_6:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: addl %edi, %edi # sched: [1:0.25]			; X64-HSW-NEXT: addl %edi, %edi # sched: [1:0.25]
	; X64-HSW-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_6:			; X64-JAG-LABEL: test_mul_by_6:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: addl %edi, %edi # sched: [1:0.50]			; X64-JAG-NEXT: addl %edi, %edi # sched: [1:0.50]
	; X64-JAG-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_6:			; X86-NOOPT-LABEL: test_mul_by_6:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $6, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $6, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_6:			; HSW-NOOPT-LABEL: test_mul_by_6:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $6, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $6, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_6:			; JAG-NOOPT-LABEL: test_mul_by_6:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $6, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $6, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_6:			; X64-SLM-LABEL: test_mul_by_6:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 18 Lines
	; X86-NEXT: subl %ecx, %eax			; X86-NEXT: subl %ecx, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_7:			; X64-HSW-LABEL: test_mul_by_7:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (,%rdi,8), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (,%rdi,8), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: subl %edi, %eax # sched: [1:0.25]			; X64-HSW-NEXT: subl %edi, %eax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_7:			; X64-JAG-LABEL: test_mul_by_7:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal (,%rdi,8), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (,%rdi,8), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: subl %edi, %eax # sched: [1:0.50]			; X64-JAG-NEXT: subl %edi, %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_7:			; X86-NOOPT-LABEL: test_mul_by_7:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $7, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $7, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_7:			; HSW-NOOPT-LABEL: test_mul_by_7:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $7, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $7, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_7:			; JAG-NOOPT-LABEL: test_mul_by_7:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $7, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $7, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_7:			; X64-SLM-LABEL: test_mul_by_7:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 16 Lines
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: shll $3, %eax			; X86-NEXT: shll $3, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_8:			; X64-HSW-LABEL: test_mul_by_8:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (,%rdi,8), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (,%rdi,8), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_8:			; X64-JAG-LABEL: test_mul_by_8:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal (,%rdi,8), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (,%rdi,8), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_8:			; X86-NOOPT-LABEL: test_mul_by_8:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: shll $3, %eax			; X86-NOOPT-NEXT: shll $3, %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_8:			; HSW-NOOPT-LABEL: test_mul_by_8:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; HSW-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; HSW-NOOPT-NEXT: leal (,%rdi,8), %eax # sched: [1:0.50]			; HSW-NOOPT-NEXT: leal (,%rdi,8), %eax # sched: [1:0.50]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_8:			; JAG-NOOPT-LABEL: test_mul_by_8:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; JAG-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; JAG-NOOPT-NEXT: leal (,%rdi,8), %eax # sched: [1:0.50]			; JAG-NOOPT-NEXT: leal (,%rdi,8), %eax # sched: [1:0.50]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_8:			; X64-SLM-LABEL: test_mul_by_8:
	Show All 16 Lines
	; X86: # BB#0:			; X86: # BB#0:
	; X86-NEXT: imull $9, {{[0-9]+}}(%esp), %eax			; X86-NEXT: imull $9, {{[0-9]+}}(%esp), %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_9:			; X64-HSW-LABEL: test_mul_by_9:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_9:			; X64-JAG-LABEL: test_mul_by_9:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_9:			; X86-NOOPT-LABEL: test_mul_by_9:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $9, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $9, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_9:			; HSW-NOOPT-LABEL: test_mul_by_9:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; HSW-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; HSW-NOOPT-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]			; HSW-NOOPT-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_9:			; JAG-NOOPT-LABEL: test_mul_by_9:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; JAG-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; JAG-NOOPT-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]			; JAG-NOOPT-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_9:			; X64-SLM-LABEL: test_mul_by_9:
	Show All 19 Lines
	; X86-NEXT: leal (%eax,%eax,4), %eax			; X86-NEXT: leal (%eax,%eax,4), %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_10:			; X64-HSW-LABEL: test_mul_by_10:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: addl %edi, %edi # sched: [1:0.25]			; X64-HSW-NEXT: addl %edi, %edi # sched: [1:0.25]
	; X64-HSW-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_10:			; X64-JAG-LABEL: test_mul_by_10:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: addl %edi, %edi # sched: [1:0.50]			; X64-JAG-NEXT: addl %edi, %edi # sched: [1:0.50]
	; X64-JAG-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_10:			; X86-NOOPT-LABEL: test_mul_by_10:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $10, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $10, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_10:			; HSW-NOOPT-LABEL: test_mul_by_10:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $10, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $10, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_10:			; JAG-NOOPT-LABEL: test_mul_by_10:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $10, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $10, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_10:			; X64-SLM-LABEL: test_mul_by_10:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 18 Lines
	; X86-NEXT: leal (%eax,%ecx,2), %eax			; X86-NEXT: leal (%eax,%ecx,2), %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_11:			; X64-HSW-LABEL: test_mul_by_11:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: leal (%rdi,%rax,2), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rax,2), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_11:			; X64-JAG-LABEL: test_mul_by_11:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: leal (%rdi,%rax,2), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rax,2), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_11:			; X86-NOOPT-LABEL: test_mul_by_11:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $11, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $11, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_11:			; HSW-NOOPT-LABEL: test_mul_by_11:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $11, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $11, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_11:			; JAG-NOOPT-LABEL: test_mul_by_11:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $11, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $11, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_11:			; X64-SLM-LABEL: test_mul_by_11:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 16 Lines
	; X86-NEXT: leal (%eax,%eax,2), %eax			; X86-NEXT: leal (%eax,%eax,2), %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_12:			; X64-HSW-LABEL: test_mul_by_12:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: shll $2, %edi # sched: [1:0.50]			; X64-HSW-NEXT: shll $2, %edi # sched: [1:0.50]
	; X64-HSW-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_12:			; X64-JAG-LABEL: test_mul_by_12:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: shll $2, %edi # sched: [1:0.50]			; X64-JAG-NEXT: shll $2, %edi # sched: [1:0.50]
	; X64-JAG-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_12:			; X86-NOOPT-LABEL: test_mul_by_12:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $12, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $12, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_12:			; HSW-NOOPT-LABEL: test_mul_by_12:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $12, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $12, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_12:			; JAG-NOOPT-LABEL: test_mul_by_12:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $12, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $12, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_12:			; X64-SLM-LABEL: test_mul_by_12:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 18 Lines
	; X86-NEXT: leal (%eax,%ecx,4), %eax			; X86-NEXT: leal (%eax,%ecx,4), %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_13:			; X64-HSW-LABEL: test_mul_by_13:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: leal (%rdi,%rax,4), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rax,4), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_13:			; X64-JAG-LABEL: test_mul_by_13:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: leal (%rdi,%rax,4), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rax,4), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_13:			; X86-NOOPT-LABEL: test_mul_by_13:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $13, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $13, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_13:			; HSW-NOOPT-LABEL: test_mul_by_13:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $13, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $13, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_13:			; JAG-NOOPT-LABEL: test_mul_by_13:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $13, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $13, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_13:			; X64-SLM-LABEL: test_mul_by_13:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 18 Lines
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_14:			; X64-HSW-LABEL: test_mul_by_14:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: leal (%rdi,%rax,4), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rax,4), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: addl %edi, %eax # sched: [1:0.25]			; X64-HSW-NEXT: addl %edi, %eax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_14:			; X64-JAG-LABEL: test_mul_by_14:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: leal (%rdi,%rax,4), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rax,4), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: addl %edi, %eax # sched: [1:0.50]			; X64-JAG-NEXT: addl %edi, %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_14:			; X86-NOOPT-LABEL: test_mul_by_14:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $14, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $14, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_14:			; HSW-NOOPT-LABEL: test_mul_by_14:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $14, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $14, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_14:			; JAG-NOOPT-LABEL: test_mul_by_14:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $14, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $14, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_14:			; X64-SLM-LABEL: test_mul_by_14:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 16 Lines
	; X86-NEXT: leal (%eax,%eax,2), %eax			; X86-NEXT: leal (%eax,%eax,2), %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_15:			; X64-HSW-LABEL: test_mul_by_15:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: leal (%rax,%rax,2), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rax,%rax,2), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_15:			; X64-JAG-LABEL: test_mul_by_15:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: leal (%rax,%rax,2), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rax,%rax,2), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_15:			; X86-NOOPT-LABEL: test_mul_by_15:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $15, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $15, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_15:			; HSW-NOOPT-LABEL: test_mul_by_15:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $15, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $15, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_15:			; JAG-NOOPT-LABEL: test_mul_by_15:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $15, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $15, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_15:			; X64-SLM-LABEL: test_mul_by_15:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 16 Lines
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: shll $4, %eax			; X86-NEXT: shll $4, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_16:			; X64-HSW-LABEL: test_mul_by_16:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: shll $4, %edi # sched: [1:0.50]			; X64-HSW-NEXT: shll $4, %edi # sched: [1:0.50]
	; X64-HSW-NEXT: movl %edi, %eax # sched: [1:0.25]			; X64-HSW-NEXT: movl %edi, %eax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_16:			; X64-JAG-LABEL: test_mul_by_16:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: shll $4, %edi # sched: [1:0.50]			; X64-JAG-NEXT: shll $4, %edi # sched: [1:0.50]
	; X64-JAG-NEXT: movl %edi, %eax # sched: [1:0.17]			; X64-JAG-NEXT: movl %edi, %eax # sched: [1:0.17]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_16:			; X86-NOOPT-LABEL: test_mul_by_16:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: shll $4, %eax			; X86-NOOPT-NEXT: shll $4, %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_16:			; HSW-NOOPT-LABEL: test_mul_by_16:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: shll $4, %edi # sched: [1:0.50]			; HSW-NOOPT-NEXT: shll $4, %edi # sched: [1:0.50]
	; HSW-NOOPT-NEXT: movl %edi, %eax # sched: [1:0.25]			; HSW-NOOPT-NEXT: movl %edi, %eax # sched: [1:0.25]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_16:			; JAG-NOOPT-LABEL: test_mul_by_16:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: shll $4, %edi # sched: [1:0.50]			; JAG-NOOPT-NEXT: shll $4, %edi # sched: [1:0.50]
	; JAG-NOOPT-NEXT: movl %edi, %eax # sched: [1:0.17]			; JAG-NOOPT-NEXT: movl %edi, %eax # sched: [1:0.17]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_16:			; X64-SLM-LABEL: test_mul_by_16:
	Show All 21 Lines
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_17:			; X64-HSW-LABEL: test_mul_by_17:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: movl %edi, %eax # sched: [1:0.25]			; X64-HSW-NEXT: movl %edi, %eax # sched: [1:0.25]
	; X64-HSW-NEXT: shll $4, %eax # sched: [1:0.50]			; X64-HSW-NEXT: shll $4, %eax # sched: [1:0.50]
	; X64-HSW-NEXT: leal (%rax,%rdi), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rax,%rdi), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_17:			; X64-JAG-LABEL: test_mul_by_17:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: movl %edi, %eax # sched: [1:0.17]			; X64-JAG-NEXT: movl %edi, %eax # sched: [1:0.17]
	; X64-JAG-NEXT: shll $4, %eax # sched: [1:0.50]			; X64-JAG-NEXT: shll $4, %eax # sched: [1:0.50]
	; X64-JAG-NEXT: leal (%rax,%rdi), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rax,%rdi), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_17:			; X86-NOOPT-LABEL: test_mul_by_17:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $17, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $17, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_17:			; HSW-NOOPT-LABEL: test_mul_by_17:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $17, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $17, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_17:			; JAG-NOOPT-LABEL: test_mul_by_17:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $17, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $17, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_17:			; X64-SLM-LABEL: test_mul_by_17:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 19 Lines
	; X86-NEXT: leal (%eax,%eax,8), %eax			; X86-NEXT: leal (%eax,%eax,8), %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_18:			; X64-HSW-LABEL: test_mul_by_18:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: addl %edi, %edi # sched: [1:0.25]			; X64-HSW-NEXT: addl %edi, %edi # sched: [1:0.25]
	; X64-HSW-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_18:			; X64-JAG-LABEL: test_mul_by_18:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: addl %edi, %edi # sched: [1:0.50]			; X64-JAG-NEXT: addl %edi, %edi # sched: [1:0.50]
	; X64-JAG-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_18:			; X86-NOOPT-LABEL: test_mul_by_18:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $18, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $18, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_18:			; HSW-NOOPT-LABEL: test_mul_by_18:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $18, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $18, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_18:			; JAG-NOOPT-LABEL: test_mul_by_18:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $18, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $18, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_18:			; X64-SLM-LABEL: test_mul_by_18:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 20 Lines
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_19:			; X64-HSW-LABEL: test_mul_by_19:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: shll $2, %eax # sched: [1:0.50]			; X64-HSW-NEXT: shll $2, %eax # sched: [1:0.50]
	; X64-HSW-NEXT: subl %edi, %eax # sched: [1:0.25]			; X64-HSW-NEXT: subl %edi, %eax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_19:			; X64-JAG-LABEL: test_mul_by_19:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: shll $2, %eax # sched: [1:0.50]			; X64-JAG-NEXT: shll $2, %eax # sched: [1:0.50]
	; X64-JAG-NEXT: subl %edi, %eax # sched: [1:0.50]			; X64-JAG-NEXT: subl %edi, %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_19:			; X86-NOOPT-LABEL: test_mul_by_19:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $19, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $19, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_19:			; HSW-NOOPT-LABEL: test_mul_by_19:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $19, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $19, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_19:			; JAG-NOOPT-LABEL: test_mul_by_19:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $19, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $19, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_19:			; X64-SLM-LABEL: test_mul_by_19:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 16 Lines
	; X86-NEXT: leal (%eax,%eax,4), %eax			; X86-NEXT: leal (%eax,%eax,4), %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_20:			; X64-HSW-LABEL: test_mul_by_20:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: shll $2, %edi # sched: [1:0.50]			; X64-HSW-NEXT: shll $2, %edi # sched: [1:0.50]
	; X64-HSW-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_20:			; X64-JAG-LABEL: test_mul_by_20:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: shll $2, %edi # sched: [1:0.50]			; X64-JAG-NEXT: shll $2, %edi # sched: [1:0.50]
	; X64-JAG-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_20:			; X86-NOOPT-LABEL: test_mul_by_20:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $20, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $20, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_20:			; HSW-NOOPT-LABEL: test_mul_by_20:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $20, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $20, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_20:			; JAG-NOOPT-LABEL: test_mul_by_20:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $20, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $20, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_20:			; X64-SLM-LABEL: test_mul_by_20:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 18 Lines
	; X86-NEXT: leal (%eax,%ecx,4), %eax			; X86-NEXT: leal (%eax,%ecx,4), %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_21:			; X64-HSW-LABEL: test_mul_by_21:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: leal (%rdi,%rax,4), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rax,4), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_21:			; X64-JAG-LABEL: test_mul_by_21:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: leal (%rdi,%rax,4), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rax,4), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_21:			; X86-NOOPT-LABEL: test_mul_by_21:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $21, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $21, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_21:			; HSW-NOOPT-LABEL: test_mul_by_21:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $21, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $21, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_21:			; JAG-NOOPT-LABEL: test_mul_by_21:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $21, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $21, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_21:			; X64-SLM-LABEL: test_mul_by_21:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 18 Lines
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_22:			; X64-HSW-LABEL: test_mul_by_22:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: leal (%rdi,%rax,4), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rax,4), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: addl %edi, %eax # sched: [1:0.25]			; X64-HSW-NEXT: addl %edi, %eax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_22:			; X64-JAG-LABEL: test_mul_by_22:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: leal (%rdi,%rax,4), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rax,4), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: addl %edi, %eax # sched: [1:0.50]			; X64-JAG-NEXT: addl %edi, %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_22:			; X86-NOOPT-LABEL: test_mul_by_22:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $22, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $22, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_22:			; HSW-NOOPT-LABEL: test_mul_by_22:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $22, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $22, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_22:			; JAG-NOOPT-LABEL: test_mul_by_22:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $22, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $22, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_22:			; X64-SLM-LABEL: test_mul_by_22:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 18 Lines
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_23:			; X64-HSW-LABEL: test_mul_by_23:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: shll $3, %eax # sched: [1:0.50]			; X64-HSW-NEXT: shll $3, %eax # sched: [1:0.50]
	; X64-HSW-NEXT: subl %edi, %eax # sched: [1:0.25]			; X64-HSW-NEXT: subl %edi, %eax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_23:			; X64-JAG-LABEL: test_mul_by_23:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: shll $3, %eax # sched: [1:0.50]			; X64-JAG-NEXT: shll $3, %eax # sched: [1:0.50]
	; X64-JAG-NEXT: subl %edi, %eax # sched: [1:0.50]			; X64-JAG-NEXT: subl %edi, %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_23:			; X86-NOOPT-LABEL: test_mul_by_23:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $23, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $23, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_23:			; HSW-NOOPT-LABEL: test_mul_by_23:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $23, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $23, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_23:			; JAG-NOOPT-LABEL: test_mul_by_23:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $23, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $23, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_23:			; X64-SLM-LABEL: test_mul_by_23:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 16 Lines
	; X86-NEXT: leal (%eax,%eax,2), %eax			; X86-NEXT: leal (%eax,%eax,2), %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_24:			; X64-HSW-LABEL: test_mul_by_24:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: shll $3, %edi # sched: [1:0.50]			; X64-HSW-NEXT: shll $3, %edi # sched: [1:0.50]
	; X64-HSW-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_24:			; X64-JAG-LABEL: test_mul_by_24:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: shll $3, %edi # sched: [1:0.50]			; X64-JAG-NEXT: shll $3, %edi # sched: [1:0.50]
	; X64-JAG-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,2), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_24:			; X86-NOOPT-LABEL: test_mul_by_24:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $24, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $24, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_24:			; HSW-NOOPT-LABEL: test_mul_by_24:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $24, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $24, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_24:			; JAG-NOOPT-LABEL: test_mul_by_24:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $24, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $24, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_24:			; X64-SLM-LABEL: test_mul_by_24:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 18 Lines
	; X86-NEXT: leal (%eax,%eax,4), %eax			; X86-NEXT: leal (%eax,%eax,4), %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_25:			; X64-HSW-LABEL: test_mul_by_25:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: leal (%rax,%rax,4), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rax,%rax,4), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_25:			; X64-JAG-LABEL: test_mul_by_25:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: leal (%rax,%rax,4), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rax,%rax,4), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_25:			; X86-NOOPT-LABEL: test_mul_by_25:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $25, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $25, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_25:			; HSW-NOOPT-LABEL: test_mul_by_25:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $25, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $25, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_25:			; JAG-NOOPT-LABEL: test_mul_by_25:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $25, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $25, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_25:			; X64-SLM-LABEL: test_mul_by_25:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 20 Lines
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_26:			; X64-HSW-LABEL: test_mul_by_26:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: leal (%rax,%rax,2), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rax,%rax,2), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: subl %edi, %eax # sched: [1:0.25]			; X64-HSW-NEXT: subl %edi, %eax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_26:			; X64-JAG-LABEL: test_mul_by_26:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: leal (%rax,%rax,2), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rax,%rax,2), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: subl %edi, %eax # sched: [1:0.50]			; X64-JAG-NEXT: subl %edi, %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_26:			; X86-NOOPT-LABEL: test_mul_by_26:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $26, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $26, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_26:			; HSW-NOOPT-LABEL: test_mul_by_26:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $26, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $26, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_26:			; JAG-NOOPT-LABEL: test_mul_by_26:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $26, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $26, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_26:			; X64-SLM-LABEL: test_mul_by_26:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 16 Lines
	; X86-NEXT: leal (%eax,%eax,2), %eax			; X86-NEXT: leal (%eax,%eax,2), %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_27:			; X64-HSW-LABEL: test_mul_by_27:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: leal (%rax,%rax,2), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rax,%rax,2), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_27:			; X64-JAG-LABEL: test_mul_by_27:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: leal (%rax,%rax,2), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rax,%rax,2), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_27:			; X86-NOOPT-LABEL: test_mul_by_27:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $27, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $27, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_27:			; HSW-NOOPT-LABEL: test_mul_by_27:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $27, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $27, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_27:			; JAG-NOOPT-LABEL: test_mul_by_27:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $27, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $27, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_27:			; X64-SLM-LABEL: test_mul_by_27:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 20 Lines
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_28:			; X64-HSW-LABEL: test_mul_by_28:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: leal (%rax,%rax,2), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rax,%rax,2), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: addl %edi, %eax # sched: [1:0.25]			; X64-HSW-NEXT: addl %edi, %eax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_28:			; X64-JAG-LABEL: test_mul_by_28:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: leal (%rax,%rax,2), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rax,%rax,2), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: addl %edi, %eax # sched: [1:0.50]			; X64-JAG-NEXT: addl %edi, %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_28:			; X86-NOOPT-LABEL: test_mul_by_28:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $28, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $28, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_28:			; HSW-NOOPT-LABEL: test_mul_by_28:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $28, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $28, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_28:			; JAG-NOOPT-LABEL: test_mul_by_28:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $28, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $28, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_28:			; X64-SLM-LABEL: test_mul_by_28:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 20 Lines
	;			;
	; X64-HSW-LABEL: test_mul_by_29:			; X64-HSW-LABEL: test_mul_by_29:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: leal (%rax,%rax,2), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rax,%rax,2), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: addl %edi, %eax # sched: [1:0.25]			; X64-HSW-NEXT: addl %edi, %eax # sched: [1:0.25]
	; X64-HSW-NEXT: addl %edi, %eax # sched: [1:0.25]			; X64-HSW-NEXT: addl %edi, %eax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_29:			; X64-JAG-LABEL: test_mul_by_29:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rdi,%rdi,8), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: leal (%rax,%rax,2), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal (%rax,%rax,2), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: addl %edi, %eax # sched: [1:0.50]			; X64-JAG-NEXT: addl %edi, %eax # sched: [1:0.50]
	; X64-JAG-NEXT: addl %edi, %eax # sched: [1:0.50]			; X64-JAG-NEXT: addl %edi, %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_29:			; X86-NOOPT-LABEL: test_mul_by_29:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $29, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $29, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_29:			; HSW-NOOPT-LABEL: test_mul_by_29:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $29, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $29, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_29:			; JAG-NOOPT-LABEL: test_mul_by_29:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $29, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $29, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_29:			; X64-SLM-LABEL: test_mul_by_29:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 19 Lines
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_30:			; X64-HSW-LABEL: test_mul_by_30:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: movl %edi, %eax # sched: [1:0.25]			; X64-HSW-NEXT: movl %edi, %eax # sched: [1:0.25]
	; X64-HSW-NEXT: shll $5, %eax # sched: [1:0.50]			; X64-HSW-NEXT: shll $5, %eax # sched: [1:0.50]
	; X64-HSW-NEXT: subl %edi, %eax # sched: [1:0.25]			; X64-HSW-NEXT: subl %edi, %eax # sched: [1:0.25]
	; X64-HSW-NEXT: subl %edi, %eax # sched: [1:0.25]			; X64-HSW-NEXT: subl %edi, %eax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_30:			; X64-JAG-LABEL: test_mul_by_30:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: movl %edi, %eax # sched: [1:0.17]			; X64-JAG-NEXT: movl %edi, %eax # sched: [1:0.17]
	; X64-JAG-NEXT: shll $5, %eax # sched: [1:0.50]			; X64-JAG-NEXT: shll $5, %eax # sched: [1:0.50]
	; X64-JAG-NEXT: subl %edi, %eax # sched: [1:0.50]			; X64-JAG-NEXT: subl %edi, %eax # sched: [1:0.50]
	; X64-JAG-NEXT: subl %edi, %eax # sched: [1:0.50]			; X64-JAG-NEXT: subl %edi, %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_30:			; X86-NOOPT-LABEL: test_mul_by_30:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $30, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $30, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_30:			; HSW-NOOPT-LABEL: test_mul_by_30:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $30, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $30, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_30:			; JAG-NOOPT-LABEL: test_mul_by_30:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $30, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $30, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_30:			; X64-SLM-LABEL: test_mul_by_30:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 17 Lines
	; X86-NEXT: subl %ecx, %eax			; X86-NEXT: subl %ecx, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_31:			; X64-HSW-LABEL: test_mul_by_31:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: movl %edi, %eax # sched: [1:0.25]			; X64-HSW-NEXT: movl %edi, %eax # sched: [1:0.25]
	; X64-HSW-NEXT: shll $5, %eax # sched: [1:0.50]			; X64-HSW-NEXT: shll $5, %eax # sched: [1:0.50]
	; X64-HSW-NEXT: subl %edi, %eax # sched: [1:0.25]			; X64-HSW-NEXT: subl %edi, %eax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_31:			; X64-JAG-LABEL: test_mul_by_31:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: movl %edi, %eax # sched: [1:0.17]			; X64-JAG-NEXT: movl %edi, %eax # sched: [1:0.17]
	; X64-JAG-NEXT: shll $5, %eax # sched: [1:0.50]			; X64-JAG-NEXT: shll $5, %eax # sched: [1:0.50]
	; X64-JAG-NEXT: subl %edi, %eax # sched: [1:0.50]			; X64-JAG-NEXT: subl %edi, %eax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_31:			; X86-NOOPT-LABEL: test_mul_by_31:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: imull $31, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $31, {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_31:			; HSW-NOOPT-LABEL: test_mul_by_31:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imull $31, %edi, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull $31, %edi, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_31:			; JAG-NOOPT-LABEL: test_mul_by_31:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imull $31, %edi, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull $31, %edi, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_31:			; X64-SLM-LABEL: test_mul_by_31:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 16 Lines
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: shll $5, %eax			; X86-NEXT: shll $5, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_32:			; X64-HSW-LABEL: test_mul_by_32:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: shll $5, %edi # sched: [1:0.50]			; X64-HSW-NEXT: shll $5, %edi # sched: [1:0.50]
	; X64-HSW-NEXT: movl %edi, %eax # sched: [1:0.25]			; X64-HSW-NEXT: movl %edi, %eax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_32:			; X64-JAG-LABEL: test_mul_by_32:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: shll $5, %edi # sched: [1:0.50]			; X64-JAG-NEXT: shll $5, %edi # sched: [1:0.50]
	; X64-JAG-NEXT: movl %edi, %eax # sched: [1:0.17]			; X64-JAG-NEXT: movl %edi, %eax # sched: [1:0.17]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_32:			; X86-NOOPT-LABEL: test_mul_by_32:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: shll $5, %eax			; X86-NOOPT-NEXT: shll $5, %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_32:			; HSW-NOOPT-LABEL: test_mul_by_32:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: shll $5, %edi # sched: [1:0.50]			; HSW-NOOPT-NEXT: shll $5, %edi # sched: [1:0.50]
	; HSW-NOOPT-NEXT: movl %edi, %eax # sched: [1:0.25]			; HSW-NOOPT-NEXT: movl %edi, %eax # sched: [1:0.25]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_32:			; JAG-NOOPT-LABEL: test_mul_by_32:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: shll $5, %edi # sched: [1:0.50]			; JAG-NOOPT-NEXT: shll $5, %edi # sched: [1:0.50]
	; JAG-NOOPT-NEXT: movl %edi, %eax # sched: [1:0.17]			; JAG-NOOPT-NEXT: movl %edi, %eax # sched: [1:0.17]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_32:			; X64-SLM-LABEL: test_mul_by_32:
	Show All 23 Lines
	;			;
	; X64-HSW-LABEL: test_mul_spec:			; X64-HSW-LABEL: test_mul_spec:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-HSW-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-HSW-NEXT: leal (%rdi,%rdi,8), %ecx # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,8), %ecx # sched: [1:0.50]
	; X64-HSW-NEXT: addl $42, %ecx # sched: [1:0.25]			; X64-HSW-NEXT: addl $42, %ecx # sched: [1:0.25]
	; X64-HSW-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; X64-HSW-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; X64-HSW-NEXT: addl $2, %eax # sched: [1:0.25]			; X64-HSW-NEXT: addl $2, %eax # sched: [1:0.25]
	; X64-HSW-NEXT: imull %ecx, %eax # sched: [4:1.00]			; X64-HSW-NEXT: imull %ecx, %eax # sched: [3:1.00]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_spec:			; X64-JAG-LABEL: test_mul_spec:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; X64-JAG-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; X64-JAG-NEXT: leal 42(%rdi,%rdi,8), %ecx # sched: [1:0.50]			; X64-JAG-NEXT: leal 42(%rdi,%rdi,8), %ecx # sched: [1:0.50]
	; X64-JAG-NEXT: leal 2(%rdi,%rdi,4), %eax # sched: [1:0.50]			; X64-JAG-NEXT: leal 2(%rdi,%rdi,4), %eax # sched: [1:0.50]
	; X64-JAG-NEXT: imull %ecx, %eax # sched: [3:1.00]			; X64-JAG-NEXT: imull %ecx, %eax # sched: [3:1.00]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_spec:			; X86-NOOPT-LABEL: test_mul_spec:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: leal 42(%eax,%eax,8), %ecx			; X86-NOOPT-NEXT: leal 42(%eax,%eax,8), %ecx
	; X86-NOOPT-NEXT: leal 2(%eax,%eax,4), %eax			; X86-NOOPT-NEXT: leal 2(%eax,%eax,4), %eax
	; X86-NOOPT-NEXT: imull %ecx, %eax			; X86-NOOPT-NEXT: imull %ecx, %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_spec:			; HSW-NOOPT-LABEL: test_mul_spec:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; HSW-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; HSW-NOOPT-NEXT: leal (%rdi,%rdi,8), %ecx # sched: [1:0.50]			; HSW-NOOPT-NEXT: leal (%rdi,%rdi,8), %ecx # sched: [1:0.50]
	; HSW-NOOPT-NEXT: addl $42, %ecx # sched: [1:0.25]			; HSW-NOOPT-NEXT: addl $42, %ecx # sched: [1:0.25]
	; HSW-NOOPT-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]			; HSW-NOOPT-NEXT: leal (%rdi,%rdi,4), %eax # sched: [1:0.50]
	; HSW-NOOPT-NEXT: addl $2, %eax # sched: [1:0.25]			; HSW-NOOPT-NEXT: addl $2, %eax # sched: [1:0.25]
	; HSW-NOOPT-NEXT: imull %ecx, %eax # sched: [4:1.00]			; HSW-NOOPT-NEXT: imull %ecx, %eax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_spec:			; JAG-NOOPT-LABEL: test_mul_spec:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>			; JAG-NOOPT-NEXT: # kill: %EDI<def> %EDI<kill> %RDI<def>
	; JAG-NOOPT-NEXT: leal 42(%rdi,%rdi,8), %ecx # sched: [1:0.50]			; JAG-NOOPT-NEXT: leal 42(%rdi,%rdi,8), %ecx # sched: [1:0.50]
	; JAG-NOOPT-NEXT: leal 2(%rdi,%rdi,4), %eax # sched: [1:0.50]			; JAG-NOOPT-NEXT: leal 2(%rdi,%rdi,4), %eax # sched: [1:0.50]
	; JAG-NOOPT-NEXT: imull %ecx, %eax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imull %ecx, %eax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	Show All 23 Lines

test/CodeGen/X86/mul-constant-i64.ll

	Show All 12 Lines
	; X86: # BB#0:			; X86: # BB#0:
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: movl {{[0-9]+}}(%esp), %edx			; X86-NEXT: movl {{[0-9]+}}(%esp), %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_1:			; X64-HSW-LABEL: test_mul_by_1:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: movq %rdi, %rax # sched: [1:0.25]			; X64-HSW-NEXT: movq %rdi, %rax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_1:			; X64-JAG-LABEL: test_mul_by_1:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: movq %rdi, %rax # sched: [1:0.17]			; X64-JAG-NEXT: movq %rdi, %rax # sched: [1:0.17]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_1:			; X86-NOOPT-LABEL: test_mul_by_1:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %edx			; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_1:			; HSW-NOOPT-LABEL: test_mul_by_1:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: movq %rdi, %rax # sched: [1:0.25]			; HSW-NOOPT-NEXT: movq %rdi, %rax # sched: [1:0.25]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_1:			; JAG-NOOPT-LABEL: test_mul_by_1:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: movq %rdi, %rax # sched: [1:0.17]			; JAG-NOOPT-NEXT: movq %rdi, %rax # sched: [1:0.17]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_1:			; X64-SLM-LABEL: test_mul_by_1:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 15 Lines
	; X86-NEXT: movl {{[0-9]+}}(%esp), %edx			; X86-NEXT: movl {{[0-9]+}}(%esp), %edx
	; X86-NEXT: shldl $1, %eax, %edx			; X86-NEXT: shldl $1, %eax, %edx
	; X86-NEXT: addl %eax, %eax			; X86-NEXT: addl %eax, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_2:			; X64-HSW-LABEL: test_mul_by_2:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (%rdi,%rdi), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_2:			; X64-JAG-LABEL: test_mul_by_2:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq (%rdi,%rdi), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_2:			; X86-NOOPT-LABEL: test_mul_by_2:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %edx			; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %edx
	; X86-NOOPT-NEXT: shldl $1, %eax, %edx			; X86-NOOPT-NEXT: shldl $1, %eax, %edx
	; X86-NOOPT-NEXT: addl %eax, %eax			; X86-NOOPT-NEXT: addl %eax, %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_2:			; HSW-NOOPT-LABEL: test_mul_by_2:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: leaq (%rdi,%rdi), %rax # sched: [1:0.50]			; HSW-NOOPT-NEXT: leaq (%rdi,%rdi), %rax # sched: [1:0.50]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_2:			; JAG-NOOPT-LABEL: test_mul_by_2:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: leaq (%rdi,%rdi), %rax # sched: [1:0.50]			; JAG-NOOPT-NEXT: leaq (%rdi,%rdi), %rax # sched: [1:0.50]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_2:			; X64-SLM-LABEL: test_mul_by_2:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 15 Lines
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NEXT: imull $3, {{[0-9]+}}(%esp), %ecx			; X86-NEXT: imull $3, {{[0-9]+}}(%esp), %ecx
	; X86-NEXT: addl %ecx, %edx			; X86-NEXT: addl %ecx, %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_3:			; X64-HSW-LABEL: test_mul_by_3:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_3:			; X64-JAG-LABEL: test_mul_by_3:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_3:			; X86-NOOPT-LABEL: test_mul_by_3:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $3, %eax			; X86-NOOPT-NEXT: movl $3, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $3, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $3, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_3:			; HSW-NOOPT-LABEL: test_mul_by_3:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; HSW-NOOPT-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_3:			; JAG-NOOPT-LABEL: test_mul_by_3:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; JAG-NOOPT-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_3:			; X64-SLM-LABEL: test_mul_by_3:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 15 Lines
	; X86-NEXT: movl {{[0-9]+}}(%esp), %edx			; X86-NEXT: movl {{[0-9]+}}(%esp), %edx
	; X86-NEXT: shldl $2, %eax, %edx			; X86-NEXT: shldl $2, %eax, %edx
	; X86-NEXT: shll $2, %eax			; X86-NEXT: shll $2, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_4:			; X64-HSW-LABEL: test_mul_by_4:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (,%rdi,4), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (,%rdi,4), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_4:			; X64-JAG-LABEL: test_mul_by_4:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq (,%rdi,4), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (,%rdi,4), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_4:			; X86-NOOPT-LABEL: test_mul_by_4:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %edx			; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %edx
	; X86-NOOPT-NEXT: shldl $2, %eax, %edx			; X86-NOOPT-NEXT: shldl $2, %eax, %edx
	; X86-NOOPT-NEXT: shll $2, %eax			; X86-NOOPT-NEXT: shll $2, %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_4:			; HSW-NOOPT-LABEL: test_mul_by_4:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: leaq (,%rdi,4), %rax # sched: [1:0.50]			; HSW-NOOPT-NEXT: leaq (,%rdi,4), %rax # sched: [1:0.50]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_4:			; JAG-NOOPT-LABEL: test_mul_by_4:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: leaq (,%rdi,4), %rax # sched: [1:0.50]			; JAG-NOOPT-NEXT: leaq (,%rdi,4), %rax # sched: [1:0.50]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_4:			; X64-SLM-LABEL: test_mul_by_4:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 15 Lines
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NEXT: imull $5, {{[0-9]+}}(%esp), %ecx			; X86-NEXT: imull $5, {{[0-9]+}}(%esp), %ecx
	; X86-NEXT: addl %ecx, %edx			; X86-NEXT: addl %ecx, %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_5:			; X64-HSW-LABEL: test_mul_by_5:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_5:			; X64-JAG-LABEL: test_mul_by_5:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_5:			; X86-NOOPT-LABEL: test_mul_by_5:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $5, %eax			; X86-NOOPT-NEXT: movl $5, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $5, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $5, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_5:			; HSW-NOOPT-LABEL: test_mul_by_5:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; HSW-NOOPT-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_5:			; JAG-NOOPT-LABEL: test_mul_by_5:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; JAG-NOOPT-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_5:			; X64-SLM-LABEL: test_mul_by_5:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 17 Lines
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NEXT: leal (%edx,%ecx,2), %edx			; X86-NEXT: leal (%edx,%ecx,2), %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_6:			; X64-HSW-LABEL: test_mul_by_6:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: addq %rdi, %rdi # sched: [1:0.25]			; X64-HSW-NEXT: addq %rdi, %rdi # sched: [1:0.25]
	; X64-HSW-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_6:			; X64-JAG-LABEL: test_mul_by_6:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: addq %rdi, %rdi # sched: [1:0.50]			; X64-JAG-NEXT: addq %rdi, %rdi # sched: [1:0.50]
	; X64-JAG-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_6:			; X86-NOOPT-LABEL: test_mul_by_6:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $6, %eax			; X86-NOOPT-NEXT: movl $6, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $6, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $6, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_6:			; HSW-NOOPT-LABEL: test_mul_by_6:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $6, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $6, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_6:			; JAG-NOOPT-LABEL: test_mul_by_6:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $6, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $6, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_6:			; X64-SLM-LABEL: test_mul_by_6:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 19 Lines
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NEXT: addl %ecx, %edx			; X86-NEXT: addl %ecx, %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_7:			; X64-HSW-LABEL: test_mul_by_7:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (,%rdi,8), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (,%rdi,8), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: subq %rdi, %rax # sched: [1:0.25]			; X64-HSW-NEXT: subq %rdi, %rax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_7:			; X64-JAG-LABEL: test_mul_by_7:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq (,%rdi,8), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (,%rdi,8), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: subq %rdi, %rax # sched: [1:0.50]			; X64-JAG-NEXT: subq %rdi, %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_7:			; X86-NOOPT-LABEL: test_mul_by_7:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $7, %eax			; X86-NOOPT-NEXT: movl $7, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $7, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $7, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_7:			; HSW-NOOPT-LABEL: test_mul_by_7:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $7, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $7, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_7:			; JAG-NOOPT-LABEL: test_mul_by_7:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $7, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $7, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_7:			; X64-SLM-LABEL: test_mul_by_7:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 16 Lines
	; X86-NEXT: movl {{[0-9]+}}(%esp), %edx			; X86-NEXT: movl {{[0-9]+}}(%esp), %edx
	; X86-NEXT: shldl $3, %eax, %edx			; X86-NEXT: shldl $3, %eax, %edx
	; X86-NEXT: shll $3, %eax			; X86-NEXT: shll $3, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_8:			; X64-HSW-LABEL: test_mul_by_8:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (,%rdi,8), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (,%rdi,8), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_8:			; X64-JAG-LABEL: test_mul_by_8:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq (,%rdi,8), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (,%rdi,8), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_8:			; X86-NOOPT-LABEL: test_mul_by_8:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %edx			; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %edx
	; X86-NOOPT-NEXT: shldl $3, %eax, %edx			; X86-NOOPT-NEXT: shldl $3, %eax, %edx
	; X86-NOOPT-NEXT: shll $3, %eax			; X86-NOOPT-NEXT: shll $3, %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_8:			; HSW-NOOPT-LABEL: test_mul_by_8:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: leaq (,%rdi,8), %rax # sched: [1:0.50]			; HSW-NOOPT-NEXT: leaq (,%rdi,8), %rax # sched: [1:0.50]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_8:			; JAG-NOOPT-LABEL: test_mul_by_8:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: leaq (,%rdi,8), %rax # sched: [1:0.50]			; JAG-NOOPT-NEXT: leaq (,%rdi,8), %rax # sched: [1:0.50]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_8:			; X64-SLM-LABEL: test_mul_by_8:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 15 Lines
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NEXT: imull $9, {{[0-9]+}}(%esp), %ecx			; X86-NEXT: imull $9, {{[0-9]+}}(%esp), %ecx
	; X86-NEXT: addl %ecx, %edx			; X86-NEXT: addl %ecx, %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_9:			; X64-HSW-LABEL: test_mul_by_9:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_9:			; X64-JAG-LABEL: test_mul_by_9:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_9:			; X86-NOOPT-LABEL: test_mul_by_9:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $9, %eax			; X86-NOOPT-NEXT: movl $9, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $9, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $9, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_9:			; HSW-NOOPT-LABEL: test_mul_by_9:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]			; HSW-NOOPT-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_9:			; JAG-NOOPT-LABEL: test_mul_by_9:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]			; JAG-NOOPT-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_9:			; X64-SLM-LABEL: test_mul_by_9:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 17 Lines
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NEXT: leal (%edx,%ecx,2), %edx			; X86-NEXT: leal (%edx,%ecx,2), %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_10:			; X64-HSW-LABEL: test_mul_by_10:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: addq %rdi, %rdi # sched: [1:0.25]			; X64-HSW-NEXT: addq %rdi, %rdi # sched: [1:0.25]
	; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_10:			; X64-JAG-LABEL: test_mul_by_10:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: addq %rdi, %rdi # sched: [1:0.50]			; X64-JAG-NEXT: addq %rdi, %rdi # sched: [1:0.50]
	; X64-JAG-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_10:			; X86-NOOPT-LABEL: test_mul_by_10:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $10, %eax			; X86-NOOPT-NEXT: movl $10, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $10, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $10, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_10:			; HSW-NOOPT-LABEL: test_mul_by_10:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $10, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $10, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_10:			; JAG-NOOPT-LABEL: test_mul_by_10:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $10, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $10, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_10:			; X64-SLM-LABEL: test_mul_by_10:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 19 Lines
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NEXT: addl %ecx, %edx			; X86-NEXT: addl %ecx, %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_11:			; X64-HSW-LABEL: test_mul_by_11:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: leaq (%rdi,%rax,2), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rax,2), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_11:			; X64-JAG-LABEL: test_mul_by_11:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: leaq (%rdi,%rax,2), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rax,2), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_11:			; X86-NOOPT-LABEL: test_mul_by_11:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $11, %eax			; X86-NOOPT-NEXT: movl $11, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $11, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $11, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_11:			; HSW-NOOPT-LABEL: test_mul_by_11:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $11, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $11, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_11:			; JAG-NOOPT-LABEL: test_mul_by_11:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $11, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $11, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_11:			; X64-SLM-LABEL: test_mul_by_11:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 17 Lines
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NEXT: leal (%edx,%ecx,4), %edx			; X86-NEXT: leal (%edx,%ecx,4), %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_12:			; X64-HSW-LABEL: test_mul_by_12:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: shlq $2, %rdi # sched: [1:0.50]			; X64-HSW-NEXT: shlq $2, %rdi # sched: [1:0.50]
	; X64-HSW-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_12:			; X64-JAG-LABEL: test_mul_by_12:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: shlq $2, %rdi # sched: [1:0.50]			; X64-JAG-NEXT: shlq $2, %rdi # sched: [1:0.50]
	; X64-JAG-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_12:			; X86-NOOPT-LABEL: test_mul_by_12:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $12, %eax			; X86-NOOPT-NEXT: movl $12, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $12, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $12, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_12:			; HSW-NOOPT-LABEL: test_mul_by_12:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $12, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $12, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_12:			; JAG-NOOPT-LABEL: test_mul_by_12:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $12, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $12, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_12:			; X64-SLM-LABEL: test_mul_by_12:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 19 Lines
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NEXT: addl %ecx, %edx			; X86-NEXT: addl %ecx, %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_13:			; X64-HSW-LABEL: test_mul_by_13:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: leaq (%rdi,%rax,4), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rax,4), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_13:			; X64-JAG-LABEL: test_mul_by_13:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: leaq (%rdi,%rax,4), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rax,4), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_13:			; X86-NOOPT-LABEL: test_mul_by_13:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $13, %eax			; X86-NOOPT-NEXT: movl $13, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $13, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $13, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_13:			; HSW-NOOPT-LABEL: test_mul_by_13:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $13, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $13, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_13:			; JAG-NOOPT-LABEL: test_mul_by_13:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $13, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $13, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_13:			; X64-SLM-LABEL: test_mul_by_13:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 20 Lines
	; X86-NEXT: addl %ecx, %edx			; X86-NEXT: addl %ecx, %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_14:			; X64-HSW-LABEL: test_mul_by_14:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: leaq (%rdi,%rax,4), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rax,4), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: addq %rdi, %rax # sched: [1:0.25]			; X64-HSW-NEXT: addq %rdi, %rax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_14:			; X64-JAG-LABEL: test_mul_by_14:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: leaq (%rdi,%rax,4), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rax,4), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: addq %rdi, %rax # sched: [1:0.50]			; X64-JAG-NEXT: addq %rdi, %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_14:			; X86-NOOPT-LABEL: test_mul_by_14:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $14, %eax			; X86-NOOPT-NEXT: movl $14, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $14, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $14, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_14:			; HSW-NOOPT-LABEL: test_mul_by_14:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $14, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $14, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_14:			; JAG-NOOPT-LABEL: test_mul_by_14:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $14, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $14, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_14:			; X64-SLM-LABEL: test_mul_by_14:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 18 Lines
	; X86-NEXT: leal (%ecx,%ecx,2), %ecx			; X86-NEXT: leal (%ecx,%ecx,2), %ecx
	; X86-NEXT: addl %ecx, %edx			; X86-NEXT: addl %ecx, %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_15:			; X64-HSW-LABEL: test_mul_by_15:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: leaq (%rax,%rax,2), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rax,%rax,2), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_15:			; X64-JAG-LABEL: test_mul_by_15:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: leaq (%rax,%rax,2), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rax,%rax,2), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_15:			; X86-NOOPT-LABEL: test_mul_by_15:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $15, %eax			; X86-NOOPT-NEXT: movl $15, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $15, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $15, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_15:			; HSW-NOOPT-LABEL: test_mul_by_15:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $15, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $15, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_15:			; JAG-NOOPT-LABEL: test_mul_by_15:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $15, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $15, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_15:			; X64-SLM-LABEL: test_mul_by_15:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 17 Lines
	; X86-NEXT: shldl $4, %eax, %edx			; X86-NEXT: shldl $4, %eax, %edx
	; X86-NEXT: shll $4, %eax			; X86-NEXT: shll $4, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_16:			; X64-HSW-LABEL: test_mul_by_16:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: shlq $4, %rdi # sched: [1:0.50]			; X64-HSW-NEXT: shlq $4, %rdi # sched: [1:0.50]
	; X64-HSW-NEXT: movq %rdi, %rax # sched: [1:0.25]			; X64-HSW-NEXT: movq %rdi, %rax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_16:			; X64-JAG-LABEL: test_mul_by_16:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: shlq $4, %rdi # sched: [1:0.50]			; X64-JAG-NEXT: shlq $4, %rdi # sched: [1:0.50]
	; X64-JAG-NEXT: movq %rdi, %rax # sched: [1:0.17]			; X64-JAG-NEXT: movq %rdi, %rax # sched: [1:0.17]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_16:			; X86-NOOPT-LABEL: test_mul_by_16:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %edx			; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %edx
	; X86-NOOPT-NEXT: shldl $4, %eax, %edx			; X86-NOOPT-NEXT: shldl $4, %eax, %edx
	; X86-NOOPT-NEXT: shll $4, %eax			; X86-NOOPT-NEXT: shll $4, %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_16:			; HSW-NOOPT-LABEL: test_mul_by_16:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: shlq $4, %rdi # sched: [1:0.50]			; HSW-NOOPT-NEXT: shlq $4, %rdi # sched: [1:0.50]
	; HSW-NOOPT-NEXT: movq %rdi, %rax # sched: [1:0.25]			; HSW-NOOPT-NEXT: movq %rdi, %rax # sched: [1:0.25]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_16:			; JAG-NOOPT-LABEL: test_mul_by_16:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: shlq $4, %rdi # sched: [1:0.50]			; JAG-NOOPT-NEXT: shlq $4, %rdi # sched: [1:0.50]
	; JAG-NOOPT-NEXT: movq %rdi, %rax # sched: [1:0.17]			; JAG-NOOPT-NEXT: movq %rdi, %rax # sched: [1:0.17]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_16:			; X64-SLM-LABEL: test_mul_by_16:
	Show All 23 Lines
	; X86-NEXT: addl %ecx, %edx			; X86-NEXT: addl %ecx, %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_17:			; X64-HSW-LABEL: test_mul_by_17:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: movq %rdi, %rax # sched: [1:0.25]			; X64-HSW-NEXT: movq %rdi, %rax # sched: [1:0.25]
	; X64-HSW-NEXT: shlq $4, %rax # sched: [1:0.50]			; X64-HSW-NEXT: shlq $4, %rax # sched: [1:0.50]
	; X64-HSW-NEXT: leaq (%rax,%rdi), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rax,%rdi), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_17:			; X64-JAG-LABEL: test_mul_by_17:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: movq %rdi, %rax # sched: [1:0.17]			; X64-JAG-NEXT: movq %rdi, %rax # sched: [1:0.17]
	; X64-JAG-NEXT: shlq $4, %rax # sched: [1:0.50]			; X64-JAG-NEXT: shlq $4, %rax # sched: [1:0.50]
	; X64-JAG-NEXT: leaq (%rax,%rdi), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rax,%rdi), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_17:			; X86-NOOPT-LABEL: test_mul_by_17:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $17, %eax			; X86-NOOPT-NEXT: movl $17, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $17, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $17, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_17:			; HSW-NOOPT-LABEL: test_mul_by_17:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $17, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $17, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_17:			; JAG-NOOPT-LABEL: test_mul_by_17:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $17, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $17, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_17:			; X64-SLM-LABEL: test_mul_by_17:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 19 Lines
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NEXT: leal (%edx,%ecx,2), %edx			; X86-NEXT: leal (%edx,%ecx,2), %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_18:			; X64-HSW-LABEL: test_mul_by_18:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: addq %rdi, %rdi # sched: [1:0.25]			; X64-HSW-NEXT: addq %rdi, %rdi # sched: [1:0.25]
	; X64-HSW-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_18:			; X64-JAG-LABEL: test_mul_by_18:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: addq %rdi, %rdi # sched: [1:0.50]			; X64-JAG-NEXT: addq %rdi, %rdi # sched: [1:0.50]
	; X64-JAG-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_18:			; X86-NOOPT-LABEL: test_mul_by_18:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $18, %eax			; X86-NOOPT-NEXT: movl $18, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $18, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $18, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_18:			; HSW-NOOPT-LABEL: test_mul_by_18:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $18, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $18, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_18:			; JAG-NOOPT-LABEL: test_mul_by_18:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $18, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $18, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_18:			; X64-SLM-LABEL: test_mul_by_18:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 21 Lines
	; X86-NEXT: addl %ecx, %edx			; X86-NEXT: addl %ecx, %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_19:			; X64-HSW-LABEL: test_mul_by_19:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: shlq $2, %rax # sched: [1:0.50]			; X64-HSW-NEXT: shlq $2, %rax # sched: [1:0.50]
	; X64-HSW-NEXT: subq %rdi, %rax # sched: [1:0.25]			; X64-HSW-NEXT: subq %rdi, %rax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_19:			; X64-JAG-LABEL: test_mul_by_19:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: shlq $2, %rax # sched: [1:0.50]			; X64-JAG-NEXT: shlq $2, %rax # sched: [1:0.50]
	; X64-JAG-NEXT: subq %rdi, %rax # sched: [1:0.50]			; X64-JAG-NEXT: subq %rdi, %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_19:			; X86-NOOPT-LABEL: test_mul_by_19:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $19, %eax			; X86-NOOPT-NEXT: movl $19, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $19, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $19, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_19:			; HSW-NOOPT-LABEL: test_mul_by_19:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $19, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $19, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_19:			; JAG-NOOPT-LABEL: test_mul_by_19:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $19, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $19, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_19:			; X64-SLM-LABEL: test_mul_by_19:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 17 Lines
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NEXT: leal (%edx,%ecx,4), %edx			; X86-NEXT: leal (%edx,%ecx,4), %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_20:			; X64-HSW-LABEL: test_mul_by_20:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: shlq $2, %rdi # sched: [1:0.50]			; X64-HSW-NEXT: shlq $2, %rdi # sched: [1:0.50]
	; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_20:			; X64-JAG-LABEL: test_mul_by_20:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: shlq $2, %rdi # sched: [1:0.50]			; X64-JAG-NEXT: shlq $2, %rdi # sched: [1:0.50]
	; X64-JAG-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_20:			; X86-NOOPT-LABEL: test_mul_by_20:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $20, %eax			; X86-NOOPT-NEXT: movl $20, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $20, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $20, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_20:			; HSW-NOOPT-LABEL: test_mul_by_20:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $20, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $20, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_20:			; JAG-NOOPT-LABEL: test_mul_by_20:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $20, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $20, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_20:			; X64-SLM-LABEL: test_mul_by_20:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 19 Lines
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NEXT: addl %ecx, %edx			; X86-NEXT: addl %ecx, %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_21:			; X64-HSW-LABEL: test_mul_by_21:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: leaq (%rdi,%rax,4), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rax,4), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_21:			; X64-JAG-LABEL: test_mul_by_21:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: leaq (%rdi,%rax,4), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rax,4), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_21:			; X86-NOOPT-LABEL: test_mul_by_21:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $21, %eax			; X86-NOOPT-NEXT: movl $21, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $21, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $21, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_21:			; HSW-NOOPT-LABEL: test_mul_by_21:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $21, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $21, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_21:			; JAG-NOOPT-LABEL: test_mul_by_21:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $21, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $21, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_21:			; X64-SLM-LABEL: test_mul_by_21:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 20 Lines
	; X86-NEXT: addl %ecx, %edx			; X86-NEXT: addl %ecx, %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_22:			; X64-HSW-LABEL: test_mul_by_22:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: leaq (%rdi,%rax,4), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rax,4), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: addq %rdi, %rax # sched: [1:0.25]			; X64-HSW-NEXT: addq %rdi, %rax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_22:			; X64-JAG-LABEL: test_mul_by_22:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: leaq (%rdi,%rax,4), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rax,4), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: addq %rdi, %rax # sched: [1:0.50]			; X64-JAG-NEXT: addq %rdi, %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_22:			; X86-NOOPT-LABEL: test_mul_by_22:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $22, %eax			; X86-NOOPT-NEXT: movl $22, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $22, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $22, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_22:			; HSW-NOOPT-LABEL: test_mul_by_22:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $22, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $22, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_22:			; JAG-NOOPT-LABEL: test_mul_by_22:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $22, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $22, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_22:			; X64-SLM-LABEL: test_mul_by_22:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 20 Lines
	; X86-NEXT: addl %ecx, %edx			; X86-NEXT: addl %ecx, %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_23:			; X64-HSW-LABEL: test_mul_by_23:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: shlq $3, %rax # sched: [1:0.50]			; X64-HSW-NEXT: shlq $3, %rax # sched: [1:0.50]
	; X64-HSW-NEXT: subq %rdi, %rax # sched: [1:0.25]			; X64-HSW-NEXT: subq %rdi, %rax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_23:			; X64-JAG-LABEL: test_mul_by_23:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: shlq $3, %rax # sched: [1:0.50]			; X64-JAG-NEXT: shlq $3, %rax # sched: [1:0.50]
	; X64-JAG-NEXT: subq %rdi, %rax # sched: [1:0.50]			; X64-JAG-NEXT: subq %rdi, %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_23:			; X86-NOOPT-LABEL: test_mul_by_23:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $23, %eax			; X86-NOOPT-NEXT: movl $23, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $23, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $23, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_23:			; HSW-NOOPT-LABEL: test_mul_by_23:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $23, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $23, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_23:			; JAG-NOOPT-LABEL: test_mul_by_23:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $23, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $23, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_23:			; X64-SLM-LABEL: test_mul_by_23:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 17 Lines
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NEXT: leal (%edx,%ecx,8), %edx			; X86-NEXT: leal (%edx,%ecx,8), %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_24:			; X64-HSW-LABEL: test_mul_by_24:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: shlq $3, %rdi # sched: [1:0.50]			; X64-HSW-NEXT: shlq $3, %rdi # sched: [1:0.50]
	; X64-HSW-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_24:			; X64-JAG-LABEL: test_mul_by_24:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: shlq $3, %rdi # sched: [1:0.50]			; X64-JAG-NEXT: shlq $3, %rdi # sched: [1:0.50]
	; X64-JAG-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,2), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_24:			; X86-NOOPT-LABEL: test_mul_by_24:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $24, %eax			; X86-NOOPT-NEXT: movl $24, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $24, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $24, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_24:			; HSW-NOOPT-LABEL: test_mul_by_24:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $24, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $24, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_24:			; JAG-NOOPT-LABEL: test_mul_by_24:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $24, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $24, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_24:			; X64-SLM-LABEL: test_mul_by_24:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 19 Lines
	; X86-NEXT: leal (%ecx,%ecx,4), %ecx			; X86-NEXT: leal (%ecx,%ecx,4), %ecx
	; X86-NEXT: addl %ecx, %edx			; X86-NEXT: addl %ecx, %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_25:			; X64-HSW-LABEL: test_mul_by_25:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: leaq (%rax,%rax,4), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rax,%rax,4), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_25:			; X64-JAG-LABEL: test_mul_by_25:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: leaq (%rax,%rax,4), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rax,%rax,4), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_25:			; X86-NOOPT-LABEL: test_mul_by_25:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $25, %eax			; X86-NOOPT-NEXT: movl $25, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $25, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $25, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_25:			; HSW-NOOPT-LABEL: test_mul_by_25:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $25, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $25, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_25:			; JAG-NOOPT-LABEL: test_mul_by_25:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $25, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $25, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_25:			; X64-SLM-LABEL: test_mul_by_25:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 21 Lines
	; X86-NEXT: addl %ecx, %edx			; X86-NEXT: addl %ecx, %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_26:			; X64-HSW-LABEL: test_mul_by_26:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: leaq (%rax,%rax,2), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rax,%rax,2), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: subq %rdi, %rax # sched: [1:0.25]			; X64-HSW-NEXT: subq %rdi, %rax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_26:			; X64-JAG-LABEL: test_mul_by_26:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: leaq (%rax,%rax,2), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rax,%rax,2), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: subq %rdi, %rax # sched: [1:0.50]			; X64-JAG-NEXT: subq %rdi, %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_26:			; X86-NOOPT-LABEL: test_mul_by_26:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $26, %eax			; X86-NOOPT-NEXT: movl $26, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $26, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $26, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_26:			; HSW-NOOPT-LABEL: test_mul_by_26:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $26, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $26, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_26:			; JAG-NOOPT-LABEL: test_mul_by_26:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $26, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $26, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_26:			; X64-SLM-LABEL: test_mul_by_26:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 18 Lines
	; X86-NEXT: leal (%ecx,%ecx,2), %ecx			; X86-NEXT: leal (%ecx,%ecx,2), %ecx
	; X86-NEXT: addl %ecx, %edx			; X86-NEXT: addl %ecx, %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_27:			; X64-HSW-LABEL: test_mul_by_27:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: leaq (%rax,%rax,2), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rax,%rax,2), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_27:			; X64-JAG-LABEL: test_mul_by_27:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: leaq (%rax,%rax,2), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rax,%rax,2), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_27:			; X86-NOOPT-LABEL: test_mul_by_27:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $27, %eax			; X86-NOOPT-NEXT: movl $27, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $27, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $27, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_27:			; HSW-NOOPT-LABEL: test_mul_by_27:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $27, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $27, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_27:			; JAG-NOOPT-LABEL: test_mul_by_27:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $27, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $27, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_27:			; X64-SLM-LABEL: test_mul_by_27:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 21 Lines
	; X86-NEXT: addl %ecx, %edx			; X86-NEXT: addl %ecx, %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_28:			; X64-HSW-LABEL: test_mul_by_28:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: leaq (%rax,%rax,2), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rax,%rax,2), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: addq %rdi, %rax # sched: [1:0.25]			; X64-HSW-NEXT: addq %rdi, %rax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_28:			; X64-JAG-LABEL: test_mul_by_28:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: leaq (%rax,%rax,2), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rax,%rax,2), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: addq %rdi, %rax # sched: [1:0.50]			; X64-JAG-NEXT: addq %rdi, %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_28:			; X86-NOOPT-LABEL: test_mul_by_28:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $28, %eax			; X86-NOOPT-NEXT: movl $28, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $28, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $28, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_28:			; HSW-NOOPT-LABEL: test_mul_by_28:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $28, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $28, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_28:			; JAG-NOOPT-LABEL: test_mul_by_28:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $28, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $28, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_28:			; X64-SLM-LABEL: test_mul_by_28:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 22 Lines
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_29:			; X64-HSW-LABEL: test_mul_by_29:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: leaq (%rax,%rax,2), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rax,%rax,2), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: addq %rdi, %rax # sched: [1:0.25]			; X64-HSW-NEXT: addq %rdi, %rax # sched: [1:0.25]
	; X64-HSW-NEXT: addq %rdi, %rax # sched: [1:0.25]			; X64-HSW-NEXT: addq %rdi, %rax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_29:			; X64-JAG-LABEL: test_mul_by_29:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rdi,%rdi,8), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: leaq (%rax,%rax,2), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq (%rax,%rax,2), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: addq %rdi, %rax # sched: [1:0.50]			; X64-JAG-NEXT: addq %rdi, %rax # sched: [1:0.50]
	; X64-JAG-NEXT: addq %rdi, %rax # sched: [1:0.50]			; X64-JAG-NEXT: addq %rdi, %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_29:			; X86-NOOPT-LABEL: test_mul_by_29:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $29, %eax			; X86-NOOPT-NEXT: movl $29, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $29, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $29, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_29:			; HSW-NOOPT-LABEL: test_mul_by_29:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $29, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $29, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_29:			; JAG-NOOPT-LABEL: test_mul_by_29:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $29, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $29, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_29:			; X64-SLM-LABEL: test_mul_by_29:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 22 Lines
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_30:			; X64-HSW-LABEL: test_mul_by_30:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: movq %rdi, %rax # sched: [1:0.25]			; X64-HSW-NEXT: movq %rdi, %rax # sched: [1:0.25]
	; X64-HSW-NEXT: shlq $5, %rax # sched: [1:0.50]			; X64-HSW-NEXT: shlq $5, %rax # sched: [1:0.50]
	; X64-HSW-NEXT: subq %rdi, %rax # sched: [1:0.25]			; X64-HSW-NEXT: subq %rdi, %rax # sched: [1:0.25]
	; X64-HSW-NEXT: subq %rdi, %rax # sched: [1:0.25]			; X64-HSW-NEXT: subq %rdi, %rax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_30:			; X64-JAG-LABEL: test_mul_by_30:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: movq %rdi, %rax # sched: [1:0.17]			; X64-JAG-NEXT: movq %rdi, %rax # sched: [1:0.17]
	; X64-JAG-NEXT: shlq $5, %rax # sched: [1:0.50]			; X64-JAG-NEXT: shlq $5, %rax # sched: [1:0.50]
	; X64-JAG-NEXT: subq %rdi, %rax # sched: [1:0.50]			; X64-JAG-NEXT: subq %rdi, %rax # sched: [1:0.50]
	; X64-JAG-NEXT: subq %rdi, %rax # sched: [1:0.50]			; X64-JAG-NEXT: subq %rdi, %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_30:			; X86-NOOPT-LABEL: test_mul_by_30:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $30, %eax			; X86-NOOPT-NEXT: movl $30, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $30, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $30, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_30:			; HSW-NOOPT-LABEL: test_mul_by_30:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $30, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $30, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_30:			; JAG-NOOPT-LABEL: test_mul_by_30:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $30, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $30, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_30:			; X64-SLM-LABEL: test_mul_by_30:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 20 Lines
	; X86-NEXT: addl %ecx, %edx			; X86-NEXT: addl %ecx, %edx
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_31:			; X64-HSW-LABEL: test_mul_by_31:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: movq %rdi, %rax # sched: [1:0.25]			; X64-HSW-NEXT: movq %rdi, %rax # sched: [1:0.25]
	; X64-HSW-NEXT: shlq $5, %rax # sched: [1:0.50]			; X64-HSW-NEXT: shlq $5, %rax # sched: [1:0.50]
	; X64-HSW-NEXT: subq %rdi, %rax # sched: [1:0.25]			; X64-HSW-NEXT: subq %rdi, %rax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_31:			; X64-JAG-LABEL: test_mul_by_31:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: movq %rdi, %rax # sched: [1:0.17]			; X64-JAG-NEXT: movq %rdi, %rax # sched: [1:0.17]
	; X64-JAG-NEXT: shlq $5, %rax # sched: [1:0.50]			; X64-JAG-NEXT: shlq $5, %rax # sched: [1:0.50]
	; X64-JAG-NEXT: subq %rdi, %rax # sched: [1:0.50]			; X64-JAG-NEXT: subq %rdi, %rax # sched: [1:0.50]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_31:			; X86-NOOPT-LABEL: test_mul_by_31:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl $31, %eax			; X86-NOOPT-NEXT: movl $31, %eax
	; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)			; X86-NOOPT-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NOOPT-NEXT: imull $31, {{[0-9]+}}(%esp), %ecx			; X86-NOOPT-NEXT: imull $31, {{[0-9]+}}(%esp), %ecx
	; X86-NOOPT-NEXT: addl %ecx, %edx			; X86-NOOPT-NEXT: addl %ecx, %edx
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_31:			; HSW-NOOPT-LABEL: test_mul_by_31:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: imulq $31, %rdi, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq $31, %rdi, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_31:			; JAG-NOOPT-LABEL: test_mul_by_31:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: imulq $31, %rdi, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq $31, %rdi, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_31:			; X64-SLM-LABEL: test_mul_by_31:
	; X64-SLM: # BB#0:			; X64-SLM: # BB#0:
	Show All 18 Lines
	; X86-NEXT: shldl $5, %eax, %edx			; X86-NEXT: shldl $5, %eax, %edx
	; X86-NEXT: shll $5, %eax			; X86-NEXT: shll $5, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-HSW-LABEL: test_mul_by_32:			; X64-HSW-LABEL: test_mul_by_32:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: shlq $5, %rdi # sched: [1:0.50]			; X64-HSW-NEXT: shlq $5, %rdi # sched: [1:0.50]
	; X64-HSW-NEXT: movq %rdi, %rax # sched: [1:0.25]			; X64-HSW-NEXT: movq %rdi, %rax # sched: [1:0.25]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_by_32:			; X64-JAG-LABEL: test_mul_by_32:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: shlq $5, %rdi # sched: [1:0.50]			; X64-JAG-NEXT: shlq $5, %rdi # sched: [1:0.50]
	; X64-JAG-NEXT: movq %rdi, %rax # sched: [1:0.17]			; X64-JAG-NEXT: movq %rdi, %rax # sched: [1:0.17]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	; X86-NOOPT-LABEL: test_mul_by_32:			; X86-NOOPT-LABEL: test_mul_by_32:
	; X86-NOOPT: # BB#0:			; X86-NOOPT: # BB#0:
	; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %edx			; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %edx
	; X86-NOOPT-NEXT: shldl $5, %eax, %edx			; X86-NOOPT-NEXT: shldl $5, %eax, %edx
	; X86-NOOPT-NEXT: shll $5, %eax			; X86-NOOPT-NEXT: shll $5, %eax
	; X86-NOOPT-NEXT: retl			; X86-NOOPT-NEXT: retl
	;			;
	; HSW-NOOPT-LABEL: test_mul_by_32:			; HSW-NOOPT-LABEL: test_mul_by_32:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: shlq $5, %rdi # sched: [1:0.50]			; HSW-NOOPT-NEXT: shlq $5, %rdi # sched: [1:0.50]
	; HSW-NOOPT-NEXT: movq %rdi, %rax # sched: [1:0.25]			; HSW-NOOPT-NEXT: movq %rdi, %rax # sched: [1:0.25]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_by_32:			; JAG-NOOPT-LABEL: test_mul_by_32:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: shlq $5, %rdi # sched: [1:0.50]			; JAG-NOOPT-NEXT: shlq $5, %rdi # sched: [1:0.50]
	; JAG-NOOPT-NEXT: movq %rdi, %rax # sched: [1:0.17]			; JAG-NOOPT-NEXT: movq %rdi, %rax # sched: [1:0.17]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	; X64-SLM-LABEL: test_mul_by_32:			; X64-SLM-LABEL: test_mul_by_32:
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	;			;
	; X64-HSW-LABEL: test_mul_spec:			; X64-HSW-LABEL: test_mul_spec:
	; X64-HSW: # BB#0:			; X64-HSW: # BB#0:
	; X64-HSW-NEXT: leaq (%rdi,%rdi,8), %rcx # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,8), %rcx # sched: [1:0.50]
	; X64-HSW-NEXT: addq $42, %rcx # sched: [1:0.25]			; X64-HSW-NEXT: addq $42, %rcx # sched: [1:0.25]
	; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; X64-HSW-NEXT: addq $2, %rax # sched: [1:0.25]			; X64-HSW-NEXT: addq $2, %rax # sched: [1:0.25]
	; X64-HSW-NEXT: imulq %rcx, %rax # sched: [3:1.00]			; X64-HSW-NEXT: imulq %rcx, %rax # sched: [3:1.00]
	; X64-HSW-NEXT: retq # sched: [1:1.00]			; X64-HSW-NEXT: retq # sched: [2:1.00]
	;			;
	; X64-JAG-LABEL: test_mul_spec:			; X64-JAG-LABEL: test_mul_spec:
	; X64-JAG: # BB#0:			; X64-JAG: # BB#0:
	; X64-JAG-NEXT: leaq 42(%rdi,%rdi,8), %rcx # sched: [1:0.50]			; X64-JAG-NEXT: leaq 42(%rdi,%rdi,8), %rcx # sched: [1:0.50]
	; X64-JAG-NEXT: leaq 2(%rdi,%rdi,4), %rax # sched: [1:0.50]			; X64-JAG-NEXT: leaq 2(%rdi,%rdi,4), %rax # sched: [1:0.50]
	; X64-JAG-NEXT: imulq %rcx, %rax # sched: [3:1.00]			; X64-JAG-NEXT: imulq %rcx, %rax # sched: [3:1.00]
	; X64-JAG-NEXT: retq # sched: [4:1.00]			; X64-JAG-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 31 Lines
	;			;
	; HSW-NOOPT-LABEL: test_mul_spec:			; HSW-NOOPT-LABEL: test_mul_spec:
	; HSW-NOOPT: # BB#0:			; HSW-NOOPT: # BB#0:
	; HSW-NOOPT-NEXT: leaq (%rdi,%rdi,8), %rcx # sched: [1:0.50]			; HSW-NOOPT-NEXT: leaq (%rdi,%rdi,8), %rcx # sched: [1:0.50]
	; HSW-NOOPT-NEXT: addq $42, %rcx # sched: [1:0.25]			; HSW-NOOPT-NEXT: addq $42, %rcx # sched: [1:0.25]
	; HSW-NOOPT-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]			; HSW-NOOPT-NEXT: leaq (%rdi,%rdi,4), %rax # sched: [1:0.50]
	; HSW-NOOPT-NEXT: addq $2, %rax # sched: [1:0.25]			; HSW-NOOPT-NEXT: addq $2, %rax # sched: [1:0.25]
	; HSW-NOOPT-NEXT: imulq %rcx, %rax # sched: [3:1.00]			; HSW-NOOPT-NEXT: imulq %rcx, %rax # sched: [3:1.00]
	; HSW-NOOPT-NEXT: retq # sched: [1:1.00]			; HSW-NOOPT-NEXT: retq # sched: [2:1.00]
	;			;
	; JAG-NOOPT-LABEL: test_mul_spec:			; JAG-NOOPT-LABEL: test_mul_spec:
	; JAG-NOOPT: # BB#0:			; JAG-NOOPT: # BB#0:
	; JAG-NOOPT-NEXT: leaq 42(%rdi,%rdi,8), %rcx # sched: [1:0.50]			; JAG-NOOPT-NEXT: leaq 42(%rdi,%rdi,8), %rcx # sched: [1:0.50]
	; JAG-NOOPT-NEXT: leaq 2(%rdi,%rdi,4), %rax # sched: [1:0.50]			; JAG-NOOPT-NEXT: leaq 2(%rdi,%rdi,4), %rax # sched: [1:0.50]
	; JAG-NOOPT-NEXT: imulq %rcx, %rax # sched: [3:1.00]			; JAG-NOOPT-NEXT: imulq %rcx, %rax # sched: [3:1.00]
	; JAG-NOOPT-NEXT: retq # sched: [4:1.00]			; JAG-NOOPT-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 20 Lines

test/CodeGen/X86/popcnt-schedule.ll

	Show All 31 Lines
	; SANDY-NEXT: popcntw (%rsi), %cx # sched: [9:1.00]			; SANDY-NEXT: popcntw (%rsi), %cx # sched: [9:1.00]
	; SANDY-NEXT: popcntw %di, %ax # sched: [3:1.00]			; SANDY-NEXT: popcntw %di, %ax # sched: [3:1.00]
	; SANDY-NEXT: orl %ecx, %eax # sched: [1:0.33]			; SANDY-NEXT: orl %ecx, %eax # sched: [1:0.33]
	; SANDY-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; SANDY-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_ctpop_i16:			; HASWELL-LABEL: test_ctpop_i16:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: popcntw (%rsi), %cx # sched: [7:1.00]			; HASWELL-NEXT: popcntw (%rsi), %cx # sched: [3:1.00]
	; HASWELL-NEXT: popcntw %di, %ax # sched: [3:1.00]			; HASWELL-NEXT: popcntw %di, %ax # sched: [3:1.00]
	; HASWELL-NEXT: orl %ecx, %eax # sched: [1:0.25]			; HASWELL-NEXT: orl %ecx, %eax # sched: [1:0.25]
	; HASWELL-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; HASWELL-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_ctpop_i16:			; BTVER2-LABEL: test_ctpop_i16:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: popcntw (%rsi), %cx # sched: [8:1.00]			; BTVER2-NEXT: popcntw (%rsi), %cx # sched: [8:1.00]
	; BTVER2-NEXT: popcntw %di, %ax # sched: [3:1.00]			; BTVER2-NEXT: popcntw %di, %ax # sched: [3:1.00]
	; BTVER2-NEXT: orl %ecx, %eax # sched: [1:0.50]			; BTVER2-NEXT: orl %ecx, %eax # sched: [1:0.50]
	; BTVER2-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; BTVER2-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	Show All 32 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: popcntl (%rsi), %ecx # sched: [9:1.00]			; SANDY-NEXT: popcntl (%rsi), %ecx # sched: [9:1.00]
	; SANDY-NEXT: popcntl %edi, %eax # sched: [3:1.00]			; SANDY-NEXT: popcntl %edi, %eax # sched: [3:1.00]
	; SANDY-NEXT: orl %ecx, %eax # sched: [1:0.33]			; SANDY-NEXT: orl %ecx, %eax # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_ctpop_i32:			; HASWELL-LABEL: test_ctpop_i32:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: popcntl (%rsi), %ecx # sched: [7:1.00]			; HASWELL-NEXT: popcntl (%rsi), %ecx # sched: [3:1.00]
	; HASWELL-NEXT: popcntl %edi, %eax # sched: [3:1.00]			; HASWELL-NEXT: popcntl %edi, %eax # sched: [3:1.00]
	; HASWELL-NEXT: orl %ecx, %eax # sched: [1:0.25]			; HASWELL-NEXT: orl %ecx, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_ctpop_i32:			; BTVER2-LABEL: test_ctpop_i32:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: popcntl (%rsi), %ecx # sched: [8:1.00]			; BTVER2-NEXT: popcntl (%rsi), %ecx # sched: [8:1.00]
	; BTVER2-NEXT: popcntl %edi, %eax # sched: [3:1.00]			; BTVER2-NEXT: popcntl %edi, %eax # sched: [3:1.00]
	; BTVER2-NEXT: orl %ecx, %eax # sched: [1:0.50]			; BTVER2-NEXT: orl %ecx, %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 30 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: popcntq (%rsi), %rcx # sched: [9:1.00]			; SANDY-NEXT: popcntq (%rsi), %rcx # sched: [9:1.00]
	; SANDY-NEXT: popcntq %rdi, %rax # sched: [3:1.00]			; SANDY-NEXT: popcntq %rdi, %rax # sched: [3:1.00]
	; SANDY-NEXT: orq %rcx, %rax # sched: [1:0.33]			; SANDY-NEXT: orq %rcx, %rax # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_ctpop_i64:			; HASWELL-LABEL: test_ctpop_i64:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: popcntq (%rsi), %rcx # sched: [7:1.00]			; HASWELL-NEXT: popcntq (%rsi), %rcx # sched: [3:1.00]
	; HASWELL-NEXT: popcntq %rdi, %rax # sched: [3:1.00]			; HASWELL-NEXT: popcntq %rdi, %rax # sched: [3:1.00]
	; HASWELL-NEXT: orq %rcx, %rax # sched: [1:0.25]			; HASWELL-NEXT: orq %rcx, %rax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_ctpop_i64:			; BTVER2-LABEL: test_ctpop_i64:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: popcntq (%rsi), %rcx # sched: [8:1.00]			; BTVER2-NEXT: popcntq (%rsi), %rcx # sched: [8:1.00]
	; BTVER2-NEXT: popcntq %rdi, %rax # sched: [3:1.00]			; BTVER2-NEXT: popcntq %rdi, %rax # sched: [3:1.00]
	; BTVER2-NEXT: orq %rcx, %rax # sched: [1:0.50]			; BTVER2-NEXT: orq %rcx, %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 13 Lines

test/CodeGen/X86/pr32329.ll

	Show First 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; X86-NEXT: movl $9, %esi			; X86-NEXT: movl $9, %esi
	; X86-NEXT: xorl %ebp, %ebp			; X86-NEXT: xorl %ebp, %ebp
	; X86-NEXT: shldl %cl, %esi, %ebp			; X86-NEXT: shldl %cl, %esi, %ebp
	; X86-NEXT: shlxl %ecx, %esi, %esi			; X86-NEXT: shlxl %ecx, %esi, %esi
	; X86-NEXT: testb $32, %cl			; X86-NEXT: testb $32, %cl
	; X86-NEXT: cmovnel %esi, %ebp			; X86-NEXT: cmovnel %esi, %ebp
	; X86-NEXT: movl $0, %ecx			; X86-NEXT: movl $0, %ecx
	; X86-NEXT: cmovnel %ecx, %esi			; X86-NEXT: cmovnel %ecx, %esi
	; X86-NEXT: cmpl %edx, %edi
	; X86-NEXT: movl %ebp, var_50+4			; X86-NEXT: movl %ebp, var_50+4
	; X86-NEXT: movl %esi, var_50			; X86-NEXT: movl %esi, var_50
				; X86-NEXT: cmpl %edx, %edi
	; X86-NEXT: setge var_205			; X86-NEXT: setge var_205
	; X86-NEXT: imull %eax, %ebx			; X86-NEXT: imull %eax, %ebx
	; X86-NEXT: movb %bl, var_218			; X86-NEXT: movb %bl, var_218
	; X86-NEXT: popl %esi			; X86-NEXT: popl %esi
	; X86-NEXT: popl %edi			; X86-NEXT: popl %edi
	; X86-NEXT: popl %ebx			; X86-NEXT: popl %ebx
	; X86-NEXT: popl %ebp			; X86-NEXT: popl %ebp
	; X86-NEXT: retl			; X86-NEXT: retl
	▲ Show 20 Lines • Show All 56 Lines • Show Last 20 Lines

test/CodeGen/X86/recip-fastmath.ll

	Show First 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; SANDY-LABEL: f32_no_estimate:			; SANDY-LABEL: f32_no_estimate:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [6:0.50]			; SANDY-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [6:0.50]
	; SANDY-NEXT: vdivss %xmm0, %xmm1, %xmm0 # sched: [14:1.00]			; SANDY-NEXT: vdivss %xmm0, %xmm1, %xmm0 # sched: [14:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: f32_no_estimate:			; HASWELL-LABEL: f32_no_estimate:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [4:0.50]			; HASWELL-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [1:0.50]
	; HASWELL-NEXT: vdivss %xmm0, %xmm1, %xmm0 # sched: [12:1.00]			; HASWELL-NEXT: vdivss %xmm0, %xmm1, %xmm0 # sched: [13:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: f32_no_estimate:			; HASWELL-NO-FMA-LABEL: f32_no_estimate:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero			; HASWELL-NO-FMA-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero
	; HASWELL-NO-FMA-NEXT: vdivss %xmm0, %xmm1, %xmm0			; HASWELL-NO-FMA-NEXT: vdivss %xmm0, %xmm1, %xmm0
	; HASWELL-NO-FMA-NEXT: retq			; HASWELL-NO-FMA-NEXT: retq
	;			;
	; AVX512-LABEL: f32_no_estimate:			; AVX512-LABEL: f32_no_estimate:
	; AVX512: # BB#0:			; AVX512: # BB#0:
	; AVX512-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [4:0.50]			; AVX512-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [1:0.50]
	; AVX512-NEXT: vdivss %xmm0, %xmm1, %xmm0 # sched: [12:1.00]			; AVX512-NEXT: vdivss %xmm0, %xmm1, %xmm0 # sched: [13:1.00]
	; AVX512-NEXT: retq # sched: [1:1.00]			; AVX512-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast float 1.0, %x			%div = fdiv fast float 1.0, %x
	ret float %div			ret float %div
	}			}

	define float @f32_one_step(float %x) #1 {			define float @f32_one_step(float %x) #1 {
	; SSE-LABEL: f32_one_step:			; SSE-LABEL: f32_one_step:
	; SSE: # BB#0:			; SSE: # BB#0:
	; SSE-NEXT: rcpss %xmm0, %xmm2			; SSE-NEXT: rcpss %xmm0, %xmm2
	Show All 40 Lines
	; SANDY-NEXT: vsubss %xmm0, %xmm2, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vsubss %xmm0, %xmm2, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: vaddss %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddss %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: f32_one_step:			; HASWELL-LABEL: f32_one_step:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpss %xmm0, %xmm0, %xmm1 # sched: [5:1.00]			; HASWELL-NEXT: vrcpss %xmm0, %xmm0, %xmm1 # sched: [5:1.00]
	; HASWELL-NEXT: vfnmadd213ss {{.*}}(%rip), %xmm1, %xmm0			; HASWELL-NEXT: vfnmadd213ss {{.*}}(%rip), %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ss %xmm1, %xmm1, %xmm0			; HASWELL-NEXT: vfmadd132ss %xmm1, %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: f32_one_step:			; HASWELL-NO-FMA-LABEL: f32_one_step:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vrcpss %xmm0, %xmm0, %xmm1			; HASWELL-NO-FMA-NEXT: vrcpss %xmm0, %xmm0, %xmm1
	; HASWELL-NO-FMA-NEXT: vmulss %xmm1, %xmm0, %xmm0			; HASWELL-NO-FMA-NEXT: vmulss %xmm1, %xmm0, %xmm0
	; HASWELL-NO-FMA-NEXT: vmovss {{.*#+}} xmm2 = mem[0],zero,zero,zero			; HASWELL-NO-FMA-NEXT: vmovss {{.*#+}} xmm2 = mem[0],zero,zero,zero
	; HASWELL-NO-FMA-NEXT: vsubss %xmm0, %xmm2, %xmm0			; HASWELL-NO-FMA-NEXT: vsubss %xmm0, %xmm2, %xmm0
	; HASWELL-NO-FMA-NEXT: vmulss %xmm0, %xmm1, %xmm0			; HASWELL-NO-FMA-NEXT: vmulss %xmm0, %xmm1, %xmm0
	; HASWELL-NO-FMA-NEXT: vaddss %xmm0, %xmm1, %xmm0			; HASWELL-NO-FMA-NEXT: vaddss %xmm0, %xmm1, %xmm0
	; HASWELL-NO-FMA-NEXT: retq			; HASWELL-NO-FMA-NEXT: retq
	;			;
	; AVX512-LABEL: f32_one_step:			; AVX512-LABEL: f32_one_step:
	; AVX512: # BB#0:			; AVX512: # BB#0:
	; AVX512-NEXT: vrcp14ss %xmm0, %xmm0, %xmm1			; AVX512-NEXT: vrcp14ss %xmm0, %xmm0, %xmm1
	; AVX512-NEXT: vfnmadd213ss {{.*}}(%rip), %xmm1, %xmm0			; AVX512-NEXT: vfnmadd213ss {{.*}}(%rip), %xmm1, %xmm0 # sched: [5:0.50]
	; AVX512-NEXT: vfmadd132ss %xmm1, %xmm1, %xmm0			; AVX512-NEXT: vfmadd132ss %xmm1, %xmm1, %xmm0 # sched: [5:0.50]
	; AVX512-NEXT: retq # sched: [1:1.00]			; AVX512-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast float 1.0, %x			%div = fdiv fast float 1.0, %x
	ret float %div			ret float %div
	}			}

	define float @f32_two_step(float %x) #2 {			define float @f32_two_step(float %x) #2 {
	; SSE-LABEL: f32_two_step:			; SSE-LABEL: f32_two_step:
	; SSE: # BB#0:			; SSE: # BB#0:
	; SSE-NEXT: rcpss %xmm0, %xmm2			; SSE-NEXT: rcpss %xmm0, %xmm2
	▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vsubss %xmm0, %xmm3, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vsubss %xmm0, %xmm3, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: vaddss %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddss %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: f32_two_step:			; HASWELL-LABEL: f32_two_step:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpss %xmm0, %xmm0, %xmm1 # sched: [5:1.00]			; HASWELL-NEXT: vrcpss %xmm0, %xmm0, %xmm1 # sched: [5:1.00]
	; HASWELL-NEXT: vmovss {{.*#+}} xmm2 = mem[0],zero,zero,zero sched: [4:0.50]			; HASWELL-NEXT: vmovss {{.*#+}} xmm2 = mem[0],zero,zero,zero sched: [1:0.50]
	; HASWELL-NEXT: vmovaps %xmm1, %xmm3 # sched: [1:1.00]			; HASWELL-NEXT: vmovaps %xmm1, %xmm3 # sched: [1:1.00]
	; HASWELL-NEXT: vfnmadd213ss %xmm2, %xmm0, %xmm3			; HASWELL-NEXT: vfnmadd213ss %xmm2, %xmm0, %xmm3 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ss %xmm1, %xmm1, %xmm3			; HASWELL-NEXT: vfmadd132ss %xmm1, %xmm1, %xmm3 # sched: [5:0.50]
	; HASWELL-NEXT: vfnmadd213ss %xmm2, %xmm3, %xmm0			; HASWELL-NEXT: vfnmadd213ss %xmm2, %xmm3, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ss %xmm3, %xmm3, %xmm0			; HASWELL-NEXT: vfmadd132ss %xmm3, %xmm3, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: f32_two_step:			; HASWELL-NO-FMA-LABEL: f32_two_step:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vrcpss %xmm0, %xmm0, %xmm1			; HASWELL-NO-FMA-NEXT: vrcpss %xmm0, %xmm0, %xmm1
	; HASWELL-NO-FMA-NEXT: vmulss %xmm1, %xmm0, %xmm2			; HASWELL-NO-FMA-NEXT: vmulss %xmm1, %xmm0, %xmm2
	; HASWELL-NO-FMA-NEXT: vmovss {{.*#+}} xmm3 = mem[0],zero,zero,zero			; HASWELL-NO-FMA-NEXT: vmovss {{.*#+}} xmm3 = mem[0],zero,zero,zero
	; HASWELL-NO-FMA-NEXT: vsubss %xmm2, %xmm3, %xmm2			; HASWELL-NO-FMA-NEXT: vsubss %xmm2, %xmm3, %xmm2
	; HASWELL-NO-FMA-NEXT: vmulss %xmm2, %xmm1, %xmm2			; HASWELL-NO-FMA-NEXT: vmulss %xmm2, %xmm1, %xmm2
	; HASWELL-NO-FMA-NEXT: vaddss %xmm2, %xmm1, %xmm1			; HASWELL-NO-FMA-NEXT: vaddss %xmm2, %xmm1, %xmm1
	; HASWELL-NO-FMA-NEXT: vmulss %xmm1, %xmm0, %xmm0			; HASWELL-NO-FMA-NEXT: vmulss %xmm1, %xmm0, %xmm0
	; HASWELL-NO-FMA-NEXT: vsubss %xmm0, %xmm3, %xmm0			; HASWELL-NO-FMA-NEXT: vsubss %xmm0, %xmm3, %xmm0
	; HASWELL-NO-FMA-NEXT: vmulss %xmm0, %xmm1, %xmm0			; HASWELL-NO-FMA-NEXT: vmulss %xmm0, %xmm1, %xmm0
	; HASWELL-NO-FMA-NEXT: vaddss %xmm0, %xmm1, %xmm0			; HASWELL-NO-FMA-NEXT: vaddss %xmm0, %xmm1, %xmm0
	; HASWELL-NO-FMA-NEXT: retq			; HASWELL-NO-FMA-NEXT: retq
	;			;
	; AVX512-LABEL: f32_two_step:			; AVX512-LABEL: f32_two_step:
	; AVX512: # BB#0:			; AVX512: # BB#0:
	; AVX512-NEXT: vrcp14ss %xmm0, %xmm0, %xmm1			; AVX512-NEXT: vrcp14ss %xmm0, %xmm0, %xmm1
	; AVX512-NEXT: vmovss {{.*#+}} xmm2 = mem[0],zero,zero,zero sched: [4:0.50]			; AVX512-NEXT: vmovss {{.*#+}} xmm2 = mem[0],zero,zero,zero sched: [1:0.50]
	; AVX512-NEXT: vmovaps %xmm1, %xmm3 # sched: [1:1.00]			; AVX512-NEXT: vmovaps %xmm1, %xmm3 # sched: [1:1.00]
	; AVX512-NEXT: vfnmadd213ss %xmm2, %xmm0, %xmm3			; AVX512-NEXT: vfnmadd213ss %xmm2, %xmm0, %xmm3 # sched: [5:0.50]
	; AVX512-NEXT: vfmadd132ss %xmm1, %xmm1, %xmm3			; AVX512-NEXT: vfmadd132ss %xmm1, %xmm1, %xmm3 # sched: [5:0.50]
	; AVX512-NEXT: vfnmadd213ss %xmm2, %xmm3, %xmm0			; AVX512-NEXT: vfnmadd213ss %xmm2, %xmm3, %xmm0 # sched: [5:0.50]
	; AVX512-NEXT: vfmadd132ss %xmm3, %xmm3, %xmm0			; AVX512-NEXT: vfmadd132ss %xmm3, %xmm3, %xmm0 # sched: [5:0.50]
	; AVX512-NEXT: retq # sched: [1:1.00]			; AVX512-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast float 1.0, %x			%div = fdiv fast float 1.0, %x
	ret float %div			ret float %div
	}			}

	define <4 x float> @v4f32_no_estimate(<4 x float> %x) #0 {			define <4 x float> @v4f32_no_estimate(<4 x float> %x) #0 {
	; SSE-LABEL: v4f32_no_estimate:			; SSE-LABEL: v4f32_no_estimate:
	; SSE: # BB#0:			; SSE: # BB#0:
	; SSE-NEXT: movaps {{.*#+}} xmm1 = [1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00]			; SSE-NEXT: movaps {{.*#+}} xmm1 = [1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00]
	Show All 22 Lines
	; SANDY-LABEL: v4f32_no_estimate:			; SANDY-LABEL: v4f32_no_estimate:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovaps {{.*#+}} xmm1 = [1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00] sched: [6:0.50]			; SANDY-NEXT: vmovaps {{.*#+}} xmm1 = [1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00] sched: [6:0.50]
	; SANDY-NEXT: vdivps %xmm0, %xmm1, %xmm0 # sched: [14:1.00]			; SANDY-NEXT: vdivps %xmm0, %xmm1, %xmm0 # sched: [14:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: v4f32_no_estimate:			; HASWELL-LABEL: v4f32_no_estimate:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vbroadcastss {{.*#+}} xmm1 = [1,1,1,1] sched: [4:0.50]			; HASWELL-NEXT: vbroadcastss {{.*#+}} xmm1 = [1,1,1,1] sched: [1:0.50]
	; HASWELL-NEXT: vdivps %xmm0, %xmm1, %xmm0 # sched: [12:1.00]			; HASWELL-NEXT: vdivps %xmm0, %xmm1, %xmm0 # sched: [13:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: v4f32_no_estimate:			; HASWELL-NO-FMA-LABEL: v4f32_no_estimate:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} xmm1 = [1,1,1,1]			; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} xmm1 = [1,1,1,1]
	; HASWELL-NO-FMA-NEXT: vdivps %xmm0, %xmm1, %xmm0			; HASWELL-NO-FMA-NEXT: vdivps %xmm0, %xmm1, %xmm0
	; HASWELL-NO-FMA-NEXT: retq			; HASWELL-NO-FMA-NEXT: retq
	;			;
	; AVX512-LABEL: v4f32_no_estimate:			; AVX512-LABEL: v4f32_no_estimate:
	; AVX512: # BB#0:			; AVX512: # BB#0:
	; AVX512-NEXT: vbroadcastss {{.*#+}} xmm1 = [1,1,1,1] sched: [4:0.50]			; AVX512-NEXT: vbroadcastss {{.*#+}} xmm1 = [1,1,1,1] sched: [1:0.50]
	; AVX512-NEXT: vdivps %xmm0, %xmm1, %xmm0 # sched: [12:1.00]			; AVX512-NEXT: vdivps %xmm0, %xmm1, %xmm0 # sched: [13:1.00]
	; AVX512-NEXT: retq # sched: [1:1.00]			; AVX512-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast <4 x float> <float 1.0, float 1.0, float 1.0, float 1.0>, %x			%div = fdiv fast <4 x float> <float 1.0, float 1.0, float 1.0, float 1.0>, %x
	ret <4 x float> %div			ret <4 x float> %div
	}			}

	define <4 x float> @v4f32_one_step(<4 x float> %x) #1 {			define <4 x float> @v4f32_one_step(<4 x float> %x) #1 {
	; SSE-LABEL: v4f32_one_step:			; SSE-LABEL: v4f32_one_step:
	; SSE: # BB#0:			; SSE: # BB#0:
	; SSE-NEXT: rcpps %xmm0, %xmm2			; SSE-NEXT: rcpps %xmm0, %xmm2
	Show All 40 Lines
	; SANDY-NEXT: vsubps %xmm0, %xmm2, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vsubps %xmm0, %xmm2, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: v4f32_one_step:			; HASWELL-LABEL: v4f32_one_step:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]			; HASWELL-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]
	; HASWELL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [4:0.50]			; HASWELL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [1:0.50]
	; HASWELL-NEXT: vfnmadd213ps %xmm2, %xmm1, %xmm0			; HASWELL-NEXT: vfnmadd213ps %xmm2, %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm0			; HASWELL-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: v4f32_one_step:			; HASWELL-NO-FMA-LABEL: v4f32_one_step:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vrcpps %xmm0, %xmm1			; HASWELL-NO-FMA-NEXT: vrcpps %xmm0, %xmm1
	; HASWELL-NO-FMA-NEXT: vmulps %xmm1, %xmm0, %xmm0			; HASWELL-NO-FMA-NEXT: vmulps %xmm1, %xmm0, %xmm0
	; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1]			; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1]
	; HASWELL-NO-FMA-NEXT: vsubps %xmm0, %xmm2, %xmm0			; HASWELL-NO-FMA-NEXT: vsubps %xmm0, %xmm2, %xmm0
	; HASWELL-NO-FMA-NEXT: vmulps %xmm0, %xmm1, %xmm0			; HASWELL-NO-FMA-NEXT: vmulps %xmm0, %xmm1, %xmm0
	; HASWELL-NO-FMA-NEXT: vaddps %xmm0, %xmm1, %xmm0			; HASWELL-NO-FMA-NEXT: vaddps %xmm0, %xmm1, %xmm0
	; HASWELL-NO-FMA-NEXT: retq			; HASWELL-NO-FMA-NEXT: retq
	;			;
	; KNL-LABEL: v4f32_one_step:			; KNL-LABEL: v4f32_one_step:
	; KNL: # BB#0:			; KNL: # BB#0:
	; KNL-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]			; KNL-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]
	; KNL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [4:0.50]			; KNL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [1:0.50]
	; KNL-NEXT: vfnmadd213ps %xmm2, %xmm1, %xmm0			; KNL-NEXT: vfnmadd213ps %xmm2, %xmm1, %xmm0 # sched: [5:0.50]
	; KNL-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm0			; KNL-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm0 # sched: [5:0.50]
	; KNL-NEXT: retq # sched: [1:1.00]			; KNL-NEXT: retq # sched: [2:1.00]
	;			;
	; SKX-LABEL: v4f32_one_step:			; SKX-LABEL: v4f32_one_step:
	; SKX: # BB#0:			; SKX: # BB#0:
	; SKX-NEXT: vrcp14ps %xmm0, %xmm1			; SKX-NEXT: vrcp14ps %xmm0, %xmm1
	; SKX-NEXT: vfnmadd213ps {{.*}}(%rip){1to4}, %xmm1, %xmm0			; SKX-NEXT: vfnmadd213ps {{.*}}(%rip){1to4}, %xmm1, %xmm0
	; SKX-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm0			; SKX-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm0 # sched: [5:0.50]
	; SKX-NEXT: retq # sched: [1:1.00]			; SKX-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast <4 x float> <float 1.0, float 1.0, float 1.0, float 1.0>, %x			%div = fdiv fast <4 x float> <float 1.0, float 1.0, float 1.0, float 1.0>, %x
	ret <4 x float> %div			ret <4 x float> %div
	}			}

	define <4 x float> @v4f32_two_step(<4 x float> %x) #2 {			define <4 x float> @v4f32_two_step(<4 x float> %x) #2 {
	; SSE-LABEL: v4f32_two_step:			; SSE-LABEL: v4f32_two_step:
	; SSE: # BB#0:			; SSE: # BB#0:
	; SSE-NEXT: rcpps %xmm0, %xmm2			; SSE-NEXT: rcpps %xmm0, %xmm2
	▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vsubps %xmm0, %xmm3, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vsubps %xmm0, %xmm3, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: v4f32_two_step:			; HASWELL-LABEL: v4f32_two_step:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]			; HASWELL-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]
	; HASWELL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [4:0.50]			; HASWELL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [1:0.50]
	; HASWELL-NEXT: vmovaps %xmm1, %xmm3 # sched: [1:1.00]			; HASWELL-NEXT: vmovaps %xmm1, %xmm3 # sched: [1:1.00]
	; HASWELL-NEXT: vfnmadd213ps %xmm2, %xmm0, %xmm3			; HASWELL-NEXT: vfnmadd213ps %xmm2, %xmm0, %xmm3 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm3			; HASWELL-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm3 # sched: [5:0.50]
	; HASWELL-NEXT: vfnmadd213ps %xmm2, %xmm3, %xmm0			; HASWELL-NEXT: vfnmadd213ps %xmm2, %xmm3, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ps %xmm3, %xmm3, %xmm0			; HASWELL-NEXT: vfmadd132ps %xmm3, %xmm3, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: v4f32_two_step:			; HASWELL-NO-FMA-LABEL: v4f32_two_step:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vrcpps %xmm0, %xmm1			; HASWELL-NO-FMA-NEXT: vrcpps %xmm0, %xmm1
	; HASWELL-NO-FMA-NEXT: vmulps %xmm1, %xmm0, %xmm2			; HASWELL-NO-FMA-NEXT: vmulps %xmm1, %xmm0, %xmm2
	; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} xmm3 = [1,1,1,1]			; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} xmm3 = [1,1,1,1]
	; HASWELL-NO-FMA-NEXT: vsubps %xmm2, %xmm3, %xmm2			; HASWELL-NO-FMA-NEXT: vsubps %xmm2, %xmm3, %xmm2
	; HASWELL-NO-FMA-NEXT: vmulps %xmm2, %xmm1, %xmm2			; HASWELL-NO-FMA-NEXT: vmulps %xmm2, %xmm1, %xmm2
	; HASWELL-NO-FMA-NEXT: vaddps %xmm2, %xmm1, %xmm1			; HASWELL-NO-FMA-NEXT: vaddps %xmm2, %xmm1, %xmm1
	; HASWELL-NO-FMA-NEXT: vmulps %xmm1, %xmm0, %xmm0			; HASWELL-NO-FMA-NEXT: vmulps %xmm1, %xmm0, %xmm0
	; HASWELL-NO-FMA-NEXT: vsubps %xmm0, %xmm3, %xmm0			; HASWELL-NO-FMA-NEXT: vsubps %xmm0, %xmm3, %xmm0
	; HASWELL-NO-FMA-NEXT: vmulps %xmm0, %xmm1, %xmm0			; HASWELL-NO-FMA-NEXT: vmulps %xmm0, %xmm1, %xmm0
	; HASWELL-NO-FMA-NEXT: vaddps %xmm0, %xmm1, %xmm0			; HASWELL-NO-FMA-NEXT: vaddps %xmm0, %xmm1, %xmm0
	; HASWELL-NO-FMA-NEXT: retq			; HASWELL-NO-FMA-NEXT: retq
	;			;
	; KNL-LABEL: v4f32_two_step:			; KNL-LABEL: v4f32_two_step:
	; KNL: # BB#0:			; KNL: # BB#0:
	; KNL-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]			; KNL-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]
	; KNL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [4:0.50]			; KNL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [1:0.50]
	; KNL-NEXT: vmovaps %xmm1, %xmm3 # sched: [1:1.00]			; KNL-NEXT: vmovaps %xmm1, %xmm3 # sched: [1:1.00]
	; KNL-NEXT: vfnmadd213ps %xmm2, %xmm0, %xmm3			; KNL-NEXT: vfnmadd213ps %xmm2, %xmm0, %xmm3 # sched: [5:0.50]
	; KNL-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm3			; KNL-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm3 # sched: [5:0.50]
	; KNL-NEXT: vfnmadd213ps %xmm2, %xmm3, %xmm0			; KNL-NEXT: vfnmadd213ps %xmm2, %xmm3, %xmm0 # sched: [5:0.50]
	; KNL-NEXT: vfmadd132ps %xmm3, %xmm3, %xmm0			; KNL-NEXT: vfmadd132ps %xmm3, %xmm3, %xmm0 # sched: [5:0.50]
	; KNL-NEXT: retq # sched: [1:1.00]			; KNL-NEXT: retq # sched: [2:1.00]
	;			;
	; SKX-LABEL: v4f32_two_step:			; SKX-LABEL: v4f32_two_step:
	; SKX: # BB#0:			; SKX: # BB#0:
	; SKX-NEXT: vrcp14ps %xmm0, %xmm1			; SKX-NEXT: vrcp14ps %xmm0, %xmm1
	; SKX-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [4:0.50]			; SKX-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [1:0.50]
	; SKX-NEXT: vmovaps %xmm1, %xmm3 # sched: [1:1.00]			; SKX-NEXT: vmovaps %xmm1, %xmm3 # sched: [1:1.00]
	; SKX-NEXT: vfnmadd213ps %xmm2, %xmm0, %xmm3			; SKX-NEXT: vfnmadd213ps %xmm2, %xmm0, %xmm3 # sched: [5:0.50]
	; SKX-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm3			; SKX-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm3 # sched: [5:0.50]
	; SKX-NEXT: vfnmadd213ps %xmm2, %xmm3, %xmm0			; SKX-NEXT: vfnmadd213ps %xmm2, %xmm3, %xmm0 # sched: [5:0.50]
	; SKX-NEXT: vfmadd132ps %xmm3, %xmm3, %xmm0			; SKX-NEXT: vfmadd132ps %xmm3, %xmm3, %xmm0 # sched: [5:0.50]
	; SKX-NEXT: retq # sched: [1:1.00]			; SKX-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast <4 x float> <float 1.0, float 1.0, float 1.0, float 1.0>, %x			%div = fdiv fast <4 x float> <float 1.0, float 1.0, float 1.0, float 1.0>, %x
	ret <4 x float> %div			ret <4 x float> %div
	}			}

	define <8 x float> @v8f32_no_estimate(<8 x float> %x) #0 {			define <8 x float> @v8f32_no_estimate(<8 x float> %x) #0 {
	; SSE-LABEL: v8f32_no_estimate:			; SSE-LABEL: v8f32_no_estimate:
	; SSE: # BB#0:			; SSE: # BB#0:
	; SSE-NEXT: movaps {{.*#+}} xmm2 = [1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00]			; SSE-NEXT: movaps {{.*#+}} xmm2 = [1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00]
	Show All 25 Lines
	; SANDY-LABEL: v8f32_no_estimate:			; SANDY-LABEL: v8f32_no_estimate:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovaps {{.*#+}} ymm1 = [1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00] sched: [7:0.50]			; SANDY-NEXT: vmovaps {{.*#+}} ymm1 = [1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00] sched: [7:0.50]
	; SANDY-NEXT: vdivps %ymm0, %ymm1, %ymm0 # sched: [29:2.00]			; SANDY-NEXT: vdivps %ymm0, %ymm1, %ymm0 # sched: [29:2.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: v8f32_no_estimate:			; HASWELL-LABEL: v8f32_no_estimate:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vbroadcastss {{.*#+}} ymm1 = [1,1,1,1,1,1,1,1] sched: [5:1.00]			; HASWELL-NEXT: vbroadcastss {{.*#+}} ymm1 = [1,1,1,1,1,1,1,1] sched: [1:0.50]
	; HASWELL-NEXT: vdivps %ymm0, %ymm1, %ymm0 # sched: [19:2.00]			; HASWELL-NEXT: vdivps %ymm0, %ymm1, %ymm0 # sched: [21:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: v8f32_no_estimate:			; HASWELL-NO-FMA-LABEL: v8f32_no_estimate:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} ymm1 = [1,1,1,1,1,1,1,1]			; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} ymm1 = [1,1,1,1,1,1,1,1]
	; HASWELL-NO-FMA-NEXT: vdivps %ymm0, %ymm1, %ymm0			; HASWELL-NO-FMA-NEXT: vdivps %ymm0, %ymm1, %ymm0
	; HASWELL-NO-FMA-NEXT: retq			; HASWELL-NO-FMA-NEXT: retq
	;			;
	; AVX512-LABEL: v8f32_no_estimate:			; AVX512-LABEL: v8f32_no_estimate:
	; AVX512: # BB#0:			; AVX512: # BB#0:
	; AVX512-NEXT: vbroadcastss {{.*#+}} ymm1 = [1,1,1,1,1,1,1,1] sched: [5:1.00]			; AVX512-NEXT: vbroadcastss {{.*#+}} ymm1 = [1,1,1,1,1,1,1,1] sched: [1:0.50]
	; AVX512-NEXT: vdivps %ymm0, %ymm1, %ymm0 # sched: [19:2.00]			; AVX512-NEXT: vdivps %ymm0, %ymm1, %ymm0 # sched: [21:2.00]
	; AVX512-NEXT: retq # sched: [1:1.00]			; AVX512-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast <8 x float> <float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0>, %x			%div = fdiv fast <8 x float> <float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0>, %x
	ret <8 x float> %div			ret <8 x float> %div
	}			}

	define <8 x float> @v8f32_one_step(<8 x float> %x) #1 {			define <8 x float> @v8f32_one_step(<8 x float> %x) #1 {
	; SSE-LABEL: v8f32_one_step:			; SSE-LABEL: v8f32_one_step:
	; SSE: # BB#0:			; SSE: # BB#0:
	; SSE-NEXT: rcpps %xmm0, %xmm4			; SSE-NEXT: rcpps %xmm0, %xmm4
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vmovaps {{.*#+}} ymm2 = [1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00] sched: [7:0.50]			; SANDY-NEXT: vmovaps {{.*#+}} ymm2 = [1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00,1.000000e+00] sched: [7:0.50]
	; SANDY-NEXT: vsubps %ymm0, %ymm2, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vsubps %ymm0, %ymm2, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:1.00]			; SANDY-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:1.00]
	; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: v8f32_one_step:			; HASWELL-LABEL: v8f32_one_step:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpps %ymm0, %ymm1 # sched: [7:2.00]			; HASWELL-NEXT: vrcpps %ymm0, %ymm1 # sched: [11:2.00]
	; HASWELL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [5:1.00]			; HASWELL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [1:0.50]
	; HASWELL-NEXT: vfnmadd213ps %ymm2, %ymm1, %ymm0			; HASWELL-NEXT: vfnmadd213ps %ymm2, %ymm1, %ymm0 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm0			; HASWELL-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: v8f32_one_step:			; HASWELL-NO-FMA-LABEL: v8f32_one_step:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vrcpps %ymm0, %ymm1			; HASWELL-NO-FMA-NEXT: vrcpps %ymm0, %ymm1
	; HASWELL-NO-FMA-NEXT: vmulps %ymm1, %ymm0, %ymm0			; HASWELL-NO-FMA-NEXT: vmulps %ymm1, %ymm0, %ymm0
	; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1]			; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1]
	; HASWELL-NO-FMA-NEXT: vsubps %ymm0, %ymm2, %ymm0			; HASWELL-NO-FMA-NEXT: vsubps %ymm0, %ymm2, %ymm0
	; HASWELL-NO-FMA-NEXT: vmulps %ymm0, %ymm1, %ymm0			; HASWELL-NO-FMA-NEXT: vmulps %ymm0, %ymm1, %ymm0
	; HASWELL-NO-FMA-NEXT: vaddps %ymm0, %ymm1, %ymm0			; HASWELL-NO-FMA-NEXT: vaddps %ymm0, %ymm1, %ymm0
	; HASWELL-NO-FMA-NEXT: retq			; HASWELL-NO-FMA-NEXT: retq
	;			;
	; KNL-LABEL: v8f32_one_step:			; KNL-LABEL: v8f32_one_step:
	; KNL: # BB#0:			; KNL: # BB#0:
	; KNL-NEXT: vrcpps %ymm0, %ymm1 # sched: [7:2.00]			; KNL-NEXT: vrcpps %ymm0, %ymm1 # sched: [11:2.00]
	; KNL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [5:1.00]			; KNL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [1:0.50]
	; KNL-NEXT: vfnmadd213ps %ymm2, %ymm1, %ymm0			; KNL-NEXT: vfnmadd213ps %ymm2, %ymm1, %ymm0 # sched: [5:0.50]
	; KNL-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm0			; KNL-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm0 # sched: [5:0.50]
	; KNL-NEXT: retq # sched: [1:1.00]			; KNL-NEXT: retq # sched: [2:1.00]
	;			;
	; SKX-LABEL: v8f32_one_step:			; SKX-LABEL: v8f32_one_step:
	; SKX: # BB#0:			; SKX: # BB#0:
	; SKX-NEXT: vrcp14ps %ymm0, %ymm1			; SKX-NEXT: vrcp14ps %ymm0, %ymm1
	; SKX-NEXT: vfnmadd213ps {{.*}}(%rip){1to8}, %ymm1, %ymm0			; SKX-NEXT: vfnmadd213ps {{.*}}(%rip){1to8}, %ymm1, %ymm0
	; SKX-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm0			; SKX-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm0 # sched: [5:0.50]
	; SKX-NEXT: retq # sched: [1:1.00]			; SKX-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast <8 x float> <float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0>, %x			%div = fdiv fast <8 x float> <float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0>, %x
	ret <8 x float> %div			ret <8 x float> %div
	}			}

	define <8 x float> @v8f32_two_step(<8 x float> %x) #2 {			define <8 x float> @v8f32_two_step(<8 x float> %x) #2 {
	; SSE-LABEL: v8f32_two_step:			; SSE-LABEL: v8f32_two_step:
	; SSE: # BB#0:			; SSE: # BB#0:
	; SSE-NEXT: movaps %xmm1, %xmm2			; SSE-NEXT: movaps %xmm1, %xmm2
	▲ Show 20 Lines • Show All 74 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vmulps %ymm1, %ymm0, %ymm0 # sched: [5:1.00]			; SANDY-NEXT: vmulps %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
	; SANDY-NEXT: vsubps %ymm0, %ymm3, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vsubps %ymm0, %ymm3, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:1.00]			; SANDY-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:1.00]
	; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: v8f32_two_step:			; HASWELL-LABEL: v8f32_two_step:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpps %ymm0, %ymm1 # sched: [7:2.00]			; HASWELL-NEXT: vrcpps %ymm0, %ymm1 # sched: [11:2.00]
	; HASWELL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [5:1.00]			; HASWELL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [1:0.50]
	; HASWELL-NEXT: vmovaps %ymm1, %ymm3 # sched: [1:1.00]			; HASWELL-NEXT: vmovaps %ymm1, %ymm3 # sched: [1:1.00]
	; HASWELL-NEXT: vfnmadd213ps %ymm2, %ymm0, %ymm3			; HASWELL-NEXT: vfnmadd213ps %ymm2, %ymm0, %ymm3 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm3			; HASWELL-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm3 # sched: [5:0.50]
	; HASWELL-NEXT: vfnmadd213ps %ymm2, %ymm3, %ymm0			; HASWELL-NEXT: vfnmadd213ps %ymm2, %ymm3, %ymm0 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ps %ymm3, %ymm3, %ymm0			; HASWELL-NEXT: vfmadd132ps %ymm3, %ymm3, %ymm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: v8f32_two_step:			; HASWELL-NO-FMA-LABEL: v8f32_two_step:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vrcpps %ymm0, %ymm1			; HASWELL-NO-FMA-NEXT: vrcpps %ymm0, %ymm1
	; HASWELL-NO-FMA-NEXT: vmulps %ymm1, %ymm0, %ymm2			; HASWELL-NO-FMA-NEXT: vmulps %ymm1, %ymm0, %ymm2
	; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} ymm3 = [1,1,1,1,1,1,1,1]			; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} ymm3 = [1,1,1,1,1,1,1,1]
	; HASWELL-NO-FMA-NEXT: vsubps %ymm2, %ymm3, %ymm2			; HASWELL-NO-FMA-NEXT: vsubps %ymm2, %ymm3, %ymm2
	; HASWELL-NO-FMA-NEXT: vmulps %ymm2, %ymm1, %ymm2			; HASWELL-NO-FMA-NEXT: vmulps %ymm2, %ymm1, %ymm2
	; HASWELL-NO-FMA-NEXT: vaddps %ymm2, %ymm1, %ymm1			; HASWELL-NO-FMA-NEXT: vaddps %ymm2, %ymm1, %ymm1
	; HASWELL-NO-FMA-NEXT: vmulps %ymm1, %ymm0, %ymm0			; HASWELL-NO-FMA-NEXT: vmulps %ymm1, %ymm0, %ymm0
	; HASWELL-NO-FMA-NEXT: vsubps %ymm0, %ymm3, %ymm0			; HASWELL-NO-FMA-NEXT: vsubps %ymm0, %ymm3, %ymm0
	; HASWELL-NO-FMA-NEXT: vmulps %ymm0, %ymm1, %ymm0			; HASWELL-NO-FMA-NEXT: vmulps %ymm0, %ymm1, %ymm0
	; HASWELL-NO-FMA-NEXT: vaddps %ymm0, %ymm1, %ymm0			; HASWELL-NO-FMA-NEXT: vaddps %ymm0, %ymm1, %ymm0
	; HASWELL-NO-FMA-NEXT: retq			; HASWELL-NO-FMA-NEXT: retq
	;			;
	; KNL-LABEL: v8f32_two_step:			; KNL-LABEL: v8f32_two_step:
	; KNL: # BB#0:			; KNL: # BB#0:
	; KNL-NEXT: vrcpps %ymm0, %ymm1 # sched: [7:2.00]			; KNL-NEXT: vrcpps %ymm0, %ymm1 # sched: [11:2.00]
	; KNL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [5:1.00]			; KNL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [1:0.50]
	; KNL-NEXT: vmovaps %ymm1, %ymm3 # sched: [1:1.00]			; KNL-NEXT: vmovaps %ymm1, %ymm3 # sched: [1:1.00]
	; KNL-NEXT: vfnmadd213ps %ymm2, %ymm0, %ymm3			; KNL-NEXT: vfnmadd213ps %ymm2, %ymm0, %ymm3 # sched: [5:0.50]
	; KNL-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm3			; KNL-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm3 # sched: [5:0.50]
	; KNL-NEXT: vfnmadd213ps %ymm2, %ymm3, %ymm0			; KNL-NEXT: vfnmadd213ps %ymm2, %ymm3, %ymm0 # sched: [5:0.50]
	; KNL-NEXT: vfmadd132ps %ymm3, %ymm3, %ymm0			; KNL-NEXT: vfmadd132ps %ymm3, %ymm3, %ymm0 # sched: [5:0.50]
	; KNL-NEXT: retq # sched: [1:1.00]			; KNL-NEXT: retq # sched: [2:1.00]
	;			;
	; SKX-LABEL: v8f32_two_step:			; SKX-LABEL: v8f32_two_step:
	; SKX: # BB#0:			; SKX: # BB#0:
	; SKX-NEXT: vrcp14ps %ymm0, %ymm1			; SKX-NEXT: vrcp14ps %ymm0, %ymm1
	; SKX-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [5:1.00]			; SKX-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [1:0.50]
	; SKX-NEXT: vmovaps %ymm1, %ymm3 # sched: [1:1.00]			; SKX-NEXT: vmovaps %ymm1, %ymm3 # sched: [1:1.00]
	; SKX-NEXT: vfnmadd213ps %ymm2, %ymm0, %ymm3			; SKX-NEXT: vfnmadd213ps %ymm2, %ymm0, %ymm3 # sched: [5:0.50]
	; SKX-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm3			; SKX-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm3 # sched: [5:0.50]
	; SKX-NEXT: vfnmadd213ps %ymm2, %ymm3, %ymm0			; SKX-NEXT: vfnmadd213ps %ymm2, %ymm3, %ymm0 # sched: [5:0.50]
	; SKX-NEXT: vfmadd132ps %ymm3, %ymm3, %ymm0			; SKX-NEXT: vfmadd132ps %ymm3, %ymm3, %ymm0 # sched: [5:0.50]
	; SKX-NEXT: retq # sched: [1:1.00]			; SKX-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast <8 x float> <float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0>, %x			%div = fdiv fast <8 x float> <float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0>, %x
	ret <8 x float> %div			ret <8 x float> %div
	}			}

	attributes #0 = { "unsafe-fp-math"="true" "reciprocal-estimates"="!divf,!vec-divf" }			attributes #0 = { "unsafe-fp-math"="true" "reciprocal-estimates"="!divf,!vec-divf" }
	attributes #1 = { "unsafe-fp-math"="true" "reciprocal-estimates"="divf,vec-divf" }			attributes #1 = { "unsafe-fp-math"="true" "reciprocal-estimates"="divf,vec-divf" }
	attributes #2 = { "unsafe-fp-math"="true" "reciprocal-estimates"="divf:2,vec-divf:2" }			attributes #2 = { "unsafe-fp-math"="true" "reciprocal-estimates"="divf:2,vec-divf:2" }

test/CodeGen/X86/recip-fastmath2.ll

	Show All 39 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vrcpss %xmm0, %xmm0, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vrcpss %xmm0, %xmm0, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [11:1.00]			; SANDY-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [11:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: f32_no_step_2:			; HASWELL-LABEL: f32_no_step_2:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpss %xmm0, %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vrcpss %xmm0, %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [9:0.50]			; HASWELL-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: f32_no_step_2:			; HASWELL-NO-FMA-LABEL: f32_no_step_2:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vrcpss %xmm0, %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NO-FMA-NEXT: vrcpss %xmm0, %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NO-FMA-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [9:0.50]			; HASWELL-NO-FMA-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: retq # sched: [1:1.00]			; HASWELL-NO-FMA-NEXT: retq # sched: [2:1.00]
	;			;
	; AVX512-LABEL: f32_no_step_2:			; AVX512-LABEL: f32_no_step_2:
	; AVX512: # BB#0:			; AVX512: # BB#0:
	; AVX512-NEXT: vrcp14ss %xmm0, %xmm0, %xmm0			; AVX512-NEXT: vrcp14ss %xmm0, %xmm0, %xmm0
	; AVX512-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [9:0.50]			; AVX512-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [5:0.50]
	; AVX512-NEXT: retq # sched: [1:1.00]			; AVX512-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast float 1234.0, %x			%div = fdiv fast float 1234.0, %x
	ret float %div			ret float %div
	}			}

	define float @f32_one_step_2(float %x) #1 {			define float @f32_one_step_2(float %x) #1 {
	; SSE-LABEL: f32_one_step_2:			; SSE-LABEL: f32_one_step_2:
	; SSE: # BB#0:			; SSE: # BB#0:
	; SSE-NEXT: rcpss %xmm0, %xmm2			; SSE-NEXT: rcpss %xmm0, %xmm2
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: vaddss %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddss %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [11:1.00]			; SANDY-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [11:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: f32_one_step_2:			; HASWELL-LABEL: f32_one_step_2:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpss %xmm0, %xmm0, %xmm1 # sched: [5:1.00]			; HASWELL-NEXT: vrcpss %xmm0, %xmm0, %xmm1 # sched: [5:1.00]
	; HASWELL-NEXT: vfnmadd213ss {{.*}}(%rip), %xmm1, %xmm0			; HASWELL-NEXT: vfnmadd213ss {{.*}}(%rip), %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ss %xmm1, %xmm1, %xmm0			; HASWELL-NEXT: vfmadd132ss %xmm1, %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [9:0.50]			; HASWELL-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: f32_one_step_2:			; HASWELL-NO-FMA-LABEL: f32_one_step_2:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vrcpss %xmm0, %xmm0, %xmm1 # sched: [5:1.00]			; HASWELL-NO-FMA-NEXT: vrcpss %xmm0, %xmm0, %xmm1 # sched: [5:1.00]
	; HASWELL-NO-FMA-NEXT: vmulss %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NO-FMA-NEXT: vmulss %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vmovss {{.*#+}} xmm2 = mem[0],zero,zero,zero sched: [4:0.50]			; HASWELL-NO-FMA-NEXT: vmovss {{.*#+}} xmm2 = mem[0],zero,zero,zero sched: [1:0.50]
	; HASWELL-NO-FMA-NEXT: vsubss %xmm0, %xmm2, %xmm0 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vsubss %xmm0, %xmm2, %xmm0 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:0.50]			; HASWELL-NO-FMA-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vaddss %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vaddss %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [9:0.50]			; HASWELL-NO-FMA-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: retq # sched: [1:1.00]			; HASWELL-NO-FMA-NEXT: retq # sched: [2:1.00]
	;			;
	; AVX512-LABEL: f32_one_step_2:			; AVX512-LABEL: f32_one_step_2:
	; AVX512: # BB#0:			; AVX512: # BB#0:
	; AVX512-NEXT: vrcp14ss %xmm0, %xmm0, %xmm1			; AVX512-NEXT: vrcp14ss %xmm0, %xmm0, %xmm1
	; AVX512-NEXT: vfnmadd213ss {{.*}}(%rip), %xmm1, %xmm0			; AVX512-NEXT: vfnmadd213ss {{.*}}(%rip), %xmm1, %xmm0 # sched: [5:0.50]
	; AVX512-NEXT: vfmadd132ss %xmm1, %xmm1, %xmm0			; AVX512-NEXT: vfmadd132ss %xmm1, %xmm1, %xmm0 # sched: [5:0.50]
	; AVX512-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [9:0.50]			; AVX512-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [5:0.50]
	; AVX512-NEXT: retq # sched: [1:1.00]			; AVX512-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast float 3456.0, %x			%div = fdiv fast float 3456.0, %x
	ret float %div			ret float %div
	}			}

	define float @f32_one_step_2_divs(float %x) #1 {			define float @f32_one_step_2_divs(float %x) #1 {
	; SSE-LABEL: f32_one_step_2_divs:			; SSE-LABEL: f32_one_step_2_divs:
	; SSE: # BB#0:			; SSE: # BB#0:
	; SSE-NEXT: rcpss %xmm0, %xmm1			; SSE-NEXT: rcpss %xmm0, %xmm1
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vaddss %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddss %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm1 # sched: [11:1.00]			; SANDY-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm1 # sched: [11:1.00]
	; SANDY-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: f32_one_step_2_divs:			; HASWELL-LABEL: f32_one_step_2_divs:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpss %xmm0, %xmm0, %xmm1 # sched: [5:1.00]			; HASWELL-NEXT: vrcpss %xmm0, %xmm0, %xmm1 # sched: [5:1.00]
	; HASWELL-NEXT: vfnmadd213ss {{.*}}(%rip), %xmm1, %xmm0			; HASWELL-NEXT: vfnmadd213ss {{.*}}(%rip), %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ss %xmm1, %xmm1, %xmm0			; HASWELL-NEXT: vfmadd132ss %xmm1, %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm1 # sched: [9:0.50]			; HASWELL-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm1 # sched: [5:0.50]
	; HASWELL-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: f32_one_step_2_divs:			; HASWELL-NO-FMA-LABEL: f32_one_step_2_divs:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vrcpss %xmm0, %xmm0, %xmm1 # sched: [5:1.00]			; HASWELL-NO-FMA-NEXT: vrcpss %xmm0, %xmm0, %xmm1 # sched: [5:1.00]
	; HASWELL-NO-FMA-NEXT: vmulss %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NO-FMA-NEXT: vmulss %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vmovss {{.*#+}} xmm2 = mem[0],zero,zero,zero sched: [4:0.50]			; HASWELL-NO-FMA-NEXT: vmovss {{.*#+}} xmm2 = mem[0],zero,zero,zero sched: [1:0.50]
	; HASWELL-NO-FMA-NEXT: vsubss %xmm0, %xmm2, %xmm0 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vsubss %xmm0, %xmm2, %xmm0 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:0.50]			; HASWELL-NO-FMA-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vaddss %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vaddss %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm1 # sched: [9:0.50]			; HASWELL-NO-FMA-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm1 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:0.50]			; HASWELL-NO-FMA-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: retq # sched: [1:1.00]			; HASWELL-NO-FMA-NEXT: retq # sched: [2:1.00]
	;			;
	; AVX512-LABEL: f32_one_step_2_divs:			; AVX512-LABEL: f32_one_step_2_divs:
	; AVX512: # BB#0:			; AVX512: # BB#0:
	; AVX512-NEXT: vrcp14ss %xmm0, %xmm0, %xmm1			; AVX512-NEXT: vrcp14ss %xmm0, %xmm0, %xmm1
	; AVX512-NEXT: vfnmadd213ss {{.*}}(%rip), %xmm1, %xmm0			; AVX512-NEXT: vfnmadd213ss {{.*}}(%rip), %xmm1, %xmm0 # sched: [5:0.50]
	; AVX512-NEXT: vfmadd132ss %xmm1, %xmm1, %xmm0			; AVX512-NEXT: vfmadd132ss %xmm1, %xmm1, %xmm0 # sched: [5:0.50]
	; AVX512-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm1 # sched: [9:0.50]			; AVX512-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm1 # sched: [5:0.50]
	; AVX512-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:0.50]			; AVX512-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:0.50]
	; AVX512-NEXT: retq # sched: [1:1.00]			; AVX512-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast float 3456.0, %x			%div = fdiv fast float 3456.0, %x
	%div2 = fdiv fast float %div, %x			%div2 = fdiv fast float %div, %x
	ret float %div2			ret float %div2
	}			}

	define float @f32_two_step_2(float %x) #2 {			define float @f32_two_step_2(float %x) #2 {
	; SSE-LABEL: f32_two_step_2:			; SSE-LABEL: f32_two_step_2:
	; SSE: # BB#0:			; SSE: # BB#0:
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: vaddss %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddss %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [11:1.00]			; SANDY-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [11:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: f32_two_step_2:			; HASWELL-LABEL: f32_two_step_2:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpss %xmm0, %xmm0, %xmm1 # sched: [5:1.00]			; HASWELL-NEXT: vrcpss %xmm0, %xmm0, %xmm1 # sched: [5:1.00]
	; HASWELL-NEXT: vmovss {{.*#+}} xmm2 = mem[0],zero,zero,zero sched: [4:0.50]			; HASWELL-NEXT: vmovss {{.*#+}} xmm2 = mem[0],zero,zero,zero sched: [1:0.50]
	; HASWELL-NEXT: vmovaps %xmm1, %xmm3 # sched: [1:1.00]			; HASWELL-NEXT: vmovaps %xmm1, %xmm3 # sched: [1:1.00]
	; HASWELL-NEXT: vfnmadd213ss %xmm2, %xmm0, %xmm3			; HASWELL-NEXT: vfnmadd213ss %xmm2, %xmm0, %xmm3 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ss %xmm1, %xmm1, %xmm3			; HASWELL-NEXT: vfmadd132ss %xmm1, %xmm1, %xmm3 # sched: [5:0.50]
	; HASWELL-NEXT: vfnmadd213ss %xmm2, %xmm3, %xmm0			; HASWELL-NEXT: vfnmadd213ss %xmm2, %xmm3, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ss %xmm3, %xmm3, %xmm0			; HASWELL-NEXT: vfmadd132ss %xmm3, %xmm3, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [9:0.50]			; HASWELL-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: f32_two_step_2:			; HASWELL-NO-FMA-LABEL: f32_two_step_2:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vrcpss %xmm0, %xmm0, %xmm1 # sched: [5:1.00]			; HASWELL-NO-FMA-NEXT: vrcpss %xmm0, %xmm0, %xmm1 # sched: [5:1.00]
	; HASWELL-NO-FMA-NEXT: vmulss %xmm1, %xmm0, %xmm2 # sched: [5:0.50]			; HASWELL-NO-FMA-NEXT: vmulss %xmm1, %xmm0, %xmm2 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vmovss {{.*#+}} xmm3 = mem[0],zero,zero,zero sched: [4:0.50]			; HASWELL-NO-FMA-NEXT: vmovss {{.*#+}} xmm3 = mem[0],zero,zero,zero sched: [1:0.50]
	; HASWELL-NO-FMA-NEXT: vsubss %xmm2, %xmm3, %xmm2 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vsubss %xmm2, %xmm3, %xmm2 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulss %xmm2, %xmm1, %xmm2 # sched: [5:0.50]			; HASWELL-NO-FMA-NEXT: vmulss %xmm2, %xmm1, %xmm2 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vaddss %xmm2, %xmm1, %xmm1 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vaddss %xmm2, %xmm1, %xmm1 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulss %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NO-FMA-NEXT: vmulss %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vsubss %xmm0, %xmm3, %xmm0 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vsubss %xmm0, %xmm3, %xmm0 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:0.50]			; HASWELL-NO-FMA-NEXT: vmulss %xmm0, %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vaddss %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vaddss %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [9:0.50]			; HASWELL-NO-FMA-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: retq # sched: [1:1.00]			; HASWELL-NO-FMA-NEXT: retq # sched: [2:1.00]
	;			;
	; AVX512-LABEL: f32_two_step_2:			; AVX512-LABEL: f32_two_step_2:
	; AVX512: # BB#0:			; AVX512: # BB#0:
	; AVX512-NEXT: vrcp14ss %xmm0, %xmm0, %xmm1			; AVX512-NEXT: vrcp14ss %xmm0, %xmm0, %xmm1
	; AVX512-NEXT: vmovss {{.*#+}} xmm2 = mem[0],zero,zero,zero sched: [4:0.50]			; AVX512-NEXT: vmovss {{.*#+}} xmm2 = mem[0],zero,zero,zero sched: [1:0.50]
	; AVX512-NEXT: vmovaps %xmm1, %xmm3 # sched: [1:1.00]			; AVX512-NEXT: vmovaps %xmm1, %xmm3 # sched: [1:1.00]
	; AVX512-NEXT: vfnmadd213ss %xmm2, %xmm0, %xmm3			; AVX512-NEXT: vfnmadd213ss %xmm2, %xmm0, %xmm3 # sched: [5:0.50]
	; AVX512-NEXT: vfmadd132ss %xmm1, %xmm1, %xmm3			; AVX512-NEXT: vfmadd132ss %xmm1, %xmm1, %xmm3 # sched: [5:0.50]
	; AVX512-NEXT: vfnmadd213ss %xmm2, %xmm3, %xmm0			; AVX512-NEXT: vfnmadd213ss %xmm2, %xmm3, %xmm0 # sched: [5:0.50]
	; AVX512-NEXT: vfmadd132ss %xmm3, %xmm3, %xmm0			; AVX512-NEXT: vfmadd132ss %xmm3, %xmm3, %xmm0 # sched: [5:0.50]
	; AVX512-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [9:0.50]			; AVX512-NEXT: vmulss {{.*}}(%rip), %xmm0, %xmm0 # sched: [5:0.50]
	; AVX512-NEXT: retq # sched: [1:1.00]			; AVX512-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast float 6789.0, %x			%div = fdiv fast float 6789.0, %x
	ret float %div			ret float %div
	}			}

	define <4 x float> @v4f32_one_step2(<4 x float> %x) #1 {			define <4 x float> @v4f32_one_step2(<4 x float> %x) #1 {
	; SSE-LABEL: v4f32_one_step2:			; SSE-LABEL: v4f32_one_step2:
	; SSE: # BB#0:			; SSE: # BB#0:
	; SSE-NEXT: rcpps %xmm0, %xmm2			; SSE-NEXT: rcpps %xmm0, %xmm2
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm0 # sched: [11:1.00]			; SANDY-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm0 # sched: [11:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: v4f32_one_step2:			; HASWELL-LABEL: v4f32_one_step2:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]			; HASWELL-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]
	; HASWELL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [4:0.50]			; HASWELL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [1:0.50]
	; HASWELL-NEXT: vfnmadd213ps %xmm2, %xmm1, %xmm0			; HASWELL-NEXT: vfnmadd213ps %xmm2, %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm0			; HASWELL-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm0 # sched: [9:0.50]			; HASWELL-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: v4f32_one_step2:			; HASWELL-NO-FMA-LABEL: v4f32_one_step2:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]			; HASWELL-NO-FMA-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]
	; HASWELL-NO-FMA-NEXT: vmulps %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NO-FMA-NEXT: vmulps %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [4:0.50]			; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [1:0.50]
	; HASWELL-NO-FMA-NEXT: vsubps %xmm0, %xmm2, %xmm0 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vsubps %xmm0, %xmm2, %xmm0 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:0.50]			; HASWELL-NO-FMA-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm0 # sched: [9:0.50]			; HASWELL-NO-FMA-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: retq # sched: [1:1.00]			; HASWELL-NO-FMA-NEXT: retq # sched: [2:1.00]
	;			;
	; KNL-LABEL: v4f32_one_step2:			; KNL-LABEL: v4f32_one_step2:
	; KNL: # BB#0:			; KNL: # BB#0:
	; KNL-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]			; KNL-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]
	; KNL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [4:0.50]			; KNL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [1:0.50]
	; KNL-NEXT: vfnmadd213ps %xmm2, %xmm1, %xmm0			; KNL-NEXT: vfnmadd213ps %xmm2, %xmm1, %xmm0 # sched: [5:0.50]
	; KNL-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm0			; KNL-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm0 # sched: [5:0.50]
	; KNL-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm0 # sched: [9:0.50]			; KNL-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm0 # sched: [5:0.50]
	; KNL-NEXT: retq # sched: [1:1.00]			; KNL-NEXT: retq # sched: [2:1.00]
	;			;
	; SKX-LABEL: v4f32_one_step2:			; SKX-LABEL: v4f32_one_step2:
	; SKX: # BB#0:			; SKX: # BB#0:
	; SKX-NEXT: vrcp14ps %xmm0, %xmm1			; SKX-NEXT: vrcp14ps %xmm0, %xmm1
	; SKX-NEXT: vfnmadd213ps {{.*}}(%rip){1to4}, %xmm1, %xmm0			; SKX-NEXT: vfnmadd213ps {{.*}}(%rip){1to4}, %xmm1, %xmm0
	; SKX-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm0			; SKX-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm0 # sched: [5:0.50]
	; SKX-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm0 # sched: [9:0.50]			; SKX-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm0 # sched: [5:0.50]
	; SKX-NEXT: retq # sched: [1:1.00]			; SKX-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast <4 x float> <float 1.0, float 2.0, float 3.0, float 4.0>, %x			%div = fdiv fast <4 x float> <float 1.0, float 2.0, float 3.0, float 4.0>, %x
	ret <4 x float> %div			ret <4 x float> %div
	}			}

	define <4 x float> @v4f32_one_step_2_divs(<4 x float> %x) #1 {			define <4 x float> @v4f32_one_step_2_divs(<4 x float> %x) #1 {
	; SSE-LABEL: v4f32_one_step_2_divs:			; SSE-LABEL: v4f32_one_step_2_divs:
	; SSE: # BB#0:			; SSE: # BB#0:
	; SSE-NEXT: rcpps %xmm0, %xmm1			; SSE-NEXT: rcpps %xmm0, %xmm1
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm1 # sched: [11:1.00]			; SANDY-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm1 # sched: [11:1.00]
	; SANDY-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: v4f32_one_step_2_divs:			; HASWELL-LABEL: v4f32_one_step_2_divs:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]			; HASWELL-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]
	; HASWELL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [4:0.50]			; HASWELL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [1:0.50]
	; HASWELL-NEXT: vfnmadd213ps %xmm2, %xmm1, %xmm0			; HASWELL-NEXT: vfnmadd213ps %xmm2, %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm0			; HASWELL-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm1 # sched: [9:0.50]			; HASWELL-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm1 # sched: [5:0.50]
	; HASWELL-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: v4f32_one_step_2_divs:			; HASWELL-NO-FMA-LABEL: v4f32_one_step_2_divs:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]			; HASWELL-NO-FMA-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]
	; HASWELL-NO-FMA-NEXT: vmulps %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NO-FMA-NEXT: vmulps %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [4:0.50]			; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [1:0.50]
	; HASWELL-NO-FMA-NEXT: vsubps %xmm0, %xmm2, %xmm0 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vsubps %xmm0, %xmm2, %xmm0 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:0.50]			; HASWELL-NO-FMA-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm1 # sched: [9:0.50]			; HASWELL-NO-FMA-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm1 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:0.50]			; HASWELL-NO-FMA-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: retq # sched: [1:1.00]			; HASWELL-NO-FMA-NEXT: retq # sched: [2:1.00]
	;			;
	; KNL-LABEL: v4f32_one_step_2_divs:			; KNL-LABEL: v4f32_one_step_2_divs:
	; KNL: # BB#0:			; KNL: # BB#0:
	; KNL-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]			; KNL-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]
	; KNL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [4:0.50]			; KNL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [1:0.50]
	; KNL-NEXT: vfnmadd213ps %xmm2, %xmm1, %xmm0			; KNL-NEXT: vfnmadd213ps %xmm2, %xmm1, %xmm0 # sched: [5:0.50]
	; KNL-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm0			; KNL-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm0 # sched: [5:0.50]
	; KNL-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm1 # sched: [9:0.50]			; KNL-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm1 # sched: [5:0.50]
	; KNL-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:0.50]			; KNL-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:0.50]
	; KNL-NEXT: retq # sched: [1:1.00]			; KNL-NEXT: retq # sched: [2:1.00]
	;			;
	; SKX-LABEL: v4f32_one_step_2_divs:			; SKX-LABEL: v4f32_one_step_2_divs:
	; SKX: # BB#0:			; SKX: # BB#0:
	; SKX-NEXT: vrcp14ps %xmm0, %xmm1			; SKX-NEXT: vrcp14ps %xmm0, %xmm1
	; SKX-NEXT: vfnmadd213ps {{.*}}(%rip){1to4}, %xmm1, %xmm0			; SKX-NEXT: vfnmadd213ps {{.*}}(%rip){1to4}, %xmm1, %xmm0
	; SKX-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm0			; SKX-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm0 # sched: [5:0.50]
	; SKX-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm1 # sched: [9:0.50]			; SKX-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm1 # sched: [5:0.50]
	; SKX-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:0.50]			; SKX-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:0.50]
	; SKX-NEXT: retq # sched: [1:1.00]			; SKX-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast <4 x float> <float 1.0, float 2.0, float 3.0, float 4.0>, %x			%div = fdiv fast <4 x float> <float 1.0, float 2.0, float 3.0, float 4.0>, %x
	%div2 = fdiv fast <4 x float> %div, %x			%div2 = fdiv fast <4 x float> %div, %x
	ret <4 x float> %div2			ret <4 x float> %div2
	}			}

	define <4 x float> @v4f32_two_step2(<4 x float> %x) #2 {			define <4 x float> @v4f32_two_step2(<4 x float> %x) #2 {
	; SSE-LABEL: v4f32_two_step2:			; SSE-LABEL: v4f32_two_step2:
	; SSE: # BB#0:			; SSE: # BB#0:
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm0 # sched: [11:1.00]			; SANDY-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm0 # sched: [11:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: v4f32_two_step2:			; HASWELL-LABEL: v4f32_two_step2:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]			; HASWELL-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]
	; HASWELL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [4:0.50]			; HASWELL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [1:0.50]
	; HASWELL-NEXT: vmovaps %xmm1, %xmm3 # sched: [1:1.00]			; HASWELL-NEXT: vmovaps %xmm1, %xmm3 # sched: [1:1.00]
	; HASWELL-NEXT: vfnmadd213ps %xmm2, %xmm0, %xmm3			; HASWELL-NEXT: vfnmadd213ps %xmm2, %xmm0, %xmm3 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm3			; HASWELL-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm3 # sched: [5:0.50]
	; HASWELL-NEXT: vfnmadd213ps %xmm2, %xmm3, %xmm0			; HASWELL-NEXT: vfnmadd213ps %xmm2, %xmm3, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ps %xmm3, %xmm3, %xmm0			; HASWELL-NEXT: vfmadd132ps %xmm3, %xmm3, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm0 # sched: [9:0.50]			; HASWELL-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: v4f32_two_step2:			; HASWELL-NO-FMA-LABEL: v4f32_two_step2:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]			; HASWELL-NO-FMA-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]
	; HASWELL-NO-FMA-NEXT: vmulps %xmm1, %xmm0, %xmm2 # sched: [5:0.50]			; HASWELL-NO-FMA-NEXT: vmulps %xmm1, %xmm0, %xmm2 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} xmm3 = [1,1,1,1] sched: [4:0.50]			; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} xmm3 = [1,1,1,1] sched: [1:0.50]
	; HASWELL-NO-FMA-NEXT: vsubps %xmm2, %xmm3, %xmm2 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vsubps %xmm2, %xmm3, %xmm2 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulps %xmm2, %xmm1, %xmm2 # sched: [5:0.50]			; HASWELL-NO-FMA-NEXT: vmulps %xmm2, %xmm1, %xmm2 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vaddps %xmm2, %xmm1, %xmm1 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vaddps %xmm2, %xmm1, %xmm1 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulps %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NO-FMA-NEXT: vmulps %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vsubps %xmm0, %xmm3, %xmm0 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vsubps %xmm0, %xmm3, %xmm0 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:0.50]			; HASWELL-NO-FMA-NEXT: vmulps %xmm0, %xmm1, %xmm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm0 # sched: [9:0.50]			; HASWELL-NO-FMA-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: retq # sched: [1:1.00]			; HASWELL-NO-FMA-NEXT: retq # sched: [2:1.00]
	;			;
	; KNL-LABEL: v4f32_two_step2:			; KNL-LABEL: v4f32_two_step2:
	; KNL: # BB#0:			; KNL: # BB#0:
	; KNL-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]			; KNL-NEXT: vrcpps %xmm0, %xmm1 # sched: [5:1.00]
	; KNL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [4:0.50]			; KNL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [1:0.50]
	; KNL-NEXT: vmovaps %xmm1, %xmm3 # sched: [1:1.00]			; KNL-NEXT: vmovaps %xmm1, %xmm3 # sched: [1:1.00]
	; KNL-NEXT: vfnmadd213ps %xmm2, %xmm0, %xmm3			; KNL-NEXT: vfnmadd213ps %xmm2, %xmm0, %xmm3 # sched: [5:0.50]
	; KNL-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm3			; KNL-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm3 # sched: [5:0.50]
	; KNL-NEXT: vfnmadd213ps %xmm2, %xmm3, %xmm0			; KNL-NEXT: vfnmadd213ps %xmm2, %xmm3, %xmm0 # sched: [5:0.50]
	; KNL-NEXT: vfmadd132ps %xmm3, %xmm3, %xmm0			; KNL-NEXT: vfmadd132ps %xmm3, %xmm3, %xmm0 # sched: [5:0.50]
	; KNL-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm0 # sched: [9:0.50]			; KNL-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm0 # sched: [5:0.50]
	; KNL-NEXT: retq # sched: [1:1.00]			; KNL-NEXT: retq # sched: [2:1.00]
	;			;
	; SKX-LABEL: v4f32_two_step2:			; SKX-LABEL: v4f32_two_step2:
	; SKX: # BB#0:			; SKX: # BB#0:
	; SKX-NEXT: vrcp14ps %xmm0, %xmm1			; SKX-NEXT: vrcp14ps %xmm0, %xmm1
	; SKX-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [4:0.50]			; SKX-NEXT: vbroadcastss {{.*#+}} xmm2 = [1,1,1,1] sched: [1:0.50]
	; SKX-NEXT: vmovaps %xmm1, %xmm3 # sched: [1:1.00]			; SKX-NEXT: vmovaps %xmm1, %xmm3 # sched: [1:1.00]
	; SKX-NEXT: vfnmadd213ps %xmm2, %xmm0, %xmm3			; SKX-NEXT: vfnmadd213ps %xmm2, %xmm0, %xmm3 # sched: [5:0.50]
	; SKX-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm3			; SKX-NEXT: vfmadd132ps %xmm1, %xmm1, %xmm3 # sched: [5:0.50]
	; SKX-NEXT: vfnmadd213ps %xmm2, %xmm3, %xmm0			; SKX-NEXT: vfnmadd213ps %xmm2, %xmm3, %xmm0 # sched: [5:0.50]
	; SKX-NEXT: vfmadd132ps %xmm3, %xmm3, %xmm0			; SKX-NEXT: vfmadd132ps %xmm3, %xmm3, %xmm0 # sched: [5:0.50]
	; SKX-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm0 # sched: [9:0.50]			; SKX-NEXT: vmulps {{.*}}(%rip), %xmm0, %xmm0 # sched: [5:0.50]
	; SKX-NEXT: retq # sched: [1:1.00]			; SKX-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast <4 x float> <float 1.0, float 2.0, float 3.0, float 4.0>, %x			%div = fdiv fast <4 x float> <float 1.0, float 2.0, float 3.0, float 4.0>, %x
	ret <4 x float> %div			ret <4 x float> %div
	}			}

	define <8 x float> @v8f32_one_step2(<8 x float> %x) #1 {			define <8 x float> @v8f32_one_step2(<8 x float> %x) #1 {
	; SSE-LABEL: v8f32_one_step2:			; SSE-LABEL: v8f32_one_step2:
	; SSE: # BB#0:			; SSE: # BB#0:
	; SSE-NEXT: rcpps %xmm1, %xmm4			; SSE-NEXT: rcpps %xmm1, %xmm4
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vsubps %ymm0, %ymm2, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vsubps %ymm0, %ymm2, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:1.00]			; SANDY-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:1.00]
	; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [12:1.00]			; SANDY-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [12:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: v8f32_one_step2:			; HASWELL-LABEL: v8f32_one_step2:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpps %ymm0, %ymm1 # sched: [7:2.00]			; HASWELL-NEXT: vrcpps %ymm0, %ymm1 # sched: [11:2.00]
	; HASWELL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [5:1.00]			; HASWELL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [1:0.50]
	; HASWELL-NEXT: vfnmadd213ps %ymm2, %ymm1, %ymm0			; HASWELL-NEXT: vfnmadd213ps %ymm2, %ymm1, %ymm0 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm0			; HASWELL-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm0 # sched: [5:0.50]
	; HASWELL-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [9:1.00]			; HASWELL-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: v8f32_one_step2:			; HASWELL-NO-FMA-LABEL: v8f32_one_step2:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vrcpps %ymm0, %ymm1 # sched: [7:2.00]			; HASWELL-NO-FMA-NEXT: vrcpps %ymm0, %ymm1 # sched: [11:2.00]
	; HASWELL-NO-FMA-NEXT: vmulps %ymm1, %ymm0, %ymm0 # sched: [5:1.00]			; HASWELL-NO-FMA-NEXT: vmulps %ymm1, %ymm0, %ymm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [5:1.00]			; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [1:0.50]
	; HASWELL-NO-FMA-NEXT: vsubps %ymm0, %ymm2, %ymm0 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vsubps %ymm0, %ymm2, %ymm0 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:1.00]			; HASWELL-NO-FMA-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [9:1.00]			; HASWELL-NO-FMA-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: retq # sched: [1:1.00]			; HASWELL-NO-FMA-NEXT: retq # sched: [2:1.00]
	;			;
	; KNL-LABEL: v8f32_one_step2:			; KNL-LABEL: v8f32_one_step2:
	; KNL: # BB#0:			; KNL: # BB#0:
	; KNL-NEXT: vrcpps %ymm0, %ymm1 # sched: [7:2.00]			; KNL-NEXT: vrcpps %ymm0, %ymm1 # sched: [11:2.00]
	; KNL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [5:1.00]			; KNL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [1:0.50]
	; KNL-NEXT: vfnmadd213ps %ymm2, %ymm1, %ymm0			; KNL-NEXT: vfnmadd213ps %ymm2, %ymm1, %ymm0 # sched: [5:0.50]
	; KNL-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm0			; KNL-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm0 # sched: [5:0.50]
	; KNL-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [9:1.00]			; KNL-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [5:0.50]
	; KNL-NEXT: retq # sched: [1:1.00]			; KNL-NEXT: retq # sched: [2:1.00]
	;			;
	; SKX-LABEL: v8f32_one_step2:			; SKX-LABEL: v8f32_one_step2:
	; SKX: # BB#0:			; SKX: # BB#0:
	; SKX-NEXT: vrcp14ps %ymm0, %ymm1			; SKX-NEXT: vrcp14ps %ymm0, %ymm1
	; SKX-NEXT: vfnmadd213ps {{.*}}(%rip){1to8}, %ymm1, %ymm0			; SKX-NEXT: vfnmadd213ps {{.*}}(%rip){1to8}, %ymm1, %ymm0
	; SKX-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm0			; SKX-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm0 # sched: [5:0.50]
	; SKX-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [9:1.00]			; SKX-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [5:0.50]
	; SKX-NEXT: retq # sched: [1:1.00]			; SKX-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast <8 x float> <float 1.0, float 2.0, float 3.0, float 4.0, float 5.0, float 6.0, float 7.0, float 8.0>, %x			%div = fdiv fast <8 x float> <float 1.0, float 2.0, float 3.0, float 4.0, float 5.0, float 6.0, float 7.0, float 8.0>, %x
	ret <8 x float> %div			ret <8 x float> %div
	}			}

	define <8 x float> @v8f32_one_step_2_divs(<8 x float> %x) #1 {			define <8 x float> @v8f32_one_step_2_divs(<8 x float> %x) #1 {
	; SSE-LABEL: v8f32_one_step_2_divs:			; SSE-LABEL: v8f32_one_step_2_divs:
	; SSE: # BB#0:			; SSE: # BB#0:
	; SSE-NEXT: rcpps %xmm0, %xmm2			; SSE-NEXT: rcpps %xmm0, %xmm2
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:1.00]			; SANDY-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:1.00]
	; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm1 # sched: [12:1.00]			; SANDY-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm1 # sched: [12:1.00]
	; SANDY-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:1.00]			; SANDY-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: v8f32_one_step_2_divs:			; HASWELL-LABEL: v8f32_one_step_2_divs:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpps %ymm0, %ymm1 # sched: [7:2.00]			; HASWELL-NEXT: vrcpps %ymm0, %ymm1 # sched: [11:2.00]
	; HASWELL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [5:1.00]			; HASWELL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [1:0.50]
	; HASWELL-NEXT: vfnmadd213ps %ymm2, %ymm1, %ymm0			; HASWELL-NEXT: vfnmadd213ps %ymm2, %ymm1, %ymm0 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm0			; HASWELL-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm0 # sched: [5:0.50]
	; HASWELL-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm1 # sched: [9:1.00]			; HASWELL-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm1 # sched: [5:0.50]
	; HASWELL-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:1.00]			; HASWELL-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: v8f32_one_step_2_divs:			; HASWELL-NO-FMA-LABEL: v8f32_one_step_2_divs:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vrcpps %ymm0, %ymm1 # sched: [7:2.00]			; HASWELL-NO-FMA-NEXT: vrcpps %ymm0, %ymm1 # sched: [11:2.00]
	; HASWELL-NO-FMA-NEXT: vmulps %ymm1, %ymm0, %ymm0 # sched: [5:1.00]			; HASWELL-NO-FMA-NEXT: vmulps %ymm1, %ymm0, %ymm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [5:1.00]			; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [1:0.50]
	; HASWELL-NO-FMA-NEXT: vsubps %ymm0, %ymm2, %ymm0 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vsubps %ymm0, %ymm2, %ymm0 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:1.00]			; HASWELL-NO-FMA-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm1 # sched: [9:1.00]			; HASWELL-NO-FMA-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm1 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:1.00]			; HASWELL-NO-FMA-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: retq # sched: [1:1.00]			; HASWELL-NO-FMA-NEXT: retq # sched: [2:1.00]
	;			;
	; KNL-LABEL: v8f32_one_step_2_divs:			; KNL-LABEL: v8f32_one_step_2_divs:
	; KNL: # BB#0:			; KNL: # BB#0:
	; KNL-NEXT: vrcpps %ymm0, %ymm1 # sched: [7:2.00]			; KNL-NEXT: vrcpps %ymm0, %ymm1 # sched: [11:2.00]
	; KNL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [5:1.00]			; KNL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [1:0.50]
	; KNL-NEXT: vfnmadd213ps %ymm2, %ymm1, %ymm0			; KNL-NEXT: vfnmadd213ps %ymm2, %ymm1, %ymm0 # sched: [5:0.50]
	; KNL-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm0			; KNL-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm0 # sched: [5:0.50]
	; KNL-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm1 # sched: [9:1.00]			; KNL-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm1 # sched: [5:0.50]
	; KNL-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:1.00]			; KNL-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:0.50]
	; KNL-NEXT: retq # sched: [1:1.00]			; KNL-NEXT: retq # sched: [2:1.00]
	;			;
	; SKX-LABEL: v8f32_one_step_2_divs:			; SKX-LABEL: v8f32_one_step_2_divs:
	; SKX: # BB#0:			; SKX: # BB#0:
	; SKX-NEXT: vrcp14ps %ymm0, %ymm1			; SKX-NEXT: vrcp14ps %ymm0, %ymm1
	; SKX-NEXT: vfnmadd213ps {{.*}}(%rip){1to8}, %ymm1, %ymm0			; SKX-NEXT: vfnmadd213ps {{.*}}(%rip){1to8}, %ymm1, %ymm0
	; SKX-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm0			; SKX-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm0 # sched: [5:0.50]
	; SKX-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm1 # sched: [9:1.00]			; SKX-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm1 # sched: [5:0.50]
	; SKX-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:1.00]			; SKX-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:0.50]
	; SKX-NEXT: retq # sched: [1:1.00]			; SKX-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast <8 x float> <float 1.0, float 2.0, float 3.0, float 4.0, float 5.0, float 6.0, float 7.0, float 8.0>, %x			%div = fdiv fast <8 x float> <float 1.0, float 2.0, float 3.0, float 4.0, float 5.0, float 6.0, float 7.0, float 8.0>, %x
	%div2 = fdiv fast <8 x float> %div, %x			%div2 = fdiv fast <8 x float> %div, %x
	ret <8 x float> %div2			ret <8 x float> %div2
	}			}

	define <8 x float> @v8f32_two_step2(<8 x float> %x) #2 {			define <8 x float> @v8f32_two_step2(<8 x float> %x) #2 {
	; SSE-LABEL: v8f32_two_step2:			; SSE-LABEL: v8f32_two_step2:
	; SSE: # BB#0:			; SSE: # BB#0:
	▲ Show 20 Lines • Show All 81 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vsubps %ymm0, %ymm3, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vsubps %ymm0, %ymm3, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:1.00]			; SANDY-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:1.00]
	; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; SANDY-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [12:1.00]			; SANDY-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [12:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: v8f32_two_step2:			; HASWELL-LABEL: v8f32_two_step2:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpps %ymm0, %ymm1 # sched: [7:2.00]			; HASWELL-NEXT: vrcpps %ymm0, %ymm1 # sched: [11:2.00]
	; HASWELL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [5:1.00]			; HASWELL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [1:0.50]
	; HASWELL-NEXT: vmovaps %ymm1, %ymm3 # sched: [1:1.00]			; HASWELL-NEXT: vmovaps %ymm1, %ymm3 # sched: [1:1.00]
	; HASWELL-NEXT: vfnmadd213ps %ymm2, %ymm0, %ymm3			; HASWELL-NEXT: vfnmadd213ps %ymm2, %ymm0, %ymm3 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm3			; HASWELL-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm3 # sched: [5:0.50]
	; HASWELL-NEXT: vfnmadd213ps %ymm2, %ymm3, %ymm0			; HASWELL-NEXT: vfnmadd213ps %ymm2, %ymm3, %ymm0 # sched: [5:0.50]
	; HASWELL-NEXT: vfmadd132ps %ymm3, %ymm3, %ymm0			; HASWELL-NEXT: vfmadd132ps %ymm3, %ymm3, %ymm0 # sched: [5:0.50]
	; HASWELL-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [9:1.00]			; HASWELL-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: v8f32_two_step2:			; HASWELL-NO-FMA-LABEL: v8f32_two_step2:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vrcpps %ymm0, %ymm1 # sched: [7:2.00]			; HASWELL-NO-FMA-NEXT: vrcpps %ymm0, %ymm1 # sched: [11:2.00]
	; HASWELL-NO-FMA-NEXT: vmulps %ymm1, %ymm0, %ymm2 # sched: [5:1.00]			; HASWELL-NO-FMA-NEXT: vmulps %ymm1, %ymm0, %ymm2 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} ymm3 = [1,1,1,1,1,1,1,1] sched: [5:1.00]			; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} ymm3 = [1,1,1,1,1,1,1,1] sched: [1:0.50]
	; HASWELL-NO-FMA-NEXT: vsubps %ymm2, %ymm3, %ymm2 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vsubps %ymm2, %ymm3, %ymm2 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulps %ymm2, %ymm1, %ymm2 # sched: [5:1.00]			; HASWELL-NO-FMA-NEXT: vmulps %ymm2, %ymm1, %ymm2 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vaddps %ymm2, %ymm1, %ymm1 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vaddps %ymm2, %ymm1, %ymm1 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulps %ymm1, %ymm0, %ymm0 # sched: [5:1.00]			; HASWELL-NO-FMA-NEXT: vmulps %ymm1, %ymm0, %ymm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vsubps %ymm0, %ymm3, %ymm0 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vsubps %ymm0, %ymm3, %ymm0 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:1.00]			; HASWELL-NO-FMA-NEXT: vmulps %ymm0, %ymm1, %ymm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]			; HASWELL-NO-FMA-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
	; HASWELL-NO-FMA-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [9:1.00]			; HASWELL-NO-FMA-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: retq # sched: [1:1.00]			; HASWELL-NO-FMA-NEXT: retq # sched: [2:1.00]
	;			;
	; KNL-LABEL: v8f32_two_step2:			; KNL-LABEL: v8f32_two_step2:
	; KNL: # BB#0:			; KNL: # BB#0:
	; KNL-NEXT: vrcpps %ymm0, %ymm1 # sched: [7:2.00]			; KNL-NEXT: vrcpps %ymm0, %ymm1 # sched: [11:2.00]
	; KNL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [5:1.00]			; KNL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [1:0.50]
	; KNL-NEXT: vmovaps %ymm1, %ymm3 # sched: [1:1.00]			; KNL-NEXT: vmovaps %ymm1, %ymm3 # sched: [1:1.00]
	; KNL-NEXT: vfnmadd213ps %ymm2, %ymm0, %ymm3			; KNL-NEXT: vfnmadd213ps %ymm2, %ymm0, %ymm3 # sched: [5:0.50]
	; KNL-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm3			; KNL-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm3 # sched: [5:0.50]
	; KNL-NEXT: vfnmadd213ps %ymm2, %ymm3, %ymm0			; KNL-NEXT: vfnmadd213ps %ymm2, %ymm3, %ymm0 # sched: [5:0.50]
	; KNL-NEXT: vfmadd132ps %ymm3, %ymm3, %ymm0			; KNL-NEXT: vfmadd132ps %ymm3, %ymm3, %ymm0 # sched: [5:0.50]
	; KNL-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [9:1.00]			; KNL-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [5:0.50]
	; KNL-NEXT: retq # sched: [1:1.00]			; KNL-NEXT: retq # sched: [2:1.00]
	;			;
	; SKX-LABEL: v8f32_two_step2:			; SKX-LABEL: v8f32_two_step2:
	; SKX: # BB#0:			; SKX: # BB#0:
	; SKX-NEXT: vrcp14ps %ymm0, %ymm1			; SKX-NEXT: vrcp14ps %ymm0, %ymm1
	; SKX-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [5:1.00]			; SKX-NEXT: vbroadcastss {{.*#+}} ymm2 = [1,1,1,1,1,1,1,1] sched: [1:0.50]
	; SKX-NEXT: vmovaps %ymm1, %ymm3 # sched: [1:1.00]			; SKX-NEXT: vmovaps %ymm1, %ymm3 # sched: [1:1.00]
	; SKX-NEXT: vfnmadd213ps %ymm2, %ymm0, %ymm3			; SKX-NEXT: vfnmadd213ps %ymm2, %ymm0, %ymm3 # sched: [5:0.50]
	; SKX-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm3			; SKX-NEXT: vfmadd132ps %ymm1, %ymm1, %ymm3 # sched: [5:0.50]
	; SKX-NEXT: vfnmadd213ps %ymm2, %ymm3, %ymm0			; SKX-NEXT: vfnmadd213ps %ymm2, %ymm3, %ymm0 # sched: [5:0.50]
	; SKX-NEXT: vfmadd132ps %ymm3, %ymm3, %ymm0			; SKX-NEXT: vfmadd132ps %ymm3, %ymm3, %ymm0 # sched: [5:0.50]
	; SKX-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [9:1.00]			; SKX-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [5:0.50]
	; SKX-NEXT: retq # sched: [1:1.00]			; SKX-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast <8 x float> <float 1.0, float 2.0, float 3.0, float 4.0, float 5.0, float 6.0, float 7.0, float 8.0>, %x			%div = fdiv fast <8 x float> <float 1.0, float 2.0, float 3.0, float 4.0, float 5.0, float 6.0, float 7.0, float 8.0>, %x
	ret <8 x float> %div			ret <8 x float> %div
	}			}

	define <8 x float> @v8f32_no_step(<8 x float> %x) #3 {			define <8 x float> @v8f32_no_step(<8 x float> %x) #3 {
	; SSE-LABEL: v8f32_no_step:			; SSE-LABEL: v8f32_no_step:
	; SSE: # BB#0:			; SSE: # BB#0:
	; SSE-NEXT: rcpps %xmm0, %xmm0			; SSE-NEXT: rcpps %xmm0, %xmm0
	Show All 17 Lines
	;			;
	; SANDY-LABEL: v8f32_no_step:			; SANDY-LABEL: v8f32_no_step:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vrcpps %ymm0, %ymm0 # sched: [7:2.00]			; SANDY-NEXT: vrcpps %ymm0, %ymm0 # sched: [7:2.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: v8f32_no_step:			; HASWELL-LABEL: v8f32_no_step:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpps %ymm0, %ymm0 # sched: [7:2.00]			; HASWELL-NEXT: vrcpps %ymm0, %ymm0 # sched: [11:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: v8f32_no_step:			; HASWELL-NO-FMA-LABEL: v8f32_no_step:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vrcpps %ymm0, %ymm0 # sched: [7:2.00]			; HASWELL-NO-FMA-NEXT: vrcpps %ymm0, %ymm0 # sched: [11:2.00]
	; HASWELL-NO-FMA-NEXT: retq # sched: [1:1.00]			; HASWELL-NO-FMA-NEXT: retq # sched: [2:1.00]
	;			;
	; KNL-LABEL: v8f32_no_step:			; KNL-LABEL: v8f32_no_step:
	; KNL: # BB#0:			; KNL: # BB#0:
	; KNL-NEXT: vrcpps %ymm0, %ymm0 # sched: [7:2.00]			; KNL-NEXT: vrcpps %ymm0, %ymm0 # sched: [11:2.00]
	; KNL-NEXT: retq # sched: [1:1.00]			; KNL-NEXT: retq # sched: [2:1.00]
	;			;
	; SKX-LABEL: v8f32_no_step:			; SKX-LABEL: v8f32_no_step:
	; SKX: # BB#0:			; SKX: # BB#0:
	; SKX-NEXT: vrcp14ps %ymm0, %ymm0			; SKX-NEXT: vrcp14ps %ymm0, %ymm0
	; SKX-NEXT: retq # sched: [1:1.00]			; SKX-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast <8 x float> <float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0>, %x			%div = fdiv fast <8 x float> <float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0, float 1.0>, %x
	ret <8 x float> %div			ret <8 x float> %div
	}			}

	define <8 x float> @v8f32_no_step2(<8 x float> %x) #3 {			define <8 x float> @v8f32_no_step2(<8 x float> %x) #3 {
	; SSE-LABEL: v8f32_no_step2:			; SSE-LABEL: v8f32_no_step2:
	; SSE: # BB#0:			; SSE: # BB#0:
	; SSE-NEXT: rcpps %xmm1, %xmm1			; SSE-NEXT: rcpps %xmm1, %xmm1
	Show All 23 Lines
	; SANDY-LABEL: v8f32_no_step2:			; SANDY-LABEL: v8f32_no_step2:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vrcpps %ymm0, %ymm0 # sched: [7:2.00]			; SANDY-NEXT: vrcpps %ymm0, %ymm0 # sched: [7:2.00]
	; SANDY-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [12:1.00]			; SANDY-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [12:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: v8f32_no_step2:			; HASWELL-LABEL: v8f32_no_step2:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpps %ymm0, %ymm0 # sched: [7:2.00]			; HASWELL-NEXT: vrcpps %ymm0, %ymm0 # sched: [11:2.00]
	; HASWELL-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [9:1.00]			; HASWELL-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; HASWELL-NO-FMA-LABEL: v8f32_no_step2:			; HASWELL-NO-FMA-LABEL: v8f32_no_step2:
	; HASWELL-NO-FMA: # BB#0:			; HASWELL-NO-FMA: # BB#0:
	; HASWELL-NO-FMA-NEXT: vrcpps %ymm0, %ymm0 # sched: [7:2.00]			; HASWELL-NO-FMA-NEXT: vrcpps %ymm0, %ymm0 # sched: [11:2.00]
	; HASWELL-NO-FMA-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [9:1.00]			; HASWELL-NO-FMA-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [5:0.50]
	; HASWELL-NO-FMA-NEXT: retq # sched: [1:1.00]			; HASWELL-NO-FMA-NEXT: retq # sched: [2:1.00]
	;			;
	; KNL-LABEL: v8f32_no_step2:			; KNL-LABEL: v8f32_no_step2:
	; KNL: # BB#0:			; KNL: # BB#0:
	; KNL-NEXT: vrcpps %ymm0, %ymm0 # sched: [7:2.00]			; KNL-NEXT: vrcpps %ymm0, %ymm0 # sched: [11:2.00]
	; KNL-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [9:1.00]			; KNL-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [5:0.50]
	; KNL-NEXT: retq # sched: [1:1.00]			; KNL-NEXT: retq # sched: [2:1.00]
	;			;
	; SKX-LABEL: v8f32_no_step2:			; SKX-LABEL: v8f32_no_step2:
	; SKX: # BB#0:			; SKX: # BB#0:
	; SKX-NEXT: vrcp14ps %ymm0, %ymm0			; SKX-NEXT: vrcp14ps %ymm0, %ymm0
	; SKX-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [9:1.00]			; SKX-NEXT: vmulps {{.*}}(%rip), %ymm0, %ymm0 # sched: [5:0.50]
	; SKX-NEXT: retq # sched: [1:1.00]			; SKX-NEXT: retq # sched: [2:1.00]
	%div = fdiv fast <8 x float> <float 1.0, float 2.0, float 3.0, float 4.0, float 5.0, float 6.0, float 7.0, float 8.0>, %x			%div = fdiv fast <8 x float> <float 1.0, float 2.0, float 3.0, float 4.0, float 5.0, float 6.0, float 7.0, float 8.0>, %x
	ret <8 x float> %div			ret <8 x float> %div
	}			}

	attributes #0 = { "unsafe-fp-math"="true" "reciprocal-estimates"="!divf,!vec-divf" }			attributes #0 = { "unsafe-fp-math"="true" "reciprocal-estimates"="!divf,!vec-divf" }
	attributes #1 = { "unsafe-fp-math"="true" "reciprocal-estimates"="divf,vec-divf" }			attributes #1 = { "unsafe-fp-math"="true" "reciprocal-estimates"="divf,vec-divf" }
	attributes #2 = { "unsafe-fp-math"="true" "reciprocal-estimates"="divf:2,vec-divf:2" }			attributes #2 = { "unsafe-fp-math"="true" "reciprocal-estimates"="divf:2,vec-divf:2" }
	attributes #3 = { "unsafe-fp-math"="true" "reciprocal-estimates"="divf:0,vec-divf:0" }			attributes #3 = { "unsafe-fp-math"="true" "reciprocal-estimates"="divf:0,vec-divf:0" }

test/CodeGen/X86/sse-schedule.ll

	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vaddps (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vaddps (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_addps:			; HASWELL-LABEL: test_addps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vaddps (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vaddps (%rdi), %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_addps:			; BTVER2-LABEL: test_addps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vaddps (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vaddps (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_addps:			; ZNVER1-LABEL: test_addps:
	Show All 30 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vaddss (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vaddss (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_addss:			; HASWELL-LABEL: test_addss:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vaddss (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vaddss (%rdi), %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_addss:			; BTVER2-LABEL: test_addss:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vaddss (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vaddss (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_addss:			; ZNVER1-LABEL: test_addss:
	Show All 34 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vandps %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vandps %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: vandps (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; SANDY-NEXT: vandps (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_andps:			; HASWELL-LABEL: test_andps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vandps %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vandps %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vandps (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vandps (%rdi), %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_andps:			; BTVER2-LABEL: test_andps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vandps %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vandps %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vandps (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vandps (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_andps:			; ZNVER1-LABEL: test_andps:
	Show All 38 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vandnps %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vandnps %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: vandnps (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; SANDY-NEXT: vandnps (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_andnotps:			; HASWELL-LABEL: test_andnotps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vandnps %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vandnps %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vandnps (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vandnps (%rdi), %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_andnotps:			; BTVER2-LABEL: test_andnotps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vandnps %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vandnps %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vandnps (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vandnps (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_andnotps:			; ZNVER1-LABEL: test_andnotps:
	Show All 40 Lines
	; SANDY-NEXT: vcmpeqps %xmm1, %xmm0, %xmm1 # sched: [3:1.00]			; SANDY-NEXT: vcmpeqps %xmm1, %xmm0, %xmm1 # sched: [3:1.00]
	; SANDY-NEXT: vcmpeqps (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vcmpeqps (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: vorps %xmm0, %xmm1, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vorps %xmm0, %xmm1, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cmpps:			; HASWELL-LABEL: test_cmpps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcmpeqps %xmm1, %xmm0, %xmm1 # sched: [3:1.00]			; HASWELL-NEXT: vcmpeqps %xmm1, %xmm0, %xmm1 # sched: [3:1.00]
	; HASWELL-NEXT: vcmpeqps (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vcmpeqps (%rdi), %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vorps %xmm0, %xmm1, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vorps %xmm0, %xmm1, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cmpps:			; BTVER2-LABEL: test_cmpps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcmpeqps %xmm1, %xmm0, %xmm1 # sched: [3:1.00]			; BTVER2-NEXT: vcmpeqps %xmm1, %xmm0, %xmm1 # sched: [3:1.00]
	; BTVER2-NEXT: vcmpeqps (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vcmpeqps (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: vorps %xmm0, %xmm1, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vorps %xmm0, %xmm1, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 36 Lines
	; SANDY-NEXT: vcmpeqss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vcmpeqss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vcmpeqss (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; SANDY-NEXT: vcmpeqss (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cmpss:			; HASWELL-LABEL: test_cmpss:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcmpeqss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vcmpeqss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vcmpeqss (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vcmpeqss (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cmpss:			; BTVER2-LABEL: test_cmpss:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcmpeqss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcmpeqss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vcmpeqss (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vcmpeqss (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_cmpss:			; ZNVER1-LABEL: test_cmpss:
	▲ Show 20 Lines • Show All 76 Lines • ▼ Show 20 Lines
	; HASWELL-NEXT: sete %cl # sched: [1:0.50]			; HASWELL-NEXT: sete %cl # sched: [1:0.50]
	; HASWELL-NEXT: andb %al, %cl # sched: [1:0.25]			; HASWELL-NEXT: andb %al, %cl # sched: [1:0.25]
	; HASWELL-NEXT: vcomiss (%rdi), %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vcomiss (%rdi), %xmm0 # sched: [7:1.00]
	; HASWELL-NEXT: setnp %al # sched: [1:0.50]			; HASWELL-NEXT: setnp %al # sched: [1:0.50]
	; HASWELL-NEXT: sete %dl # sched: [1:0.50]			; HASWELL-NEXT: sete %dl # sched: [1:0.50]
	; HASWELL-NEXT: andb %al, %dl # sched: [1:0.25]			; HASWELL-NEXT: andb %al, %dl # sched: [1:0.25]
	; HASWELL-NEXT: orb %cl, %dl # sched: [1:0.25]			; HASWELL-NEXT: orb %cl, %dl # sched: [1:0.25]
	; HASWELL-NEXT: movzbl %dl, %eax # sched: [1:0.25]			; HASWELL-NEXT: movzbl %dl, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_comiss:			; BTVER2-LABEL: test_comiss:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcomiss %xmm1, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcomiss %xmm1, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: setnp %al # sched: [1:0.50]			; BTVER2-NEXT: setnp %al # sched: [1:0.50]
	; BTVER2-NEXT: sete %cl # sched: [1:0.50]			; BTVER2-NEXT: sete %cl # sched: [1:0.50]
	; BTVER2-NEXT: andb %al, %cl # sched: [1:0.50]			; BTVER2-NEXT: andb %al, %cl # sched: [1:0.50]
	; BTVER2-NEXT: vcomiss (%rdi), %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vcomiss (%rdi), %xmm0 # sched: [8:1.00]
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtsi2ss:			; HASWELL-LABEL: test_cvtsi2ss:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtsi2ssl %edi, %xmm0, %xmm0 # sched: [4:1.00]			; HASWELL-NEXT: vcvtsi2ssl %edi, %xmm0, %xmm0 # sched: [4:1.00]
	; HASWELL-NEXT: vcvtsi2ssl (%rsi), %xmm1, %xmm1 # sched: [8:1.00]			; HASWELL-NEXT: vcvtsi2ssl (%rsi), %xmm1, %xmm1 # sched: [8:1.00]
	; HASWELL-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtsi2ss:			; BTVER2-LABEL: test_cvtsi2ss:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtsi2ssl %edi, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvtsi2ssl %edi, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vcvtsi2ssl (%rsi), %xmm1, %xmm1 # sched: [8:1.00]			; BTVER2-NEXT: vcvtsi2ssl (%rsi), %xmm1, %xmm1 # sched: [8:1.00]
	; BTVER2-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 36 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vcvtsi2ssq %rdi, %xmm0, %xmm0 # sched: [5:2.00]			; SANDY-NEXT: vcvtsi2ssq %rdi, %xmm0, %xmm0 # sched: [5:2.00]
	; SANDY-NEXT: vcvtsi2ssq (%rsi), %xmm1, %xmm1 # sched: [10:1.00]			; SANDY-NEXT: vcvtsi2ssq (%rsi), %xmm1, %xmm1 # sched: [10:1.00]
	; SANDY-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtsi2ssq:			; HASWELL-LABEL: test_cvtsi2ssq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtsi2ssq %rdi, %xmm0, %xmm0 # sched: [4:1.00]			; HASWELL-NEXT: vcvtsi2ssq %rdi, %xmm0, %xmm0 # sched: [5:2.00]
	; HASWELL-NEXT: vcvtsi2ssq (%rsi), %xmm1, %xmm1 # sched: [8:1.00]			; HASWELL-NEXT: vcvtsi2ssq (%rsi), %xmm1, %xmm1 # sched: [8:1.00]
	; HASWELL-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtsi2ssq:			; BTVER2-LABEL: test_cvtsi2ssq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtsi2ssq %rdi, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvtsi2ssq %rdi, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vcvtsi2ssq (%rsi), %xmm1, %xmm1 # sched: [8:1.00]			; BTVER2-NEXT: vcvtsi2ssq (%rsi), %xmm1, %xmm1 # sched: [8:1.00]
	; BTVER2-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 37 Lines
	; SANDY-NEXT: vcvtss2si %xmm0, %ecx # sched: [5:1.00]			; SANDY-NEXT: vcvtss2si %xmm0, %ecx # sched: [5:1.00]
	; SANDY-NEXT: vcvtss2si (%rdi), %eax # sched: [10:1.00]			; SANDY-NEXT: vcvtss2si (%rdi), %eax # sched: [10:1.00]
	; SANDY-NEXT: addl %ecx, %eax # sched: [1:0.33]			; SANDY-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtss2si:			; HASWELL-LABEL: test_cvtss2si:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtss2si %xmm0, %ecx # sched: [4:1.00]			; HASWELL-NEXT: vcvtss2si %xmm0, %ecx # sched: [4:1.00]
	; HASWELL-NEXT: vcvtss2si (%rdi), %eax # sched: [8:1.00]			; HASWELL-NEXT: vcvtss2si (%rdi), %eax # sched: [4:1.00]
	; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]			; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtss2si:			; BTVER2-LABEL: test_cvtss2si:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtss2si (%rdi), %eax # sched: [8:1.00]			; BTVER2-NEXT: vcvtss2si (%rdi), %eax # sched: [8:1.00]
	; BTVER2-NEXT: vcvtss2si %xmm0, %ecx # sched: [3:1.00]			; BTVER2-NEXT: vcvtss2si %xmm0, %ecx # sched: [3:1.00]
	; BTVER2-NEXT: addl %ecx, %eax # sched: [1:0.50]			; BTVER2-NEXT: addl %ecx, %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 40 Lines
	; SANDY-NEXT: vcvtss2si %xmm0, %rcx # sched: [5:1.00]			; SANDY-NEXT: vcvtss2si %xmm0, %rcx # sched: [5:1.00]
	; SANDY-NEXT: vcvtss2si (%rdi), %rax # sched: [10:1.00]			; SANDY-NEXT: vcvtss2si (%rdi), %rax # sched: [10:1.00]
	; SANDY-NEXT: addq %rcx, %rax # sched: [1:0.33]			; SANDY-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtss2siq:			; HASWELL-LABEL: test_cvtss2siq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtss2si %xmm0, %rcx # sched: [4:1.00]			; HASWELL-NEXT: vcvtss2si %xmm0, %rcx # sched: [4:1.00]
	; HASWELL-NEXT: vcvtss2si (%rdi), %rax # sched: [8:1.00]			; HASWELL-NEXT: vcvtss2si (%rdi), %rax # sched: [4:1.00]
	; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]			; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtss2siq:			; BTVER2-LABEL: test_cvtss2siq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtss2si (%rdi), %rax # sched: [8:1.00]			; BTVER2-NEXT: vcvtss2si (%rdi), %rax # sched: [8:1.00]
	; BTVER2-NEXT: vcvtss2si %xmm0, %rcx # sched: [3:1.00]			; BTVER2-NEXT: vcvtss2si %xmm0, %rcx # sched: [3:1.00]
	; BTVER2-NEXT: addq %rcx, %rax # sched: [1:0.50]			; BTVER2-NEXT: addq %rcx, %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 40 Lines
	; SANDY-NEXT: vcvttss2si %xmm0, %ecx # sched: [5:1.00]			; SANDY-NEXT: vcvttss2si %xmm0, %ecx # sched: [5:1.00]
	; SANDY-NEXT: vcvttss2si (%rdi), %eax # sched: [10:1.00]			; SANDY-NEXT: vcvttss2si (%rdi), %eax # sched: [10:1.00]
	; SANDY-NEXT: addl %ecx, %eax # sched: [1:0.33]			; SANDY-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvttss2si:			; HASWELL-LABEL: test_cvttss2si:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvttss2si %xmm0, %ecx # sched: [4:1.00]			; HASWELL-NEXT: vcvttss2si %xmm0, %ecx # sched: [4:1.00]
	; HASWELL-NEXT: vcvttss2si (%rdi), %eax # sched: [8:1.00]			; HASWELL-NEXT: vcvttss2si (%rdi), %eax # sched: [4:1.00]
	; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]			; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvttss2si:			; BTVER2-LABEL: test_cvttss2si:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvttss2si (%rdi), %eax # sched: [8:1.00]			; BTVER2-NEXT: vcvttss2si (%rdi), %eax # sched: [8:1.00]
	; BTVER2-NEXT: vcvttss2si %xmm0, %ecx # sched: [3:1.00]			; BTVER2-NEXT: vcvttss2si %xmm0, %ecx # sched: [3:1.00]
	; BTVER2-NEXT: addl %ecx, %eax # sched: [1:0.50]			; BTVER2-NEXT: addl %ecx, %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 37 Lines
	; SANDY-NEXT: vcvttss2si %xmm0, %rcx # sched: [5:1.00]			; SANDY-NEXT: vcvttss2si %xmm0, %rcx # sched: [5:1.00]
	; SANDY-NEXT: vcvttss2si (%rdi), %rax # sched: [10:1.00]			; SANDY-NEXT: vcvttss2si (%rdi), %rax # sched: [10:1.00]
	; SANDY-NEXT: addq %rcx, %rax # sched: [1:0.33]			; SANDY-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvttss2siq:			; HASWELL-LABEL: test_cvttss2siq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvttss2si %xmm0, %rcx # sched: [4:1.00]			; HASWELL-NEXT: vcvttss2si %xmm0, %rcx # sched: [4:1.00]
	; HASWELL-NEXT: vcvttss2si (%rdi), %rax # sched: [8:1.00]			; HASWELL-NEXT: vcvttss2si (%rdi), %rax # sched: [4:1.00]
	; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]			; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvttss2siq:			; BTVER2-LABEL: test_cvttss2siq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvttss2si (%rdi), %rax # sched: [8:1.00]			; BTVER2-NEXT: vcvttss2si (%rdi), %rax # sched: [8:1.00]
	; BTVER2-NEXT: vcvttss2si %xmm0, %rcx # sched: [3:1.00]			; BTVER2-NEXT: vcvttss2si %xmm0, %rcx # sched: [3:1.00]
	; BTVER2-NEXT: addq %rcx, %rax # sched: [1:0.50]			; BTVER2-NEXT: addq %rcx, %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY-LABEL: test_divps:			; SANDY-LABEL: test_divps:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vdivps %xmm1, %xmm0, %xmm0 # sched: [14:1.00]			; SANDY-NEXT: vdivps %xmm1, %xmm0, %xmm0 # sched: [14:1.00]
	; SANDY-NEXT: vdivps (%rdi), %xmm0, %xmm0 # sched: [20:1.00]			; SANDY-NEXT: vdivps (%rdi), %xmm0, %xmm0 # sched: [20:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_divps:			; HASWELL-LABEL: test_divps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vdivps %xmm1, %xmm0, %xmm0 # sched: [12:1.00]			; HASWELL-NEXT: vdivps %xmm1, %xmm0, %xmm0 # sched: [13:1.00]
	; HASWELL-NEXT: vdivps (%rdi), %xmm0, %xmm0 # sched: [16:1.00]			; HASWELL-NEXT: vdivps (%rdi), %xmm0, %xmm0 # sched: [13:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_divps:			; BTVER2-LABEL: test_divps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vdivps %xmm1, %xmm0, %xmm0 # sched: [19:19.00]			; BTVER2-NEXT: vdivps %xmm1, %xmm0, %xmm0 # sched: [19:19.00]
	; BTVER2-NEXT: vdivps (%rdi), %xmm0, %xmm0 # sched: [24:19.00]			; BTVER2-NEXT: vdivps (%rdi), %xmm0, %xmm0 # sched: [24:19.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_divps:			; ZNVER1-LABEL: test_divps:
	Show All 29 Lines
	; SANDY-LABEL: test_divss:			; SANDY-LABEL: test_divss:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vdivss %xmm1, %xmm0, %xmm0 # sched: [14:1.00]			; SANDY-NEXT: vdivss %xmm1, %xmm0, %xmm0 # sched: [14:1.00]
	; SANDY-NEXT: vdivss (%rdi), %xmm0, %xmm0 # sched: [20:1.00]			; SANDY-NEXT: vdivss (%rdi), %xmm0, %xmm0 # sched: [20:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_divss:			; HASWELL-LABEL: test_divss:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vdivss %xmm1, %xmm0, %xmm0 # sched: [12:1.00]			; HASWELL-NEXT: vdivss %xmm1, %xmm0, %xmm0 # sched: [13:1.00]
	; HASWELL-NEXT: vdivss (%rdi), %xmm0, %xmm0 # sched: [16:1.00]			; HASWELL-NEXT: vdivss (%rdi), %xmm0, %xmm0 # sched: [13:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_divss:			; BTVER2-LABEL: test_divss:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vdivss %xmm1, %xmm0, %xmm0 # sched: [19:19.00]			; BTVER2-NEXT: vdivss %xmm1, %xmm0, %xmm0 # sched: [19:19.00]
	; BTVER2-NEXT: vdivss (%rdi), %xmm0, %xmm0 # sched: [24:19.00]			; BTVER2-NEXT: vdivss (%rdi), %xmm0, %xmm0 # sched: [24:19.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_divss:			; ZNVER1-LABEL: test_divss:
	Show All 30 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: movl %edi, -{{[0-9]+}}(%rsp) # sched: [5:1.00]			; SANDY-NEXT: movl %edi, -{{[0-9]+}}(%rsp) # sched: [5:1.00]
	; SANDY-NEXT: vldmxcsr -{{[0-9]+}}(%rsp) # sched: [5:1.00]			; SANDY-NEXT: vldmxcsr -{{[0-9]+}}(%rsp) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_ldmxcsr:			; HASWELL-LABEL: test_ldmxcsr:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: movl %edi, -{{[0-9]+}}(%rsp) # sched: [1:1.00]			; HASWELL-NEXT: movl %edi, -{{[0-9]+}}(%rsp) # sched: [1:1.00]
	; HASWELL-NEXT: vldmxcsr -{{[0-9]+}}(%rsp) # sched: [6:1.00]			; HASWELL-NEXT: vldmxcsr -{{[0-9]+}}(%rsp) # sched: [2:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_ldmxcsr:			; BTVER2-LABEL: test_ldmxcsr:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: movl %edi, -{{[0-9]+}}(%rsp) # sched: [1:1.00]			; BTVER2-NEXT: movl %edi, -{{[0-9]+}}(%rsp) # sched: [1:1.00]
	; BTVER2-NEXT: vldmxcsr -{{[0-9]+}}(%rsp) # sched: [5:1.00]			; BTVER2-NEXT: vldmxcsr -{{[0-9]+}}(%rsp) # sched: [5:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_ldmxcsr:			; ZNVER1-LABEL: test_ldmxcsr:
	Show All 32 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmaxps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vmaxps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmaxps (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vmaxps (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_maxps:			; HASWELL-LABEL: test_maxps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmaxps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vmaxps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmaxps (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vmaxps (%rdi), %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_maxps:			; BTVER2-LABEL: test_maxps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmaxps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vmaxps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vmaxps (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vmaxps (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_maxps:			; ZNVER1-LABEL: test_maxps:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmaxss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vmaxss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmaxss (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vmaxss (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_maxss:			; HASWELL-LABEL: test_maxss:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmaxss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vmaxss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmaxss (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vmaxss (%rdi), %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_maxss:			; BTVER2-LABEL: test_maxss:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmaxss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vmaxss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vmaxss (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vmaxss (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_maxss:			; ZNVER1-LABEL: test_maxss:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vminps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vminps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vminps (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vminps (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_minps:			; HASWELL-LABEL: test_minps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vminps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vminps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vminps (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vminps (%rdi), %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_minps:			; BTVER2-LABEL: test_minps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vminps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vminps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vminps (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vminps (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_minps:			; ZNVER1-LABEL: test_minps:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vminss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vminss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vminss (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vminss (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_minss:			; HASWELL-LABEL: test_minss:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vminss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vminss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vminss (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vminss (%rdi), %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_minss:			; BTVER2-LABEL: test_minss:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vminss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vminss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vminss (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vminss (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_minss:			; ZNVER1-LABEL: test_minss:
	Show All 34 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovaps (%rdi), %xmm0 # sched: [6:0.50]			; SANDY-NEXT: vmovaps (%rdi), %xmm0 # sched: [6:0.50]
	; SANDY-NEXT: vaddps %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmovaps %xmm0, (%rsi) # sched: [5:1.00]			; SANDY-NEXT: vmovaps %xmm0, (%rsi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movaps:			; HASWELL-LABEL: test_movaps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovaps (%rdi), %xmm0 # sched: [4:0.50]			; HASWELL-NEXT: vmovaps (%rdi), %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vaddps %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmovaps %xmm0, (%rsi) # sched: [1:1.00]			; HASWELL-NEXT: vmovaps %xmm0, (%rsi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movaps:			; BTVER2-LABEL: test_movaps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovaps (%rdi), %xmm0 # sched: [5:1.00]			; BTVER2-NEXT: vmovaps (%rdi), %xmm0 # sched: [5:1.00]
	; BTVER2-NEXT: vaddps %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddps %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vmovaps %xmm0, (%rsi) # sched: [1:1.00]			; BTVER2-NEXT: vmovaps %xmm0, (%rsi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 36 Lines
	; SANDY-LABEL: test_movhlps:			; SANDY-LABEL: test_movhlps:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vunpckhpd {{.*#+}} xmm0 = xmm1[1],xmm0[1] sched: [1:1.00]			; SANDY-NEXT: vunpckhpd {{.*#+}} xmm0 = xmm1[1],xmm0[1] sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movhlps:			; HASWELL-LABEL: test_movhlps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vunpckhpd {{.*#+}} xmm0 = xmm1[1],xmm0[1] sched: [1:1.00]			; HASWELL-NEXT: vunpckhpd {{.*#+}} xmm0 = xmm1[1],xmm0[1] sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movhlps:			; BTVER2-LABEL: test_movhlps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vunpckhpd {{.*#+}} xmm0 = xmm1[1],xmm0[1] sched: [1:0.50]			; BTVER2-NEXT: vunpckhpd {{.*#+}} xmm0 = xmm1[1],xmm0[1] sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_movhlps:			; ZNVER1-LABEL: test_movhlps:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 33 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovhpd {{.*#+}} xmm1 = xmm1[0],mem[0] sched: [7:1.00]			; SANDY-NEXT: vmovhpd {{.*#+}} xmm1 = xmm1[0],mem[0] sched: [7:1.00]
	; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vpextrq $1, %xmm0, (%rdi) # sched: [5:1.00]			; SANDY-NEXT: vpextrq $1, %xmm0, (%rdi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movhps:			; HASWELL-LABEL: test_movhps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovhpd {{.*#+}} xmm1 = xmm1[0],mem[0] sched: [5:1.00]			; HASWELL-NEXT: vmovhpd {{.*#+}} xmm1 = xmm1[0],mem[0] sched: [1:1.00]
	; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vpextrq $1, %xmm0, (%rdi) # sched: [5:1.00]			; HASWELL-NEXT: vpextrq $1, %xmm0, (%rdi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movhps:			; BTVER2-LABEL: test_movhps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovhpd {{.*#+}} xmm1 = xmm1[0],mem[0] sched: [6:1.00]			; BTVER2-NEXT: vmovhpd {{.*#+}} xmm1 = xmm1[0],mem[0] sched: [6:1.00]
	; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vpextrq $1, %xmm0, (%rdi) # sched: [6:1.00]			; BTVER2-NEXT: vpextrq $1, %xmm0, (%rdi) # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 39 Lines
	; SANDY-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0] sched: [1:1.00]			; SANDY-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0] sched: [1:1.00]
	; SANDY-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movlhps:			; HASWELL-LABEL: test_movlhps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0] sched: [1:1.00]			; HASWELL-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0] sched: [1:1.00]
	; HASWELL-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movlhps:			; BTVER2-LABEL: test_movlhps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0] sched: [1:0.50]			; BTVER2-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0] sched: [1:0.50]
	; BTVER2-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_movlhps:			; ZNVER1-LABEL: test_movlhps:
	Show All 32 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovlpd {{.*#+}} xmm1 = mem[0],xmm1[1] sched: [7:1.00]			; SANDY-NEXT: vmovlpd {{.*#+}} xmm1 = mem[0],xmm1[1] sched: [7:1.00]
	; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmovlps %xmm0, (%rdi) # sched: [5:1.00]			; SANDY-NEXT: vmovlps %xmm0, (%rdi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movlps:			; HASWELL-LABEL: test_movlps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovlpd {{.*#+}} xmm1 = mem[0],xmm1[1] sched: [5:1.00]			; HASWELL-NEXT: vmovlpd {{.*#+}} xmm1 = mem[0],xmm1[1] sched: [1:1.00]
	; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmovlps %xmm0, (%rdi) # sched: [1:1.00]			; HASWELL-NEXT: vmovlps %xmm0, (%rdi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movlps:			; BTVER2-LABEL: test_movlps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovlpd {{.*#+}} xmm1 = mem[0],xmm1[1] sched: [6:1.00]			; BTVER2-NEXT: vmovlpd {{.*#+}} xmm1 = mem[0],xmm1[1] sched: [6:1.00]
	; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vmovlps %xmm0, (%rdi) # sched: [1:1.00]			; BTVER2-NEXT: vmovlps %xmm0, (%rdi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 34 Lines
	; SANDY-LABEL: test_movmskps:			; SANDY-LABEL: test_movmskps:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovmskps %xmm0, %eax # sched: [2:1.00]			; SANDY-NEXT: vmovmskps %xmm0, %eax # sched: [2:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movmskps:			; HASWELL-LABEL: test_movmskps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovmskps %xmm0, %eax # sched: [3:1.00]			; HASWELL-NEXT: vmovmskps %xmm0, %eax # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movmskps:			; BTVER2-LABEL: test_movmskps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovmskps %xmm0, %eax # sched: [1:0.50]			; BTVER2-NEXT: vmovmskps %xmm0, %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_movmskps:			; ZNVER1-LABEL: test_movmskps:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 29 Lines
	; SANDY-LABEL: test_movntps:			; SANDY-LABEL: test_movntps:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovntps %xmm0, (%rdi) # sched: [5:1.00]			; SANDY-NEXT: vmovntps %xmm0, (%rdi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movntps:			; HASWELL-LABEL: test_movntps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovntps %xmm0, (%rdi) # sched: [1:1.00]			; HASWELL-NEXT: vmovntps %xmm0, (%rdi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movntps:			; BTVER2-LABEL: test_movntps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovntps %xmm0, (%rdi) # sched: [1:1.00]			; BTVER2-NEXT: vmovntps %xmm0, (%rdi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_movntps:			; ZNVER1-LABEL: test_movntps:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 29 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero sched: [6:0.50]			; SANDY-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero sched: [6:0.50]
	; SANDY-NEXT: vaddss %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddss %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmovss %xmm0, (%rsi) # sched: [5:1.00]			; SANDY-NEXT: vmovss %xmm0, (%rsi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movss_mem:			; HASWELL-LABEL: test_movss_mem:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero sched: [4:0.50]			; HASWELL-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero sched: [1:0.50]
	; HASWELL-NEXT: vaddss %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddss %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmovss %xmm0, (%rsi) # sched: [1:1.00]			; HASWELL-NEXT: vmovss %xmm0, (%rsi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movss_mem:			; BTVER2-LABEL: test_movss_mem:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero sched: [5:1.00]			; BTVER2-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero sched: [5:1.00]
	; BTVER2-NEXT: vaddss %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddss %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vmovss %xmm0, (%rsi) # sched: [1:1.00]			; BTVER2-NEXT: vmovss %xmm0, (%rsi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 34 Lines
	; SANDY-LABEL: test_movss_reg:			; SANDY-LABEL: test_movss_reg:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vblendps {{.*#+}} xmm0 = xmm1[0],xmm0[1,2,3] sched: [1:0.50]			; SANDY-NEXT: vblendps {{.*#+}} xmm0 = xmm1[0],xmm0[1,2,3] sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movss_reg:			; HASWELL-LABEL: test_movss_reg:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vblendps {{.*#+}} xmm0 = xmm1[0],xmm0[1,2,3] sched: [1:0.33]			; HASWELL-NEXT: vblendps {{.*#+}} xmm0 = xmm1[0],xmm0[1,2,3] sched: [1:0.33]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movss_reg:			; BTVER2-LABEL: test_movss_reg:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vblendps {{.*#+}} xmm0 = xmm1[0],xmm0[1,2,3] sched: [1:0.50]			; BTVER2-NEXT: vblendps {{.*#+}} xmm0 = xmm1[0],xmm0[1,2,3] sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_movss_reg:			; ZNVER1-LABEL: test_movss_reg:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 29 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovups (%rdi), %xmm0 # sched: [6:0.50]			; SANDY-NEXT: vmovups (%rdi), %xmm0 # sched: [6:0.50]
	; SANDY-NEXT: vaddps %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmovups %xmm0, (%rsi) # sched: [5:1.00]			; SANDY-NEXT: vmovups %xmm0, (%rsi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movups:			; HASWELL-LABEL: test_movups:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovups (%rdi), %xmm0 # sched: [4:0.50]			; HASWELL-NEXT: vmovups (%rdi), %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vaddps %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmovups %xmm0, (%rsi) # sched: [1:1.00]			; HASWELL-NEXT: vmovups %xmm0, (%rsi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movups:			; BTVER2-LABEL: test_movups:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovups (%rdi), %xmm0 # sched: [5:1.00]			; BTVER2-NEXT: vmovups (%rdi), %xmm0 # sched: [5:1.00]
	; BTVER2-NEXT: vaddps %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddps %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vmovups %xmm0, (%rsi) # sched: [1:1.00]			; BTVER2-NEXT: vmovups %xmm0, (%rsi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmulps %xmm1, %xmm0, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vmulps %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: vmulps (%rdi), %xmm0, %xmm0 # sched: [11:1.00]			; SANDY-NEXT: vmulps (%rdi), %xmm0, %xmm0 # sched: [11:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_mulps:			; HASWELL-LABEL: test_mulps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmulps %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vmulps %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: vmulps (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; HASWELL-NEXT: vmulps (%rdi), %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_mulps:			; BTVER2-LABEL: test_mulps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmulps %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; BTVER2-NEXT: vmulps %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; BTVER2-NEXT: vmulps (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vmulps (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_mulps:			; ZNVER1-LABEL: test_mulps:
	Show All 30 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmulss %xmm1, %xmm0, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vmulss %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: vmulss (%rdi), %xmm0, %xmm0 # sched: [11:1.00]			; SANDY-NEXT: vmulss (%rdi), %xmm0, %xmm0 # sched: [11:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_mulss:			; HASWELL-LABEL: test_mulss:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmulss %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vmulss %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: vmulss (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; HASWELL-NEXT: vmulss (%rdi), %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_mulss:			; BTVER2-LABEL: test_mulss:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmulss %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; BTVER2-NEXT: vmulss %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; BTVER2-NEXT: vmulss (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vmulss (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_mulss:			; ZNVER1-LABEL: test_mulss:
	Show All 34 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vorps %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vorps %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: vorps (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; SANDY-NEXT: vorps (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_orps:			; HASWELL-LABEL: test_orps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vorps %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vorps %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vorps (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vorps (%rdi), %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_orps:			; BTVER2-LABEL: test_orps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vorps %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vorps %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vorps (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vorps (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_orps:			; ZNVER1-LABEL: test_orps:
	Show All 35 Lines
	;			;
	; SANDY-LABEL: test_prefetchnta:			; SANDY-LABEL: test_prefetchnta:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: prefetchnta (%rdi) # sched: [5:0.50]			; SANDY-NEXT: prefetchnta (%rdi) # sched: [5:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_prefetchnta:			; HASWELL-LABEL: test_prefetchnta:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: prefetchnta (%rdi) # sched: [4:0.50]			; HASWELL-NEXT: prefetchnta (%rdi) # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_prefetchnta:			; BTVER2-LABEL: test_prefetchnta:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: prefetchnta (%rdi) # sched: [5:1.00]			; BTVER2-NEXT: prefetchnta (%rdi) # sched: [5:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_prefetchnta:			; ZNVER1-LABEL: test_prefetchnta:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 33 Lines
	; SANDY-NEXT: vrcpps %xmm0, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vrcpps %xmm0, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: vrcpps (%rdi), %xmm1 # sched: [11:1.00]			; SANDY-NEXT: vrcpps (%rdi), %xmm1 # sched: [11:1.00]
	; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_rcpps:			; HASWELL-LABEL: test_rcpps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpps %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vrcpps %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: vrcpps (%rdi), %xmm1 # sched: [9:1.00]			; HASWELL-NEXT: vrcpps (%rdi), %xmm1 # sched: [5:1.00]
	; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_rcpps:			; BTVER2-LABEL: test_rcpps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vrcpps (%rdi), %xmm1 # sched: [7:1.00]			; BTVER2-NEXT: vrcpps (%rdi), %xmm1 # sched: [7:1.00]
	; BTVER2-NEXT: vrcpps %xmm0, %xmm0 # sched: [2:1.00]			; BTVER2-NEXT: vrcpps %xmm0, %xmm0 # sched: [2:1.00]
	; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vrcpss %xmm0, %xmm0, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vrcpss %xmm0, %xmm0, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [6:0.50]			; SANDY-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [6:0.50]
	; SANDY-NEXT: vrcpss %xmm1, %xmm1, %xmm1 # sched: [5:1.00]			; SANDY-NEXT: vrcpss %xmm1, %xmm1, %xmm1 # sched: [5:1.00]
	; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_rcpss:			; HASWELL-LABEL: test_rcpss:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrcpss %xmm0, %xmm0, %xmm0 # sched: [9:1.00]			; HASWELL-NEXT: vrcpss %xmm0, %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [4:0.50]			; HASWELL-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [1:0.50]
	; HASWELL-NEXT: vrcpss %xmm1, %xmm1, %xmm1 # sched: [9:1.00]			; HASWELL-NEXT: vrcpss %xmm1, %xmm1, %xmm1 # sched: [5:1.00]
	; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_rcpss:			; BTVER2-LABEL: test_rcpss:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [5:1.00]			; BTVER2-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [5:1.00]
	; BTVER2-NEXT: vrcpss %xmm0, %xmm0, %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vrcpss %xmm0, %xmm0, %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: vrcpss %xmm1, %xmm1, %xmm1 # sched: [7:1.00]			; BTVER2-NEXT: vrcpss %xmm1, %xmm1, %xmm1 # sched: [7:1.00]
	; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vrsqrtps %xmm0, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vrsqrtps %xmm0, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: vrsqrtps (%rdi), %xmm1 # sched: [11:1.00]			; SANDY-NEXT: vrsqrtps (%rdi), %xmm1 # sched: [11:1.00]
	; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_rsqrtps:			; HASWELL-LABEL: test_rsqrtps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrsqrtps %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vrsqrtps %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: vrsqrtps (%rdi), %xmm1 # sched: [9:1.00]			; HASWELL-NEXT: vrsqrtps (%rdi), %xmm1 # sched: [5:1.00]
	; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_rsqrtps:			; BTVER2-LABEL: test_rsqrtps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vrsqrtps (%rdi), %xmm1 # sched: [7:1.00]			; BTVER2-NEXT: vrsqrtps (%rdi), %xmm1 # sched: [7:1.00]
	; BTVER2-NEXT: vrsqrtps %xmm0, %xmm0 # sched: [2:1.00]			; BTVER2-NEXT: vrsqrtps %xmm0, %xmm0 # sched: [2:1.00]
	; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [6:0.50]			; SANDY-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [6:0.50]
	; SANDY-NEXT: vrsqrtss %xmm1, %xmm1, %xmm1 # sched: [5:1.00]			; SANDY-NEXT: vrsqrtss %xmm1, %xmm1, %xmm1 # sched: [5:1.00]
	; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_rsqrtss:			; HASWELL-LABEL: test_rsqrtss:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vrsqrtss %xmm0, %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vrsqrtss %xmm0, %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [4:0.50]			; HASWELL-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [1:0.50]
	; HASWELL-NEXT: vrsqrtss %xmm1, %xmm1, %xmm1 # sched: [5:1.00]			; HASWELL-NEXT: vrsqrtss %xmm1, %xmm1, %xmm1 # sched: [5:1.00]
	; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_rsqrtss:			; BTVER2-LABEL: test_rsqrtss:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [5:1.00]			; BTVER2-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [5:1.00]
	; BTVER2-NEXT: vrsqrtss %xmm0, %xmm0, %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vrsqrtss %xmm0, %xmm0, %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: vrsqrtss %xmm1, %xmm1, %xmm1 # sched: [7:1.00]			; BTVER2-NEXT: vrsqrtss %xmm1, %xmm1, %xmm1 # sched: [7:1.00]
	; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	Show All 39 Lines
	;			;
	; SANDY-LABEL: test_sfence:			; SANDY-LABEL: test_sfence:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: sfence # sched: [1:1.00]			; SANDY-NEXT: sfence # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_sfence:			; HASWELL-LABEL: test_sfence:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: sfence # sched: [1:1.00]			; HASWELL-NEXT: sfence # sched: [1:0.33]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_sfence:			; BTVER2-LABEL: test_sfence:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: sfence # sched: [1:1.00]			; BTVER2-NEXT: sfence # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_sfence:			; ZNVER1-LABEL: test_sfence:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,0],xmm1[0,0] sched: [1:1.00]			; SANDY-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,0],xmm1[0,0] sched: [1:1.00]
	; SANDY-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,3],mem[0,0] sched: [7:1.00]			; SANDY-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,3],mem[0,0] sched: [7:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_shufps:			; HASWELL-LABEL: test_shufps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,0],xmm1[0,0] sched: [1:1.00]			; HASWELL-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,0],xmm1[0,0] sched: [1:1.00]
	; HASWELL-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,3],mem[0,0] sched: [5:1.00]			; HASWELL-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,3],mem[0,0] sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_shufps:			; BTVER2-LABEL: test_shufps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,0],xmm1[0,0] sched: [1:0.50]			; BTVER2-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,0],xmm1[0,0] sched: [1:0.50]
	; BTVER2-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,3],mem[0,0] sched: [6:1.00]			; BTVER2-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,3],mem[0,0] sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_shufps:			; ZNVER1-LABEL: test_shufps:
	Show All 34 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vsqrtps %xmm0, %xmm0 # sched: [14:1.00]			; SANDY-NEXT: vsqrtps %xmm0, %xmm0 # sched: [14:1.00]
	; SANDY-NEXT: vsqrtps (%rdi), %xmm1 # sched: [20:1.00]			; SANDY-NEXT: vsqrtps (%rdi), %xmm1 # sched: [20:1.00]
	; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_sqrtps:			; HASWELL-LABEL: test_sqrtps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vsqrtps %xmm0, %xmm0 # sched: [15:1.00]			; HASWELL-NEXT: vsqrtps %xmm0, %xmm0 # sched: [14:1.00]
	; HASWELL-NEXT: vsqrtps (%rdi), %xmm1 # sched: [19:1.00]			; HASWELL-NEXT: vsqrtps (%rdi), %xmm1 # sched: [14:1.00]
	; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_sqrtps:			; BTVER2-LABEL: test_sqrtps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vsqrtps (%rdi), %xmm1 # sched: [26:21.00]			; BTVER2-NEXT: vsqrtps (%rdi), %xmm1 # sched: [26:21.00]
	; BTVER2-NEXT: vsqrtps %xmm0, %xmm0 # sched: [21:21.00]			; BTVER2-NEXT: vsqrtps %xmm0, %xmm0 # sched: [21:21.00]
	; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vsqrtss %xmm0, %xmm0, %xmm0 # sched: [114:1.00]			; SANDY-NEXT: vsqrtss %xmm0, %xmm0, %xmm0 # sched: [114:1.00]
	; SANDY-NEXT: vmovaps (%rdi), %xmm1 # sched: [6:0.50]			; SANDY-NEXT: vmovaps (%rdi), %xmm1 # sched: [6:0.50]
	; SANDY-NEXT: vsqrtss %xmm1, %xmm1, %xmm1 # sched: [114:1.00]			; SANDY-NEXT: vsqrtss %xmm1, %xmm1, %xmm1 # sched: [114:1.00]
	; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_sqrtss:			; HASWELL-LABEL: test_sqrtss:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vsqrtss %xmm0, %xmm0, %xmm0 # sched: [19:1.00]			; HASWELL-NEXT: vsqrtss %xmm0, %xmm0, %xmm0 # sched: [14:1.00]
	; HASWELL-NEXT: vmovaps (%rdi), %xmm1 # sched: [4:0.50]			; HASWELL-NEXT: vmovaps (%rdi), %xmm1 # sched: [1:0.50]
	; HASWELL-NEXT: vsqrtss %xmm1, %xmm1, %xmm1 # sched: [19:1.00]			; HASWELL-NEXT: vsqrtss %xmm1, %xmm1, %xmm1 # sched: [14:1.00]
	; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_sqrtss:			; BTVER2-LABEL: test_sqrtss:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovaps (%rdi), %xmm1 # sched: [5:1.00]			; BTVER2-NEXT: vmovaps (%rdi), %xmm1 # sched: [5:1.00]
	; BTVER2-NEXT: vsqrtss %xmm0, %xmm0, %xmm0 # sched: [26:21.00]			; BTVER2-NEXT: vsqrtss %xmm0, %xmm0, %xmm0 # sched: [26:21.00]
	; BTVER2-NEXT: vsqrtss %xmm1, %xmm1, %xmm1 # sched: [26:21.00]			; BTVER2-NEXT: vsqrtss %xmm1, %xmm1, %xmm1 # sched: [26:21.00]
	; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	Show All 35 Lines
	; SANDY-LABEL: test_stmxcsr:			; SANDY-LABEL: test_stmxcsr:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vstmxcsr -{{[0-9]+}}(%rsp) # sched: [5:1.00]			; SANDY-NEXT: vstmxcsr -{{[0-9]+}}(%rsp) # sched: [5:1.00]
	; SANDY-NEXT: movl -{{[0-9]+}}(%rsp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl -{{[0-9]+}}(%rsp), %eax # sched: [5:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_stmxcsr:			; HASWELL-LABEL: test_stmxcsr:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vstmxcsr -{{[0-9]+}}(%rsp) # sched: [7:1.00]			; HASWELL-NEXT: vstmxcsr -{{[0-9]+}}(%rsp) # sched: [1:1.00]
	; HASWELL-NEXT: movl -{{[0-9]+}}(%rsp), %eax # sched: [4:0.50]			; HASWELL-NEXT: movl -{{[0-9]+}}(%rsp), %eax # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_stmxcsr:			; BTVER2-LABEL: test_stmxcsr:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vstmxcsr -{{[0-9]+}}(%rsp) # sched: [1:1.00]			; BTVER2-NEXT: vstmxcsr -{{[0-9]+}}(%rsp) # sched: [1:1.00]
	; BTVER2-NEXT: movl -{{[0-9]+}}(%rsp), %eax # sched: [5:1.00]			; BTVER2-NEXT: movl -{{[0-9]+}}(%rsp), %eax # sched: [5:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_stmxcsr:			; ZNVER1-LABEL: test_stmxcsr:
	Show All 32 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vsubps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vsubps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vsubps (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vsubps (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_subps:			; HASWELL-LABEL: test_subps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vsubps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vsubps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vsubps (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vsubps (%rdi), %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_subps:			; BTVER2-LABEL: test_subps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vsubps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vsubps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vsubps (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vsubps (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_subps:			; ZNVER1-LABEL: test_subps:
	Show All 30 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vsubss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vsubss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vsubss (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vsubss (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_subss:			; HASWELL-LABEL: test_subss:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vsubss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vsubss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vsubss (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vsubss (%rdi), %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_subss:			; BTVER2-LABEL: test_subss:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vsubss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vsubss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vsubss (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vsubss (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_subss:			; ZNVER1-LABEL: test_subss:
	▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
	; HASWELL-NEXT: sete %cl # sched: [1:0.50]			; HASWELL-NEXT: sete %cl # sched: [1:0.50]
	; HASWELL-NEXT: andb %al, %cl # sched: [1:0.25]			; HASWELL-NEXT: andb %al, %cl # sched: [1:0.25]
	; HASWELL-NEXT: vucomiss (%rdi), %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vucomiss (%rdi), %xmm0 # sched: [7:1.00]
	; HASWELL-NEXT: setnp %al # sched: [1:0.50]			; HASWELL-NEXT: setnp %al # sched: [1:0.50]
	; HASWELL-NEXT: sete %dl # sched: [1:0.50]			; HASWELL-NEXT: sete %dl # sched: [1:0.50]
	; HASWELL-NEXT: andb %al, %dl # sched: [1:0.25]			; HASWELL-NEXT: andb %al, %dl # sched: [1:0.25]
	; HASWELL-NEXT: orb %cl, %dl # sched: [1:0.25]			; HASWELL-NEXT: orb %cl, %dl # sched: [1:0.25]
	; HASWELL-NEXT: movzbl %dl, %eax # sched: [1:0.25]			; HASWELL-NEXT: movzbl %dl, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_ucomiss:			; BTVER2-LABEL: test_ucomiss:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vucomiss %xmm1, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vucomiss %xmm1, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: setnp %al # sched: [1:0.50]			; BTVER2-NEXT: setnp %al # sched: [1:0.50]
	; BTVER2-NEXT: sete %cl # sched: [1:0.50]			; BTVER2-NEXT: sete %cl # sched: [1:0.50]
	; BTVER2-NEXT: andb %al, %cl # sched: [1:0.50]			; BTVER2-NEXT: andb %al, %cl # sched: [1:0.50]
	; BTVER2-NEXT: vucomiss (%rdi), %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vucomiss (%rdi), %xmm0 # sched: [8:1.00]
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vunpckhps {{.*#+}} xmm0 = xmm0[2],xmm1[2],xmm0[3],xmm1[3] sched: [1:1.00]			; SANDY-NEXT: vunpckhps {{.*#+}} xmm0 = xmm0[2],xmm1[2],xmm0[3],xmm1[3] sched: [1:1.00]
	; SANDY-NEXT: vunpckhps {{.*#+}} xmm0 = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]			; SANDY-NEXT: vunpckhps {{.*#+}} xmm0 = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_unpckhps:			; HASWELL-LABEL: test_unpckhps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vunpckhps {{.*#+}} xmm0 = xmm0[2],xmm1[2],xmm0[3],xmm1[3] sched: [1:1.00]			; HASWELL-NEXT: vunpckhps {{.*#+}} xmm0 = xmm0[2],xmm1[2],xmm0[3],xmm1[3] sched: [1:1.00]
	; HASWELL-NEXT: vunpckhps {{.*#+}} xmm0 = xmm0[2],mem[2],xmm0[3],mem[3] sched: [5:1.00]			; HASWELL-NEXT: vunpckhps {{.*#+}} xmm0 = xmm0[2],mem[2],xmm0[3],mem[3] sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_unpckhps:			; BTVER2-LABEL: test_unpckhps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vunpckhps {{.*#+}} xmm0 = xmm0[2],xmm1[2],xmm0[3],xmm1[3] sched: [1:0.50]			; BTVER2-NEXT: vunpckhps {{.*#+}} xmm0 = xmm0[2],xmm1[2],xmm0[3],xmm1[3] sched: [1:0.50]
	; BTVER2-NEXT: vunpckhps {{.*#+}} xmm0 = xmm0[2],mem[2],xmm0[3],mem[3] sched: [6:1.00]			; BTVER2-NEXT: vunpckhps {{.*#+}} xmm0 = xmm0[2],mem[2],xmm0[3],mem[3] sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_unpckhps:			; ZNVER1-LABEL: test_unpckhps:
	Show All 34 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vunpcklps {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1] sched: [1:1.00]			; SANDY-NEXT: vunpcklps {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1] sched: [1:1.00]
	; SANDY-NEXT: vunpcklps {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]			; SANDY-NEXT: vunpcklps {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_unpcklps:			; HASWELL-LABEL: test_unpcklps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vunpcklps {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1] sched: [1:1.00]			; HASWELL-NEXT: vunpcklps {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1] sched: [1:1.00]
	; HASWELL-NEXT: vunpcklps {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1] sched: [5:1.00]			; HASWELL-NEXT: vunpcklps {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1] sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_unpcklps:			; BTVER2-LABEL: test_unpcklps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vunpcklps {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1] sched: [1:0.50]			; BTVER2-NEXT: vunpcklps {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1] sched: [1:0.50]
	; BTVER2-NEXT: vunpcklps {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1] sched: [6:1.00]			; BTVER2-NEXT: vunpcklps {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1] sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_unpcklps:			; ZNVER1-LABEL: test_unpcklps:
	Show All 34 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vxorps %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vxorps %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: vxorps (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; SANDY-NEXT: vxorps (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_xorps:			; HASWELL-LABEL: test_xorps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vxorps %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vxorps %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vxorps (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vxorps (%rdi), %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_xorps:			; BTVER2-LABEL: test_xorps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vxorps %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vxorps %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vxorps (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vxorps (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_xorps:			; ZNVER1-LABEL: test_xorps:
	Show All 15 Lines

test/CodeGen/X86/sse2-schedule.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vaddpd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vaddpd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_addpd:			; HASWELL-LABEL: test_addpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vaddpd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vaddpd (%rdi), %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_addpd:			; BTVER2-LABEL: test_addpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vaddpd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vaddpd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_addpd:			; ZNVER1-LABEL: test_addpd:
	Show All 30 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vaddsd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vaddsd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_addsd:			; HASWELL-LABEL: test_addsd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vaddsd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vaddsd (%rdi), %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_addsd:			; BTVER2-LABEL: test_addsd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vaddsd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vaddsd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_addsd:			; ZNVER1-LABEL: test_addsd:
	Show All 34 Lines
	; SANDY-NEXT: vandpd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vandpd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: vandpd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; SANDY-NEXT: vandpd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; SANDY-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_andpd:			; HASWELL-LABEL: test_andpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vandpd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vandpd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vandpd (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vandpd (%rdi), %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_andpd:			; BTVER2-LABEL: test_andpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vandpd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vandpd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vandpd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vandpd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vandnpd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vandnpd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: vandnpd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; SANDY-NEXT: vandnpd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; SANDY-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_andnotpd:			; HASWELL-LABEL: test_andnotpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vandnpd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vandnpd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vandnpd (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vandnpd (%rdi), %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_andnotpd:			; BTVER2-LABEL: test_andnotpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vandnpd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vandnpd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vandnpd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vandnpd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm1 # sched: [3:1.00]			; SANDY-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm1 # sched: [3:1.00]
	; SANDY-NEXT: vcmpeqpd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vcmpeqpd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: vorpd %xmm0, %xmm1, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vorpd %xmm0, %xmm1, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cmppd:			; HASWELL-LABEL: test_cmppd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm1 # sched: [3:1.00]			; HASWELL-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm1 # sched: [3:1.00]
	; HASWELL-NEXT: vcmpeqpd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vcmpeqpd (%rdi), %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vorpd %xmm0, %xmm1, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vorpd %xmm0, %xmm1, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cmppd:			; BTVER2-LABEL: test_cmppd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm1 # sched: [3:1.00]			; BTVER2-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm1 # sched: [3:1.00]
	; BTVER2-NEXT: vcmpeqpd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vcmpeqpd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: vorpd %xmm0, %xmm1, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vorpd %xmm0, %xmm1, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 36 Lines
	; SANDY-NEXT: vcmpeqsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vcmpeqsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vcmpeqsd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; SANDY-NEXT: vcmpeqsd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cmpsd:			; HASWELL-LABEL: test_cmpsd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcmpeqsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vcmpeqsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vcmpeqsd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vcmpeqsd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cmpsd:			; BTVER2-LABEL: test_cmpsd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcmpeqsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcmpeqsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vcmpeqsd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vcmpeqsd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_cmpsd:			; ZNVER1-LABEL: test_cmpsd:
	▲ Show 20 Lines • Show All 76 Lines • ▼ Show 20 Lines
	; HASWELL-NEXT: sete %cl # sched: [1:0.50]			; HASWELL-NEXT: sete %cl # sched: [1:0.50]
	; HASWELL-NEXT: andb %al, %cl # sched: [1:0.25]			; HASWELL-NEXT: andb %al, %cl # sched: [1:0.25]
	; HASWELL-NEXT: vcomisd (%rdi), %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vcomisd (%rdi), %xmm0 # sched: [7:1.00]
	; HASWELL-NEXT: setnp %al # sched: [1:0.50]			; HASWELL-NEXT: setnp %al # sched: [1:0.50]
	; HASWELL-NEXT: sete %dl # sched: [1:0.50]			; HASWELL-NEXT: sete %dl # sched: [1:0.50]
	; HASWELL-NEXT: andb %al, %dl # sched: [1:0.25]			; HASWELL-NEXT: andb %al, %dl # sched: [1:0.25]
	; HASWELL-NEXT: orb %cl, %dl # sched: [1:0.25]			; HASWELL-NEXT: orb %cl, %dl # sched: [1:0.25]
	; HASWELL-NEXT: movzbl %dl, %eax # sched: [1:0.25]			; HASWELL-NEXT: movzbl %dl, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_comisd:			; BTVER2-LABEL: test_comisd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcomisd %xmm1, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcomisd %xmm1, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: setnp %al # sched: [1:0.50]			; BTVER2-NEXT: setnp %al # sched: [1:0.50]
	; BTVER2-NEXT: sete %cl # sched: [1:0.50]			; BTVER2-NEXT: sete %cl # sched: [1:0.50]
	; BTVER2-NEXT: andb %al, %cl # sched: [1:0.50]			; BTVER2-NEXT: andb %al, %cl # sched: [1:0.50]
	; BTVER2-NEXT: vcomisd (%rdi), %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vcomisd (%rdi), %xmm0 # sched: [8:1.00]
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vcvtdq2pd %xmm0, %xmm0 # sched: [4:1.00]			; SANDY-NEXT: vcvtdq2pd %xmm0, %xmm0 # sched: [4:1.00]
	; SANDY-NEXT: vcvtdq2pd (%rdi), %xmm1 # sched: [10:1.00]			; SANDY-NEXT: vcvtdq2pd (%rdi), %xmm1 # sched: [10:1.00]
	; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtdq2pd:			; HASWELL-LABEL: test_cvtdq2pd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtdq2pd %xmm0, %xmm0 # sched: [4:1.00]			; HASWELL-NEXT: vcvtdq2pd %xmm0, %xmm0 # sched: [4:1.00]
	; HASWELL-NEXT: vcvtdq2pd (%rdi), %xmm1 # sched: [8:1.00]			; HASWELL-NEXT: vcvtdq2pd (%rdi), %xmm1 # sched: [4:1.00]
	; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtdq2pd:			; BTVER2-LABEL: test_cvtdq2pd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtdq2pd (%rdi), %xmm1 # sched: [8:1.00]			; BTVER2-NEXT: vcvtdq2pd (%rdi), %xmm1 # sched: [8:1.00]
	; BTVER2-NEXT: vcvtdq2pd %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvtdq2pd %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 39 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vcvtdq2ps %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vcvtdq2ps %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vcvtdq2ps (%rdi), %xmm1 # sched: [9:1.00]			; SANDY-NEXT: vcvtdq2ps (%rdi), %xmm1 # sched: [9:1.00]
	; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtdq2ps:			; HASWELL-LABEL: test_cvtdq2ps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtdq2ps %xmm0, %xmm0 # sched: [4:1.00]			; HASWELL-NEXT: vcvtdq2ps %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vcvtdq2ps (%rdi), %xmm1 # sched: [8:1.00]			; HASWELL-NEXT: vcvtdq2ps (%rdi), %xmm1 # sched: [3:1.00]
	; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtdq2ps:			; BTVER2-LABEL: test_cvtdq2ps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtdq2ps (%rdi), %xmm1 # sched: [8:1.00]			; BTVER2-NEXT: vcvtdq2ps (%rdi), %xmm1 # sched: [8:1.00]
	; BTVER2-NEXT: vcvtdq2ps %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvtdq2ps %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 38 Lines
	; SANDY-NEXT: vcvtpd2dq %xmm0, %xmm0 # sched: [4:1.00]			; SANDY-NEXT: vcvtpd2dq %xmm0, %xmm0 # sched: [4:1.00]
	; SANDY-NEXT: vcvtpd2dqx (%rdi), %xmm1 # sched: [10:1.00]			; SANDY-NEXT: vcvtpd2dqx (%rdi), %xmm1 # sched: [10:1.00]
	; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtpd2dq:			; HASWELL-LABEL: test_cvtpd2dq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtpd2dq %xmm0, %xmm0 # sched: [4:1.00]			; HASWELL-NEXT: vcvtpd2dq %xmm0, %xmm0 # sched: [4:1.00]
	; HASWELL-NEXT: vcvtpd2dqx (%rdi), %xmm1 # sched: [8:1.00]			; HASWELL-NEXT: vcvtpd2dqx (%rdi), %xmm1 # sched: [7:1.00]
	; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtpd2dq:			; BTVER2-LABEL: test_cvtpd2dq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtpd2dqx (%rdi), %xmm1 # sched: [8:1.00]			; BTVER2-NEXT: vcvtpd2dqx (%rdi), %xmm1 # sched: [8:1.00]
	; BTVER2-NEXT: vcvtpd2dq %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvtpd2dq %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 39 Lines
	; SANDY-NEXT: vcvtpd2ps %xmm0, %xmm0 # sched: [4:1.00]			; SANDY-NEXT: vcvtpd2ps %xmm0, %xmm0 # sched: [4:1.00]
	; SANDY-NEXT: vcvtpd2psx (%rdi), %xmm1 # sched: [10:1.00]			; SANDY-NEXT: vcvtpd2psx (%rdi), %xmm1 # sched: [10:1.00]
	; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtpd2ps:			; HASWELL-LABEL: test_cvtpd2ps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtpd2ps %xmm0, %xmm0 # sched: [4:1.00]			; HASWELL-NEXT: vcvtpd2ps %xmm0, %xmm0 # sched: [4:1.00]
	; HASWELL-NEXT: vcvtpd2psx (%rdi), %xmm1 # sched: [8:1.00]			; HASWELL-NEXT: vcvtpd2psx (%rdi), %xmm1 # sched: [7:1.00]
	; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtpd2ps:			; BTVER2-LABEL: test_cvtpd2ps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtpd2psx (%rdi), %xmm1 # sched: [8:1.00]			; BTVER2-NEXT: vcvtpd2psx (%rdi), %xmm1 # sched: [8:1.00]
	; BTVER2-NEXT: vcvtpd2ps %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvtpd2ps %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 39 Lines
	; SANDY-NEXT: vcvtps2dq %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vcvtps2dq %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vcvtps2dq (%rdi), %xmm1 # sched: [9:1.00]			; SANDY-NEXT: vcvtps2dq (%rdi), %xmm1 # sched: [9:1.00]
	; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtps2dq:			; HASWELL-LABEL: test_cvtps2dq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtps2dq %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vcvtps2dq %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vcvtps2dq (%rdi), %xmm1 # sched: [7:1.00]			; HASWELL-NEXT: vcvtps2dq (%rdi), %xmm1 # sched: [3:1.00]
	; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtps2dq:			; BTVER2-LABEL: test_cvtps2dq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtps2dq (%rdi), %xmm1 # sched: [8:1.00]			; BTVER2-NEXT: vcvtps2dq (%rdi), %xmm1 # sched: [8:1.00]
	; BTVER2-NEXT: vcvtps2dq %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvtps2dq %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 39 Lines
	; SANDY-NEXT: vcvtps2pd %xmm0, %xmm0 # sched: [2:1.00]			; SANDY-NEXT: vcvtps2pd %xmm0, %xmm0 # sched: [2:1.00]
	; SANDY-NEXT: vcvtps2pd (%rdi), %xmm1 # sched: [7:1.00]			; SANDY-NEXT: vcvtps2pd (%rdi), %xmm1 # sched: [7:1.00]
	; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtps2pd:			; HASWELL-LABEL: test_cvtps2pd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtps2pd %xmm0, %xmm0 # sched: [2:1.00]			; HASWELL-NEXT: vcvtps2pd %xmm0, %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: vcvtps2pd (%rdi), %xmm1 # sched: [5:1.00]			; HASWELL-NEXT: vcvtps2pd (%rdi), %xmm1 # sched: [1:1.00]
	; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtps2pd:			; BTVER2-LABEL: test_cvtps2pd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtps2pd (%rdi), %xmm1 # sched: [8:1.00]			; BTVER2-NEXT: vcvtps2pd (%rdi), %xmm1 # sched: [8:1.00]
	; BTVER2-NEXT: vcvtps2pd %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvtps2pd %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 39 Lines
	; SANDY-NEXT: vcvtsd2si %xmm0, %ecx # sched: [5:1.00]			; SANDY-NEXT: vcvtsd2si %xmm0, %ecx # sched: [5:1.00]
	; SANDY-NEXT: vcvtsd2si (%rdi), %eax # sched: [10:1.00]			; SANDY-NEXT: vcvtsd2si (%rdi), %eax # sched: [10:1.00]
	; SANDY-NEXT: addl %ecx, %eax # sched: [1:0.33]			; SANDY-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtsd2si:			; HASWELL-LABEL: test_cvtsd2si:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtsd2si %xmm0, %ecx # sched: [4:1.00]			; HASWELL-NEXT: vcvtsd2si %xmm0, %ecx # sched: [4:1.00]
	; HASWELL-NEXT: vcvtsd2si (%rdi), %eax # sched: [8:1.00]			; HASWELL-NEXT: vcvtsd2si (%rdi), %eax # sched: [4:1.00]
	; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]			; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtsd2si:			; BTVER2-LABEL: test_cvtsd2si:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtsd2si (%rdi), %eax # sched: [8:1.00]			; BTVER2-NEXT: vcvtsd2si (%rdi), %eax # sched: [8:1.00]
	; BTVER2-NEXT: vcvtsd2si %xmm0, %ecx # sched: [3:1.00]			; BTVER2-NEXT: vcvtsd2si %xmm0, %ecx # sched: [3:1.00]
	; BTVER2-NEXT: addl %ecx, %eax # sched: [1:0.50]			; BTVER2-NEXT: addl %ecx, %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 40 Lines
	; SANDY-NEXT: vcvtsd2si %xmm0, %rcx # sched: [5:1.00]			; SANDY-NEXT: vcvtsd2si %xmm0, %rcx # sched: [5:1.00]
	; SANDY-NEXT: vcvtsd2si (%rdi), %rax # sched: [10:1.00]			; SANDY-NEXT: vcvtsd2si (%rdi), %rax # sched: [10:1.00]
	; SANDY-NEXT: addq %rcx, %rax # sched: [1:0.33]			; SANDY-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtsd2siq:			; HASWELL-LABEL: test_cvtsd2siq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtsd2si %xmm0, %rcx # sched: [4:1.00]			; HASWELL-NEXT: vcvtsd2si %xmm0, %rcx # sched: [4:1.00]
	; HASWELL-NEXT: vcvtsd2si (%rdi), %rax # sched: [8:1.00]			; HASWELL-NEXT: vcvtsd2si (%rdi), %rax # sched: [4:1.00]
	; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]			; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtsd2siq:			; BTVER2-LABEL: test_cvtsd2siq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtsd2si (%rdi), %rax # sched: [8:1.00]			; BTVER2-NEXT: vcvtsd2si (%rdi), %rax # sched: [8:1.00]
	; BTVER2-NEXT: vcvtsd2si %xmm0, %rcx # sched: [3:1.00]			; BTVER2-NEXT: vcvtsd2si %xmm0, %rcx # sched: [3:1.00]
	; BTVER2-NEXT: addq %rcx, %rax # sched: [1:0.50]			; BTVER2-NEXT: addq %rcx, %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero sched: [6:0.50]			; SANDY-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero sched: [6:0.50]
	; SANDY-NEXT: vcvtsd2ss %xmm1, %xmm1, %xmm1 # sched: [4:1.00]			; SANDY-NEXT: vcvtsd2ss %xmm1, %xmm1, %xmm1 # sched: [4:1.00]
	; SANDY-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtsd2ss:			; HASWELL-LABEL: test_cvtsd2ss:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtsd2ss %xmm0, %xmm0, %xmm0 # sched: [4:1.00]			; HASWELL-NEXT: vcvtsd2ss %xmm0, %xmm0, %xmm0 # sched: [4:1.00]
	; HASWELL-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero sched: [4:0.50]			; HASWELL-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero sched: [1:0.50]
	; HASWELL-NEXT: vcvtsd2ss %xmm1, %xmm1, %xmm1 # sched: [4:1.00]			; HASWELL-NEXT: vcvtsd2ss %xmm1, %xmm1, %xmm1 # sched: [4:1.00]
	; HASWELL-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtsd2ss:			; BTVER2-LABEL: test_cvtsd2ss:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero sched: [5:1.00]			; BTVER2-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero sched: [5:1.00]
	; BTVER2-NEXT: vcvtsd2ss %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvtsd2ss %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vcvtsd2ss %xmm1, %xmm1, %xmm1 # sched: [3:1.00]			; BTVER2-NEXT: vcvtsd2ss %xmm1, %xmm1, %xmm1 # sched: [3:1.00]
	; BTVER2-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddss %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtsi2sd:			; HASWELL-LABEL: test_cvtsi2sd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtsi2sdl %edi, %xmm0, %xmm0 # sched: [4:1.00]			; HASWELL-NEXT: vcvtsi2sdl %edi, %xmm0, %xmm0 # sched: [4:1.00]
	; HASWELL-NEXT: vcvtsi2sdl (%rsi), %xmm1, %xmm1 # sched: [8:1.00]			; HASWELL-NEXT: vcvtsi2sdl (%rsi), %xmm1, %xmm1 # sched: [8:1.00]
	; HASWELL-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtsi2sd:			; BTVER2-LABEL: test_cvtsi2sd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtsi2sdl %edi, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvtsi2sdl %edi, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vcvtsi2sdl (%rsi), %xmm1, %xmm1 # sched: [8:1.00]			; BTVER2-NEXT: vcvtsi2sdl (%rsi), %xmm1, %xmm1 # sched: [8:1.00]
	; BTVER2-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 39 Lines
	; SANDY-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtsi2sdq:			; HASWELL-LABEL: test_cvtsi2sdq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtsi2sdq %rdi, %xmm0, %xmm0 # sched: [4:1.00]			; HASWELL-NEXT: vcvtsi2sdq %rdi, %xmm0, %xmm0 # sched: [4:1.00]
	; HASWELL-NEXT: vcvtsi2sdq (%rsi), %xmm1, %xmm1 # sched: [8:1.00]			; HASWELL-NEXT: vcvtsi2sdq (%rsi), %xmm1, %xmm1 # sched: [8:1.00]
	; HASWELL-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtsi2sdq:			; BTVER2-LABEL: test_cvtsi2sdq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvtsi2sdq %rdi, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvtsi2sdq %rdi, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vcvtsi2sdq (%rsi), %xmm1, %xmm1 # sched: [8:1.00]			; BTVER2-NEXT: vcvtsi2sdq (%rsi), %xmm1, %xmm1 # sched: [8:1.00]
	; BTVER2-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [6:0.50]			; SANDY-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [6:0.50]
	; SANDY-NEXT: vcvtss2sd %xmm1, %xmm1, %xmm1 # sched: [1:1.00]			; SANDY-NEXT: vcvtss2sd %xmm1, %xmm1, %xmm1 # sched: [1:1.00]
	; SANDY-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvtss2sd:			; HASWELL-LABEL: test_cvtss2sd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvtss2sd %xmm0, %xmm0, %xmm0 # sched: [2:1.00]			; HASWELL-NEXT: vcvtss2sd %xmm0, %xmm0, %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [4:0.50]			; HASWELL-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [1:0.50]
	; HASWELL-NEXT: vcvtss2sd %xmm1, %xmm1, %xmm1 # sched: [2:1.00]			; HASWELL-NEXT: vcvtss2sd %xmm1, %xmm1, %xmm1 # sched: [2:1.00]
	; HASWELL-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvtss2sd:			; BTVER2-LABEL: test_cvtss2sd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [5:1.00]			; BTVER2-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero sched: [5:1.00]
	; BTVER2-NEXT: vcvtss2sd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvtss2sd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vcvtss2sd %xmm1, %xmm1, %xmm1 # sched: [3:1.00]			; BTVER2-NEXT: vcvtss2sd %xmm1, %xmm1, %xmm1 # sched: [3:1.00]
	; BTVER2-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	Show All 40 Lines
	; SANDY-NEXT: vcvttpd2dq %xmm0, %xmm0 # sched: [4:1.00]			; SANDY-NEXT: vcvttpd2dq %xmm0, %xmm0 # sched: [4:1.00]
	; SANDY-NEXT: vcvttpd2dqx (%rdi), %xmm1 # sched: [10:1.00]			; SANDY-NEXT: vcvttpd2dqx (%rdi), %xmm1 # sched: [10:1.00]
	; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvttpd2dq:			; HASWELL-LABEL: test_cvttpd2dq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvttpd2dq %xmm0, %xmm0 # sched: [4:1.00]			; HASWELL-NEXT: vcvttpd2dq %xmm0, %xmm0 # sched: [4:1.00]
	; HASWELL-NEXT: vcvttpd2dqx (%rdi), %xmm1 # sched: [8:1.00]			; HASWELL-NEXT: vcvttpd2dqx (%rdi), %xmm1 # sched: [7:1.00]
	; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvttpd2dq:			; BTVER2-LABEL: test_cvttpd2dq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvttpd2dqx (%rdi), %xmm1 # sched: [8:1.00]			; BTVER2-NEXT: vcvttpd2dqx (%rdi), %xmm1 # sched: [8:1.00]
	; BTVER2-NEXT: vcvttpd2dq %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvttpd2dq %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 40 Lines
	; SANDY-NEXT: vcvttps2dq %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vcvttps2dq %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vcvttps2dq (%rdi), %xmm1 # sched: [9:1.00]			; SANDY-NEXT: vcvttps2dq (%rdi), %xmm1 # sched: [9:1.00]
	; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvttps2dq:			; HASWELL-LABEL: test_cvttps2dq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvttps2dq %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vcvttps2dq %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vcvttps2dq (%rdi), %xmm1 # sched: [7:1.00]			; HASWELL-NEXT: vcvttps2dq (%rdi), %xmm1 # sched: [3:1.00]
	; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvttps2dq:			; BTVER2-LABEL: test_cvttps2dq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvttps2dq (%rdi), %xmm1 # sched: [8:1.00]			; BTVER2-NEXT: vcvttps2dq (%rdi), %xmm1 # sched: [8:1.00]
	; BTVER2-NEXT: vcvttps2dq %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vcvttps2dq %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 37 Lines
	; SANDY-NEXT: vcvttsd2si %xmm0, %ecx # sched: [5:1.00]			; SANDY-NEXT: vcvttsd2si %xmm0, %ecx # sched: [5:1.00]
	; SANDY-NEXT: vcvttsd2si (%rdi), %eax # sched: [10:1.00]			; SANDY-NEXT: vcvttsd2si (%rdi), %eax # sched: [10:1.00]
	; SANDY-NEXT: addl %ecx, %eax # sched: [1:0.33]			; SANDY-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvttsd2si:			; HASWELL-LABEL: test_cvttsd2si:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvttsd2si %xmm0, %ecx # sched: [4:1.00]			; HASWELL-NEXT: vcvttsd2si %xmm0, %ecx # sched: [4:1.00]
	; HASWELL-NEXT: vcvttsd2si (%rdi), %eax # sched: [8:1.00]			; HASWELL-NEXT: vcvttsd2si (%rdi), %eax # sched: [4:1.00]
	; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]			; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvttsd2si:			; BTVER2-LABEL: test_cvttsd2si:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvttsd2si (%rdi), %eax # sched: [8:1.00]			; BTVER2-NEXT: vcvttsd2si (%rdi), %eax # sched: [8:1.00]
	; BTVER2-NEXT: vcvttsd2si %xmm0, %ecx # sched: [3:1.00]			; BTVER2-NEXT: vcvttsd2si %xmm0, %ecx # sched: [3:1.00]
	; BTVER2-NEXT: addl %ecx, %eax # sched: [1:0.50]			; BTVER2-NEXT: addl %ecx, %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 37 Lines
	; SANDY-NEXT: vcvttsd2si %xmm0, %rcx # sched: [5:1.00]			; SANDY-NEXT: vcvttsd2si %xmm0, %rcx # sched: [5:1.00]
	; SANDY-NEXT: vcvttsd2si (%rdi), %rax # sched: [10:1.00]			; SANDY-NEXT: vcvttsd2si (%rdi), %rax # sched: [10:1.00]
	; SANDY-NEXT: addq %rcx, %rax # sched: [1:0.33]			; SANDY-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_cvttsd2siq:			; HASWELL-LABEL: test_cvttsd2siq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vcvttsd2si %xmm0, %rcx # sched: [4:1.00]			; HASWELL-NEXT: vcvttsd2si %xmm0, %rcx # sched: [4:1.00]
	; HASWELL-NEXT: vcvttsd2si (%rdi), %rax # sched: [8:1.00]			; HASWELL-NEXT: vcvttsd2si (%rdi), %rax # sched: [4:1.00]
	; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]			; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_cvttsd2siq:			; BTVER2-LABEL: test_cvttsd2siq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vcvttsd2si (%rdi), %rax # sched: [8:1.00]			; BTVER2-NEXT: vcvttsd2si (%rdi), %rax # sched: [8:1.00]
	; BTVER2-NEXT: vcvttsd2si %xmm0, %rcx # sched: [3:1.00]			; BTVER2-NEXT: vcvttsd2si %xmm0, %rcx # sched: [3:1.00]
	; BTVER2-NEXT: addq %rcx, %rax # sched: [1:0.50]			; BTVER2-NEXT: addq %rcx, %rax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY-LABEL: test_divpd:			; SANDY-LABEL: test_divpd:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vdivpd %xmm1, %xmm0, %xmm0 # sched: [22:1.00]			; SANDY-NEXT: vdivpd %xmm1, %xmm0, %xmm0 # sched: [22:1.00]
	; SANDY-NEXT: vdivpd (%rdi), %xmm0, %xmm0 # sched: [28:1.00]			; SANDY-NEXT: vdivpd (%rdi), %xmm0, %xmm0 # sched: [28:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_divpd:			; HASWELL-LABEL: test_divpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vdivpd %xmm1, %xmm0, %xmm0 # sched: [12:1.00]			; HASWELL-NEXT: vdivpd %xmm1, %xmm0, %xmm0 # sched: [20:1.00]
	; HASWELL-NEXT: vdivpd (%rdi), %xmm0, %xmm0 # sched: [16:1.00]			; HASWELL-NEXT: vdivpd (%rdi), %xmm0, %xmm0 # sched: [20:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_divpd:			; BTVER2-LABEL: test_divpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vdivpd %xmm1, %xmm0, %xmm0 # sched: [19:19.00]			; BTVER2-NEXT: vdivpd %xmm1, %xmm0, %xmm0 # sched: [19:19.00]
	; BTVER2-NEXT: vdivpd (%rdi), %xmm0, %xmm0 # sched: [24:19.00]			; BTVER2-NEXT: vdivpd (%rdi), %xmm0, %xmm0 # sched: [24:19.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_divpd:			; ZNVER1-LABEL: test_divpd:
	Show All 29 Lines
	; SANDY-LABEL: test_divsd:			; SANDY-LABEL: test_divsd:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vdivsd %xmm1, %xmm0, %xmm0 # sched: [22:1.00]			; SANDY-NEXT: vdivsd %xmm1, %xmm0, %xmm0 # sched: [22:1.00]
	; SANDY-NEXT: vdivsd (%rdi), %xmm0, %xmm0 # sched: [28:1.00]			; SANDY-NEXT: vdivsd (%rdi), %xmm0, %xmm0 # sched: [28:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_divsd:			; HASWELL-LABEL: test_divsd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vdivsd %xmm1, %xmm0, %xmm0 # sched: [12:1.00]			; HASWELL-NEXT: vdivsd %xmm1, %xmm0, %xmm0 # sched: [20:1.00]
	; HASWELL-NEXT: vdivsd (%rdi), %xmm0, %xmm0 # sched: [16:1.00]			; HASWELL-NEXT: vdivsd (%rdi), %xmm0, %xmm0 # sched: [20:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_divsd:			; BTVER2-LABEL: test_divsd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vdivsd %xmm1, %xmm0, %xmm0 # sched: [19:19.00]			; BTVER2-NEXT: vdivsd %xmm1, %xmm0, %xmm0 # sched: [19:19.00]
	; BTVER2-NEXT: vdivsd (%rdi), %xmm0, %xmm0 # sched: [24:19.00]			; BTVER2-NEXT: vdivsd (%rdi), %xmm0, %xmm0 # sched: [24:19.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_divsd:			; ZNVER1-LABEL: test_divsd:
	Show All 31 Lines
	;			;
	; SANDY-LABEL: test_lfence:			; SANDY-LABEL: test_lfence:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: lfence # sched: [1:1.00]			; SANDY-NEXT: lfence # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lfence:			; HASWELL-LABEL: test_lfence:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: lfence # sched: [1:1.00]			; HASWELL-NEXT: lfence # sched: [2:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lfence:			; BTVER2-LABEL: test_lfence:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: lfence # sched: [1:1.00]			; BTVER2-NEXT: lfence # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_lfence:			; ZNVER1-LABEL: test_lfence:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 28 Lines
	;			;
	; SANDY-LABEL: test_mfence:			; SANDY-LABEL: test_mfence:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: mfence # sched: [1:1.00]			; SANDY-NEXT: mfence # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_mfence:			; HASWELL-LABEL: test_mfence:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: mfence # sched: [1:1.00]			; HASWELL-NEXT: mfence # sched: [2:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_mfence:			; BTVER2-LABEL: test_mfence:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: mfence # sched: [1:1.00]			; BTVER2-NEXT: mfence # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_mfence:			; ZNVER1-LABEL: test_mfence:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 26 Lines
	;			;
	; SANDY-LABEL: test_maskmovdqu:			; SANDY-LABEL: test_maskmovdqu:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmaskmovdqu %xmm1, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vmaskmovdqu %xmm1, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_maskmovdqu:			; HASWELL-LABEL: test_maskmovdqu:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmaskmovdqu %xmm1, %xmm0 # sched: [14:2.00]			; HASWELL-NEXT: vmaskmovdqu %xmm1, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_maskmovdqu:			; BTVER2-LABEL: test_maskmovdqu:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmaskmovdqu %xmm1, %xmm0 # sched: [1:1.00]			; BTVER2-NEXT: vmaskmovdqu %xmm1, %xmm0 # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_maskmovdqu:			; ZNVER1-LABEL: test_maskmovdqu:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 27 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmaxpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vmaxpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmaxpd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vmaxpd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_maxpd:			; HASWELL-LABEL: test_maxpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmaxpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vmaxpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmaxpd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vmaxpd (%rdi), %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_maxpd:			; BTVER2-LABEL: test_maxpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmaxpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vmaxpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vmaxpd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vmaxpd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_maxpd:			; ZNVER1-LABEL: test_maxpd:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmaxsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vmaxsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmaxsd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vmaxsd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_maxsd:			; HASWELL-LABEL: test_maxsd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmaxsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vmaxsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmaxsd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vmaxsd (%rdi), %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_maxsd:			; BTVER2-LABEL: test_maxsd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmaxsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vmaxsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vmaxsd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vmaxsd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_maxsd:			; ZNVER1-LABEL: test_maxsd:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vminpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vminpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vminpd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vminpd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_minpd:			; HASWELL-LABEL: test_minpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vminpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vminpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vminpd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vminpd (%rdi), %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_minpd:			; BTVER2-LABEL: test_minpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vminpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vminpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vminpd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vminpd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_minpd:			; ZNVER1-LABEL: test_minpd:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vminsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vminsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vminsd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vminsd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_minsd:			; HASWELL-LABEL: test_minsd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vminsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vminsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vminsd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vminsd (%rdi), %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_minsd:			; BTVER2-LABEL: test_minsd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vminsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vminsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vminsd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vminsd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_minsd:			; ZNVER1-LABEL: test_minsd:
	Show All 34 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovapd (%rdi), %xmm0 # sched: [6:0.50]			; SANDY-NEXT: vmovapd (%rdi), %xmm0 # sched: [6:0.50]
	; SANDY-NEXT: vaddpd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmovapd %xmm0, (%rsi) # sched: [5:1.00]			; SANDY-NEXT: vmovapd %xmm0, (%rsi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movapd:			; HASWELL-LABEL: test_movapd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovapd (%rdi), %xmm0 # sched: [4:0.50]			; HASWELL-NEXT: vmovapd (%rdi), %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vaddpd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmovapd %xmm0, (%rsi) # sched: [1:1.00]			; HASWELL-NEXT: vmovapd %xmm0, (%rsi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movapd:			; BTVER2-LABEL: test_movapd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovapd (%rdi), %xmm0 # sched: [5:1.00]			; BTVER2-NEXT: vmovapd (%rdi), %xmm0 # sched: [5:1.00]
	; BTVER2-NEXT: vaddpd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vmovapd %xmm0, (%rsi) # sched: [1:1.00]			; BTVER2-NEXT: vmovapd %xmm0, (%rsi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 35 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovdqa (%rdi), %xmm0 # sched: [6:0.50]			; SANDY-NEXT: vmovdqa (%rdi), %xmm0 # sched: [6:0.50]
	; SANDY-NEXT: vpaddq %xmm0, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddq %xmm0, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vmovdqa %xmm0, (%rsi) # sched: [5:1.00]			; SANDY-NEXT: vmovdqa %xmm0, (%rsi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movdqa:			; HASWELL-LABEL: test_movdqa:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovdqa (%rdi), %xmm0 # sched: [4:0.50]			; HASWELL-NEXT: vmovdqa (%rdi), %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddq %xmm0, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm0, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vmovdqa %xmm0, (%rsi) # sched: [1:1.00]			; HASWELL-NEXT: vmovdqa %xmm0, (%rsi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movdqa:			; BTVER2-LABEL: test_movdqa:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovdqa (%rdi), %xmm0 # sched: [5:1.00]			; BTVER2-NEXT: vmovdqa (%rdi), %xmm0 # sched: [5:1.00]
	; BTVER2-NEXT: vpaddq %xmm0, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm0, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vmovdqa %xmm0, (%rsi) # sched: [1:1.00]			; BTVER2-NEXT: vmovdqa %xmm0, (%rsi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 35 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovdqu (%rdi), %xmm0 # sched: [6:0.50]			; SANDY-NEXT: vmovdqu (%rdi), %xmm0 # sched: [6:0.50]
	; SANDY-NEXT: vpaddq %xmm0, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddq %xmm0, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vmovdqu %xmm0, (%rsi) # sched: [5:1.00]			; SANDY-NEXT: vmovdqu %xmm0, (%rsi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movdqu:			; HASWELL-LABEL: test_movdqu:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovdqu (%rdi), %xmm0 # sched: [4:0.50]			; HASWELL-NEXT: vmovdqu (%rdi), %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddq %xmm0, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm0, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vmovdqu %xmm0, (%rsi) # sched: [1:1.00]			; HASWELL-NEXT: vmovdqu %xmm0, (%rsi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movdqu:			; BTVER2-LABEL: test_movdqu:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovdqu (%rdi), %xmm0 # sched: [5:1.00]			; BTVER2-NEXT: vmovdqu (%rdi), %xmm0 # sched: [5:1.00]
	; BTVER2-NEXT: vpaddq %xmm0, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm0, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vmovdqu %xmm0, (%rsi) # sched: [1:1.00]			; BTVER2-NEXT: vmovdqu %xmm0, (%rsi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vpaddd %xmm2, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddd %xmm2, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vmovd %xmm0, %eax # sched: [2:1.00]			; SANDY-NEXT: vmovd %xmm0, %eax # sched: [2:1.00]
	; SANDY-NEXT: vmovd %xmm1, (%rsi) # sched: [5:1.00]			; SANDY-NEXT: vmovd %xmm1, (%rsi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movd:			; HASWELL-LABEL: test_movd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovd %edi, %xmm1 # sched: [1:1.00]			; HASWELL-NEXT: vmovd %edi, %xmm1 # sched: [1:1.00]
	; HASWELL-NEXT: vmovd {{.*#+}} xmm2 = mem[0],zero,zero,zero sched: [4:0.50]			; HASWELL-NEXT: vmovd {{.*#+}} xmm2 = mem[0],zero,zero,zero sched: [1:0.50]
	; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddd %xmm2, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddd %xmm2, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vmovd %xmm0, %eax # sched: [1:1.00]			; HASWELL-NEXT: vmovd %xmm0, %eax # sched: [1:1.00]
	; HASWELL-NEXT: vmovd %xmm1, (%rsi) # sched: [1:1.00]			; HASWELL-NEXT: vmovd %xmm1, (%rsi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movd:			; BTVER2-LABEL: test_movd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovd {{.*#+}} xmm2 = mem[0],zero,zero,zero sched: [5:1.00]			; BTVER2-NEXT: vmovd {{.*#+}} xmm2 = mem[0],zero,zero,zero sched: [5:1.00]
	; BTVER2-NEXT: vmovd %edi, %xmm1 # sched: [1:0.17]			; BTVER2-NEXT: vmovd %edi, %xmm1 # sched: [1:0.17]
	; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; BTVER2-NEXT: vmovd %xmm1, (%rsi) # sched: [1:1.00]			; BTVER2-NEXT: vmovd %xmm1, (%rsi) # sched: [1:1.00]
	; BTVER2-NEXT: vpaddd %xmm2, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddd %xmm2, %xmm0, %xmm0 # sched: [1:0.50]
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vpaddq %xmm2, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddq %xmm2, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vmovq %xmm0, %rax # sched: [2:1.00]			; SANDY-NEXT: vmovq %xmm0, %rax # sched: [2:1.00]
	; SANDY-NEXT: vmovq %xmm1, (%rsi) # sched: [5:1.00]			; SANDY-NEXT: vmovq %xmm1, (%rsi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movd_64:			; HASWELL-LABEL: test_movd_64:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovq %rdi, %xmm1 # sched: [1:1.00]			; HASWELL-NEXT: vmovq %rdi, %xmm1 # sched: [1:1.00]
	; HASWELL-NEXT: vmovq {{.*#+}} xmm2 = mem[0],zero sched: [4:0.50]			; HASWELL-NEXT: vmovq {{.*#+}} xmm2 = mem[0],zero sched: [1:0.50]
	; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddq %xmm2, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm2, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vmovq %xmm0, %rax # sched: [1:1.00]			; HASWELL-NEXT: vmovq %xmm0, %rax # sched: [1:1.00]
	; HASWELL-NEXT: vmovq %xmm1, (%rsi) # sched: [1:1.00]			; HASWELL-NEXT: vmovq %xmm1, (%rsi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movd_64:			; BTVER2-LABEL: test_movd_64:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovq {{.*#+}} xmm2 = mem[0],zero sched: [5:1.00]			; BTVER2-NEXT: vmovq {{.*#+}} xmm2 = mem[0],zero sched: [5:1.00]
	; BTVER2-NEXT: vmovq %rdi, %xmm1 # sched: [1:0.17]			; BTVER2-NEXT: vmovq %rdi, %xmm1 # sched: [1:0.17]
	; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; BTVER2-NEXT: vmovq %xmm1, (%rsi) # sched: [1:1.00]			; BTVER2-NEXT: vmovq %xmm1, (%rsi) # sched: [1:1.00]
	; BTVER2-NEXT: vpaddq %xmm2, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm2, %xmm0, %xmm0 # sched: [1:0.50]
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovhpd {{.*#+}} xmm1 = xmm1[0],mem[0] sched: [7:1.00]			; SANDY-NEXT: vmovhpd {{.*#+}} xmm1 = xmm1[0],mem[0] sched: [7:1.00]
	; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmovhpd %xmm0, (%rdi) # sched: [5:1.00]			; SANDY-NEXT: vmovhpd %xmm0, (%rdi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movhpd:			; HASWELL-LABEL: test_movhpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovhpd {{.*#+}} xmm1 = xmm1[0],mem[0] sched: [5:1.00]			; HASWELL-NEXT: vmovhpd {{.*#+}} xmm1 = xmm1[0],mem[0] sched: [1:1.00]
	; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmovhpd %xmm0, (%rdi) # sched: [1:1.00]			; HASWELL-NEXT: vmovhpd %xmm0, (%rdi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movhpd:			; BTVER2-LABEL: test_movhpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovhpd {{.*#+}} xmm1 = xmm1[0],mem[0] sched: [6:1.00]			; BTVER2-NEXT: vmovhpd {{.*#+}} xmm1 = xmm1[0],mem[0] sched: [6:1.00]
	; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vmovhpd %xmm0, (%rdi) # sched: [1:1.00]			; BTVER2-NEXT: vmovhpd %xmm0, (%rdi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 38 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovlpd {{.*#+}} xmm1 = mem[0],xmm1[1] sched: [7:1.00]			; SANDY-NEXT: vmovlpd {{.*#+}} xmm1 = mem[0],xmm1[1] sched: [7:1.00]
	; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmovlpd %xmm0, (%rdi) # sched: [5:1.00]			; SANDY-NEXT: vmovlpd %xmm0, (%rdi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movlpd:			; HASWELL-LABEL: test_movlpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovlpd {{.*#+}} xmm1 = mem[0],xmm1[1] sched: [5:1.00]			; HASWELL-NEXT: vmovlpd {{.*#+}} xmm1 = mem[0],xmm1[1] sched: [1:1.00]
	; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmovlpd %xmm0, (%rdi) # sched: [1:1.00]			; HASWELL-NEXT: vmovlpd %xmm0, (%rdi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movlpd:			; BTVER2-LABEL: test_movlpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovlpd {{.*#+}} xmm1 = mem[0],xmm1[1] sched: [6:1.00]			; BTVER2-NEXT: vmovlpd {{.*#+}} xmm1 = mem[0],xmm1[1] sched: [6:1.00]
	; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vmovlpd %xmm0, (%rdi) # sched: [1:1.00]			; BTVER2-NEXT: vmovlpd %xmm0, (%rdi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 33 Lines
	; SANDY-LABEL: test_movmskpd:			; SANDY-LABEL: test_movmskpd:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovmskpd %xmm0, %eax # sched: [2:1.00]			; SANDY-NEXT: vmovmskpd %xmm0, %eax # sched: [2:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movmskpd:			; HASWELL-LABEL: test_movmskpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovmskpd %xmm0, %eax # sched: [3:1.00]			; HASWELL-NEXT: vmovmskpd %xmm0, %eax # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movmskpd:			; BTVER2-LABEL: test_movmskpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovmskpd %xmm0, %eax # sched: [1:0.50]			; BTVER2-NEXT: vmovmskpd %xmm0, %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_movmskpd:			; ZNVER1-LABEL: test_movmskpd:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 30 Lines
	; SANDY-NEXT: vpaddq %xmm0, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddq %xmm0, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vmovntdq %xmm0, (%rdi) # sched: [5:1.00]			; SANDY-NEXT: vmovntdq %xmm0, (%rdi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movntdqa:			; HASWELL-LABEL: test_movntdqa:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpaddq %xmm0, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm0, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vmovntdq %xmm0, (%rdi) # sched: [1:1.00]			; HASWELL-NEXT: vmovntdq %xmm0, (%rdi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movntdqa:			; BTVER2-LABEL: test_movntdqa:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpaddq %xmm0, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm0, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vmovntdq %xmm0, (%rdi) # sched: [1:1.00]			; BTVER2-NEXT: vmovntdq %xmm0, (%rdi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_movntdqa:			; ZNVER1-LABEL: test_movntdqa:
	Show All 30 Lines
	; SANDY-NEXT: vaddpd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmovntpd %xmm0, (%rdi) # sched: [5:1.00]			; SANDY-NEXT: vmovntpd %xmm0, (%rdi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movntpd:			; HASWELL-LABEL: test_movntpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vaddpd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmovntpd %xmm0, (%rdi) # sched: [1:1.00]			; HASWELL-NEXT: vmovntpd %xmm0, (%rdi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movntpd:			; BTVER2-LABEL: test_movntpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vaddpd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vmovntpd %xmm0, (%rdi) # sched: [1:1.00]			; BTVER2-NEXT: vmovntpd %xmm0, (%rdi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_movntpd:			; ZNVER1-LABEL: test_movntpd:
	Show All 32 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovq {{.*#+}} xmm1 = mem[0],zero sched: [6:0.50]			; SANDY-NEXT: vmovq {{.*#+}} xmm1 = mem[0],zero sched: [6:0.50]
	; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vmovq %xmm0, (%rdi) # sched: [5:1.00]			; SANDY-NEXT: vmovq %xmm0, (%rdi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movq_mem:			; HASWELL-LABEL: test_movq_mem:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovq {{.*#+}} xmm1 = mem[0],zero sched: [4:0.50]			; HASWELL-NEXT: vmovq {{.*#+}} xmm1 = mem[0],zero sched: [1:0.50]
	; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vmovq %xmm0, (%rdi) # sched: [1:1.00]			; HASWELL-NEXT: vmovq %xmm0, (%rdi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movq_mem:			; BTVER2-LABEL: test_movq_mem:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovq {{.*#+}} xmm1 = mem[0],zero sched: [5:1.00]			; BTVER2-NEXT: vmovq {{.*#+}} xmm1 = mem[0],zero sched: [5:1.00]
	; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vmovq %xmm0, (%rdi) # sched: [1:1.00]			; BTVER2-NEXT: vmovq %xmm0, (%rdi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 37 Lines
	; SANDY-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero sched: [1:0.33]			; SANDY-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero sched: [1:0.33]
	; SANDY-NEXT: vpaddq %xmm0, %xmm1, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddq %xmm0, %xmm1, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movq_reg:			; HASWELL-LABEL: test_movq_reg:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero sched: [1:0.33]			; HASWELL-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero sched: [1:0.33]
	; HASWELL-NEXT: vpaddq %xmm0, %xmm1, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm0, %xmm1, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movq_reg:			; BTVER2-LABEL: test_movq_reg:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero sched: [1:0.50]			; BTVER2-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero sched: [1:0.50]
	; BTVER2-NEXT: vpaddq %xmm0, %xmm1, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm0, %xmm1, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_movq_reg:			; ZNVER1-LABEL: test_movq_reg:
	Show All 32 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero sched: [6:0.50]			; SANDY-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero sched: [6:0.50]
	; SANDY-NEXT: vaddsd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddsd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmovsd %xmm0, (%rsi) # sched: [5:1.00]			; SANDY-NEXT: vmovsd %xmm0, (%rsi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movsd_mem:			; HASWELL-LABEL: test_movsd_mem:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero sched: [4:0.50]			; HASWELL-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero sched: [1:0.50]
	; HASWELL-NEXT: vaddsd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddsd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmovsd %xmm0, (%rsi) # sched: [1:1.00]			; HASWELL-NEXT: vmovsd %xmm0, (%rsi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movsd_mem:			; BTVER2-LABEL: test_movsd_mem:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero sched: [5:1.00]			; BTVER2-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero sched: [5:1.00]
	; BTVER2-NEXT: vaddsd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddsd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vmovsd %xmm0, (%rsi) # sched: [1:1.00]			; BTVER2-NEXT: vmovsd %xmm0, (%rsi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 35 Lines
	; SANDY-LABEL: test_movsd_reg:			; SANDY-LABEL: test_movsd_reg:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm1[0],xmm0[0] sched: [1:1.00]			; SANDY-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm1[0],xmm0[0] sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movsd_reg:			; HASWELL-LABEL: test_movsd_reg:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm1[0],xmm0[0] sched: [1:1.00]			; HASWELL-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm1[0],xmm0[0] sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movsd_reg:			; BTVER2-LABEL: test_movsd_reg:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm1[0],xmm0[0] sched: [1:0.50]			; BTVER2-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm1[0],xmm0[0] sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_movsd_reg:			; ZNVER1-LABEL: test_movsd_reg:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 29 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovupd (%rdi), %xmm0 # sched: [6:0.50]			; SANDY-NEXT: vmovupd (%rdi), %xmm0 # sched: [6:0.50]
	; SANDY-NEXT: vaddpd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vmovupd %xmm0, (%rsi) # sched: [5:1.00]			; SANDY-NEXT: vmovupd %xmm0, (%rsi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movupd:			; HASWELL-LABEL: test_movupd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovupd (%rdi), %xmm0 # sched: [4:0.50]			; HASWELL-NEXT: vmovupd (%rdi), %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vaddpd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vmovupd %xmm0, (%rsi) # sched: [1:1.00]			; HASWELL-NEXT: vmovupd %xmm0, (%rsi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movupd:			; BTVER2-LABEL: test_movupd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovupd (%rdi), %xmm0 # sched: [5:1.00]			; BTVER2-NEXT: vmovupd (%rdi), %xmm0 # sched: [5:1.00]
	; BTVER2-NEXT: vaddpd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vmovupd %xmm0, (%rsi) # sched: [1:1.00]			; BTVER2-NEXT: vmovupd %xmm0, (%rsi) # sched: [1:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmulpd %xmm1, %xmm0, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vmulpd %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: vmulpd (%rdi), %xmm0, %xmm0 # sched: [11:1.00]			; SANDY-NEXT: vmulpd (%rdi), %xmm0, %xmm0 # sched: [11:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_mulpd:			; HASWELL-LABEL: test_mulpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmulpd %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vmulpd %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: vmulpd (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; HASWELL-NEXT: vmulpd (%rdi), %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_mulpd:			; BTVER2-LABEL: test_mulpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmulpd %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; BTVER2-NEXT: vmulpd %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; BTVER2-NEXT: vmulpd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vmulpd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_mulpd:			; ZNVER1-LABEL: test_mulpd:
	Show All 30 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmulsd %xmm1, %xmm0, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vmulsd %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: vmulsd (%rdi), %xmm0, %xmm0 # sched: [11:1.00]			; SANDY-NEXT: vmulsd (%rdi), %xmm0, %xmm0 # sched: [11:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_mulsd:			; HASWELL-LABEL: test_mulsd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmulsd %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vmulsd %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: vmulsd (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; HASWELL-NEXT: vmulsd (%rdi), %xmm0, %xmm0 # sched: [5:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_mulsd:			; BTVER2-LABEL: test_mulsd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmulsd %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; BTVER2-NEXT: vmulsd %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; BTVER2-NEXT: vmulsd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vmulsd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_mulsd:			; ZNVER1-LABEL: test_mulsd:
	Show All 34 Lines
	; SANDY-NEXT: vorpd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vorpd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: vorpd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; SANDY-NEXT: vorpd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; SANDY-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_orpd:			; HASWELL-LABEL: test_orpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vorpd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vorpd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vorpd (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vorpd (%rdi), %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_orpd:			; BTVER2-LABEL: test_orpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vorpd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vorpd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vorpd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vorpd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpackssdw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpackssdw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpackssdw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpackssdw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_packssdw:			; HASWELL-LABEL: test_packssdw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpackssdw %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpackssdw %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vpackssdw (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpackssdw (%rdi), %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_packssdw:			; BTVER2-LABEL: test_packssdw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpackssdw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpackssdw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpackssdw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpackssdw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_packssdw:			; ZNVER1-LABEL: test_packssdw:
	Show All 36 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpacksswb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpacksswb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpacksswb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpacksswb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_packsswb:			; HASWELL-LABEL: test_packsswb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpacksswb %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpacksswb %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vpacksswb (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpacksswb (%rdi), %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_packsswb:			; BTVER2-LABEL: test_packsswb:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpacksswb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpacksswb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_packsswb:			; ZNVER1-LABEL: test_packsswb:
	Show All 36 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpackuswb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpackuswb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpackuswb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpackuswb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_packuswb:			; HASWELL-LABEL: test_packuswb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpackuswb %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpackuswb %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vpackuswb (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpackuswb (%rdi), %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_packuswb:			; BTVER2-LABEL: test_packuswb:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpackuswb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpackuswb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpackuswb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpackuswb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_packuswb:			; ZNVER1-LABEL: test_packuswb:
	Show All 36 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpaddb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpaddb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpaddb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_paddb:			; HASWELL-LABEL: test_paddb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpaddb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddb (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpaddb (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_paddb:			; BTVER2-LABEL: test_paddb:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpaddb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpaddb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpaddb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_paddb:			; ZNVER1-LABEL: test_paddb:
	Show All 34 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpaddd (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpaddd (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_paddd:			; HASWELL-LABEL: test_paddd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddd (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpaddd (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_paddd:			; BTVER2-LABEL: test_paddd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpaddd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpaddd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_paddd:			; ZNVER1-LABEL: test_paddd:
	Show All 30 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpaddq (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpaddq (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_paddq:			; HASWELL-LABEL: test_paddq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddq (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpaddq (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_paddq:			; BTVER2-LABEL: test_paddq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpaddq (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpaddq (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_paddq:			; ZNVER1-LABEL: test_paddq:
	Show All 34 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpaddsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpaddsb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpaddsb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_paddsb:			; HASWELL-LABEL: test_paddsb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpaddsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddsb (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpaddsb (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_paddsb:			; BTVER2-LABEL: test_paddsb:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpaddsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpaddsb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpaddsb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_paddsb:			; ZNVER1-LABEL: test_paddsb:
	Show All 35 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpaddsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpaddsw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpaddsw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_paddsw:			; HASWELL-LABEL: test_paddsw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpaddsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddsw (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpaddsw (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_paddsw:			; BTVER2-LABEL: test_paddsw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpaddsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpaddsw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpaddsw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_paddsw:			; ZNVER1-LABEL: test_paddsw:
	Show All 35 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpaddusb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddusb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpaddusb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpaddusb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_paddusb:			; HASWELL-LABEL: test_paddusb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpaddusb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddusb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddusb (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpaddusb (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_paddusb:			; BTVER2-LABEL: test_paddusb:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpaddusb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddusb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpaddusb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpaddusb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_paddusb:			; ZNVER1-LABEL: test_paddusb:
	Show All 35 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpaddusw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddusw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpaddusw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpaddusw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_paddusw:			; HASWELL-LABEL: test_paddusw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpaddusw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddusw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddusw (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpaddusw (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_paddusw:			; BTVER2-LABEL: test_paddusw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpaddusw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddusw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpaddusw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpaddusw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_paddusw:			; ZNVER1-LABEL: test_paddusw:
	Show All 35 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpaddw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpaddw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_paddw:			; HASWELL-LABEL: test_paddw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddw (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpaddw (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_paddw:			; BTVER2-LABEL: test_paddw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpaddw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpaddw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_paddw:			; ZNVER1-LABEL: test_paddw:
	Show All 34 Lines
	; SANDY-NEXT: vpand %xmm1, %xmm0, %xmm0 # sched: [1:0.33]			; SANDY-NEXT: vpand %xmm1, %xmm0, %xmm0 # sched: [1:0.33]
	; SANDY-NEXT: vpand (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpand (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pand:			; HASWELL-LABEL: test_pand:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpand %xmm1, %xmm0, %xmm0 # sched: [1:0.33]			; HASWELL-NEXT: vpand %xmm1, %xmm0, %xmm0 # sched: [1:0.33]
	; HASWELL-NEXT: vpand (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpand (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pand:			; BTVER2-LABEL: test_pand:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpand %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpand %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpand (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpand (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vpandn %xmm1, %xmm0, %xmm0 # sched: [1:0.33]			; SANDY-NEXT: vpandn %xmm1, %xmm0, %xmm0 # sched: [1:0.33]
	; SANDY-NEXT: vpandn (%rdi), %xmm0, %xmm1 # sched: [7:0.50]			; SANDY-NEXT: vpandn (%rdi), %xmm0, %xmm1 # sched: [7:0.50]
	; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pandn:			; HASWELL-LABEL: test_pandn:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpandn %xmm1, %xmm0, %xmm0 # sched: [1:0.33]			; HASWELL-NEXT: vpandn %xmm1, %xmm0, %xmm0 # sched: [1:0.33]
	; HASWELL-NEXT: vpandn (%rdi), %xmm0, %xmm1 # sched: [5:0.50]			; HASWELL-NEXT: vpandn (%rdi), %xmm0, %xmm1 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pandn:			; BTVER2-LABEL: test_pandn:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpandn %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpandn %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpandn (%rdi), %xmm0, %xmm1 # sched: [6:1.00]			; BTVER2-NEXT: vpandn (%rdi), %xmm0, %xmm1 # sched: [6:1.00]
	; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 39 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpavgb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpavgb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpavgb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpavgb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pavgb:			; HASWELL-LABEL: test_pavgb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpavgb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpavgb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpavgb (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpavgb (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pavgb:			; BTVER2-LABEL: test_pavgb:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpavgb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpavgb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpavgb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpavgb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pavgb:			; ZNVER1-LABEL: test_pavgb:
	Show All 35 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpavgw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpavgw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpavgw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpavgw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pavgw:			; HASWELL-LABEL: test_pavgw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpavgw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpavgw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpavgw (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpavgw (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pavgw:			; BTVER2-LABEL: test_pavgw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpavgw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpavgw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpavgw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpavgw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pavgw:			; ZNVER1-LABEL: test_pavgw:
	Show All 37 Lines
	; SANDY-NEXT: vpcmpeqb %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; SANDY-NEXT: vpcmpeqb %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; SANDY-NEXT: vpcmpeqb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpcmpeqb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]			; SANDY-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pcmpeqb:			; HASWELL-LABEL: test_pcmpeqb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpcmpeqb %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; HASWELL-NEXT: vpcmpeqb %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; HASWELL-NEXT: vpcmpeqb (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpcmpeqb (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]			; HASWELL-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pcmpeqb:			; BTVER2-LABEL: test_pcmpeqb:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpcmpeqb %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; BTVER2-NEXT: vpcmpeqb %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; BTVER2-NEXT: vpcmpeqb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpcmpeqb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 40 Lines
	; SANDY-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; SANDY-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; SANDY-NEXT: vpcmpeqd (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpcmpeqd (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]			; SANDY-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pcmpeqd:			; HASWELL-LABEL: test_pcmpeqd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; HASWELL-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; HASWELL-NEXT: vpcmpeqd (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpcmpeqd (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]			; HASWELL-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pcmpeqd:			; BTVER2-LABEL: test_pcmpeqd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; BTVER2-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; BTVER2-NEXT: vpcmpeqd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpcmpeqd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 40 Lines
	; SANDY-NEXT: vpcmpeqw %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; SANDY-NEXT: vpcmpeqw %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; SANDY-NEXT: vpcmpeqw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpcmpeqw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]			; SANDY-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pcmpeqw:			; HASWELL-LABEL: test_pcmpeqw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpcmpeqw %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; HASWELL-NEXT: vpcmpeqw %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; HASWELL-NEXT: vpcmpeqw (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpcmpeqw (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]			; HASWELL-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pcmpeqw:			; BTVER2-LABEL: test_pcmpeqw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpcmpeqw %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; BTVER2-NEXT: vpcmpeqw %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; BTVER2-NEXT: vpcmpeqw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpcmpeqw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vpcmpgtb %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; SANDY-NEXT: vpcmpgtb %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; SANDY-NEXT: vpcmpgtb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpcmpgtb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]			; SANDY-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pcmpgtb:			; HASWELL-LABEL: test_pcmpgtb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpcmpgtb %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; HASWELL-NEXT: vpcmpgtb %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; HASWELL-NEXT: vpcmpgtb (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpcmpgtb (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]			; HASWELL-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pcmpgtb:			; BTVER2-LABEL: test_pcmpgtb:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpcmpgtb %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; BTVER2-NEXT: vpcmpgtb %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; BTVER2-NEXT: vpcmpgtb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpcmpgtb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; SANDY-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; SANDY-NEXT: vpcmpeqd (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpcmpeqd (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]			; SANDY-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pcmpgtd:			; HASWELL-LABEL: test_pcmpgtd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; HASWELL-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; HASWELL-NEXT: vpcmpeqd (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpcmpeqd (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]			; HASWELL-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pcmpgtd:			; BTVER2-LABEL: test_pcmpgtd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; BTVER2-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; BTVER2-NEXT: vpcmpeqd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpcmpeqd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; SANDY-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; SANDY-NEXT: vpcmpgtw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpcmpgtw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]			; SANDY-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pcmpgtw:			; HASWELL-LABEL: test_pcmpgtw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; HASWELL-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; HASWELL-NEXT: vpcmpgtw (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpcmpgtw (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]			; HASWELL-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.33]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pcmpgtw:			; BTVER2-LABEL: test_pcmpgtw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm1 # sched: [1:0.50]			; BTVER2-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm1 # sched: [1:0.50]
	; BTVER2-NEXT: vpcmpgtw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpcmpgtw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpor %xmm0, %xmm1, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 33 Lines
	; SANDY-LABEL: test_pextrw:			; SANDY-LABEL: test_pextrw:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpextrw $6, %xmm0, %eax # sched: [3:1.00]			; SANDY-NEXT: vpextrw $6, %xmm0, %eax # sched: [3:1.00]
	; SANDY-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; SANDY-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pextrw:			; HASWELL-LABEL: test_pextrw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpextrw $6, %xmm0, %eax # sched: [1:1.00]			; HASWELL-NEXT: vpextrw $6, %xmm0, %eax # sched: [2:1.00]
	; HASWELL-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; HASWELL-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pextrw:			; BTVER2-LABEL: test_pextrw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpextrw $6, %xmm0, %eax # sched: [1:0.50]			; BTVER2-NEXT: vpextrw $6, %xmm0, %eax # sched: [1:0.50]
	; BTVER2-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>			; BTVER2-NEXT: # kill: %AX<def> %AX<kill> %EAX<kill>
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pextrw:			; ZNVER1-LABEL: test_pextrw:
	Show All 31 Lines
	; SANDY-LABEL: test_pinsrw:			; SANDY-LABEL: test_pinsrw:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpinsrw $1, %edi, %xmm0, %xmm0 # sched: [2:1.00]			; SANDY-NEXT: vpinsrw $1, %edi, %xmm0, %xmm0 # sched: [2:1.00]
	; SANDY-NEXT: vpinsrw $3, (%rsi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpinsrw $3, (%rsi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pinsrw:			; HASWELL-LABEL: test_pinsrw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpinsrw $1, %edi, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpinsrw $1, %edi, %xmm0, %xmm0 # sched: [2:2.00]
	; HASWELL-NEXT: vpinsrw $3, (%rsi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpinsrw $3, (%rsi), %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pinsrw:			; BTVER2-LABEL: test_pinsrw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpinsrw $1, %edi, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpinsrw $1, %edi, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpinsrw $3, (%rsi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpinsrw $3, (%rsi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pinsrw:			; ZNVER1-LABEL: test_pinsrw:
	Show All 38 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpmaddwd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vpmaddwd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vpmaddwd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vpmaddwd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmaddwd:			; HASWELL-LABEL: test_pmaddwd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmaddwd %xmm1, %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpmaddwd %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: vpmaddwd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; HASWELL-NEXT: vpmaddwd (%rdi), %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmaddwd:			; BTVER2-LABEL: test_pmaddwd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmaddwd %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; BTVER2-NEXT: vpmaddwd %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; BTVER2-NEXT: vpmaddwd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vpmaddwd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pmaddwd:			; ZNVER1-LABEL: test_pmaddwd:
	Show All 36 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpmaxsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpmaxsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpmaxsw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpmaxsw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmaxsw:			; HASWELL-LABEL: test_pmaxsw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmaxsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpmaxsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpmaxsw (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpmaxsw (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmaxsw:			; BTVER2-LABEL: test_pmaxsw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmaxsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpmaxsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpmaxsw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpmaxsw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pmaxsw:			; ZNVER1-LABEL: test_pmaxsw:
	Show All 35 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpmaxub %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpmaxub %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpmaxub (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpmaxub (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmaxub:			; HASWELL-LABEL: test_pmaxub:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmaxub %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpmaxub %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpmaxub (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpmaxub (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmaxub:			; BTVER2-LABEL: test_pmaxub:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmaxub %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpmaxub %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpmaxub (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpmaxub (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pmaxub:			; ZNVER1-LABEL: test_pmaxub:
	Show All 35 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpminsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpminsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpminsw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpminsw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pminsw:			; HASWELL-LABEL: test_pminsw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpminsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpminsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpminsw (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpminsw (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pminsw:			; BTVER2-LABEL: test_pminsw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpminsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpminsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpminsw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpminsw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pminsw:			; ZNVER1-LABEL: test_pminsw:
	Show All 35 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpminub %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpminub %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpminub (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpminub (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pminub:			; HASWELL-LABEL: test_pminub:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpminub %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpminub %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpminub (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpminub (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pminub:			; BTVER2-LABEL: test_pminub:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpminub %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpminub %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpminub (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpminub (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pminub:			; ZNVER1-LABEL: test_pminub:
	Show All 29 Lines
	; SANDY-LABEL: test_pmovmskb:			; SANDY-LABEL: test_pmovmskb:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpmovmskb %xmm0, %eax # sched: [1:1.00]			; SANDY-NEXT: vpmovmskb %xmm0, %eax # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmovmskb:			; HASWELL-LABEL: test_pmovmskb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmovmskb %xmm0, %eax # sched: [3:1.00]			; HASWELL-NEXT: vpmovmskb %xmm0, %eax # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmovmskb:			; BTVER2-LABEL: test_pmovmskb:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmovmskb %xmm0, %eax # sched: [1:0.50]			; BTVER2-NEXT: vpmovmskb %xmm0, %eax # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pmovmskb:			; ZNVER1-LABEL: test_pmovmskb:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 27 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpmulhuw %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vpmulhuw %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vpmulhuw (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vpmulhuw (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmulhuw:			; HASWELL-LABEL: test_pmulhuw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmulhuw %xmm1, %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpmulhuw %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: vpmulhuw (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; HASWELL-NEXT: vpmulhuw (%rdi), %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmulhuw:			; BTVER2-LABEL: test_pmulhuw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmulhuw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; BTVER2-NEXT: vpmulhuw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; BTVER2-NEXT: vpmulhuw (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vpmulhuw (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pmulhuw:			; ZNVER1-LABEL: test_pmulhuw:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpmulhw %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vpmulhw %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vpmulhw (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vpmulhw (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmulhw:			; HASWELL-LABEL: test_pmulhw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmulhw %xmm1, %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpmulhw %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: vpmulhw (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; HASWELL-NEXT: vpmulhw (%rdi), %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmulhw:			; BTVER2-LABEL: test_pmulhw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmulhw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; BTVER2-NEXT: vpmulhw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; BTVER2-NEXT: vpmulhw (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vpmulhw (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pmulhw:			; ZNVER1-LABEL: test_pmulhw:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpmullw %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vpmullw %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vpmullw (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vpmullw (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmullw:			; HASWELL-LABEL: test_pmullw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmullw %xmm1, %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpmullw %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: vpmullw (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; HASWELL-NEXT: vpmullw (%rdi), %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmullw:			; BTVER2-LABEL: test_pmullw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmullw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; BTVER2-NEXT: vpmullw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; BTVER2-NEXT: vpmullw (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vpmullw (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pmullw:			; ZNVER1-LABEL: test_pmullw:
	Show All 38 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpmuludq %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vpmuludq %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vpmuludq (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vpmuludq (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmuludq:			; HASWELL-LABEL: test_pmuludq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmuludq %xmm1, %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpmuludq %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: vpmuludq (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; HASWELL-NEXT: vpmuludq (%rdi), %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmuludq:			; BTVER2-LABEL: test_pmuludq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmuludq %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; BTVER2-NEXT: vpmuludq %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; BTVER2-NEXT: vpmuludq (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vpmuludq (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pmuludq:			; ZNVER1-LABEL: test_pmuludq:
	Show All 36 Lines
	; SANDY-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.33]			; SANDY-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.33]
	; SANDY-NEXT: vpor (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpor (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_por:			; HASWELL-LABEL: test_por:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.33]			; HASWELL-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.33]
	; HASWELL-NEXT: vpor (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpor (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_por:			; BTVER2-LABEL: test_por:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpor (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpor (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpsadbw %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vpsadbw %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vpsadbw (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vpsadbw (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psadbw:			; HASWELL-LABEL: test_psadbw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsadbw %xmm1, %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpsadbw %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: vpsadbw (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; HASWELL-NEXT: vpsadbw (%rdi), %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_psadbw:			; BTVER2-LABEL: test_psadbw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; BTVER2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; BTVER2-NEXT: vpsadbw (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vpsadbw (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_psadbw:			; ZNVER1-LABEL: test_psadbw:
	Show All 38 Lines
	; SANDY-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[1,0,3,2] sched: [1:0.50]			; SANDY-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[1,0,3,2] sched: [1:0.50]
	; SANDY-NEXT: vpshufd {{.*#+}} xmm1 = mem[3,2,1,0] sched: [7:0.50]			; SANDY-NEXT: vpshufd {{.*#+}} xmm1 = mem[3,2,1,0] sched: [7:0.50]
	; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pshufd:			; HASWELL-LABEL: test_pshufd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[1,0,3,2] sched: [1:1.00]			; HASWELL-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[1,0,3,2] sched: [1:1.00]
	; HASWELL-NEXT: vpshufd {{.*#+}} xmm1 = mem[3,2,1,0] sched: [5:1.00]			; HASWELL-NEXT: vpshufd {{.*#+}} xmm1 = mem[3,2,1,0] sched: [1:1.00]
	; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pshufd:			; BTVER2-LABEL: test_pshufd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpshufd {{.*#+}} xmm1 = mem[3,2,1,0] sched: [6:1.00]			; BTVER2-NEXT: vpshufd {{.*#+}} xmm1 = mem[3,2,1,0] sched: [6:1.00]
	; BTVER2-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[1,0,3,2] sched: [1:0.50]			; BTVER2-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[1,0,3,2] sched: [1:0.50]
	; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 39 Lines
	; SANDY-NEXT: vpshufhw {{.*#+}} xmm0 = xmm0[0,1,2,3,5,4,7,6] sched: [1:0.50]			; SANDY-NEXT: vpshufhw {{.*#+}} xmm0 = xmm0[0,1,2,3,5,4,7,6] sched: [1:0.50]
	; SANDY-NEXT: vpshufhw {{.*#+}} xmm1 = mem[0,1,2,3,7,6,5,4] sched: [7:0.50]			; SANDY-NEXT: vpshufhw {{.*#+}} xmm1 = mem[0,1,2,3,7,6,5,4] sched: [7:0.50]
	; SANDY-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pshufhw:			; HASWELL-LABEL: test_pshufhw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpshufhw {{.*#+}} xmm0 = xmm0[0,1,2,3,5,4,7,6] sched: [1:1.00]			; HASWELL-NEXT: vpshufhw {{.*#+}} xmm0 = xmm0[0,1,2,3,5,4,7,6] sched: [1:1.00]
	; HASWELL-NEXT: vpshufhw {{.*#+}} xmm1 = mem[0,1,2,3,7,6,5,4] sched: [5:1.00]			; HASWELL-NEXT: vpshufhw {{.*#+}} xmm1 = mem[0,1,2,3,7,6,5,4] sched: [1:1.00]
	; HASWELL-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pshufhw:			; BTVER2-LABEL: test_pshufhw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpshufhw {{.*#+}} xmm1 = mem[0,1,2,3,7,6,5,4] sched: [6:1.00]			; BTVER2-NEXT: vpshufhw {{.*#+}} xmm1 = mem[0,1,2,3,7,6,5,4] sched: [6:1.00]
	; BTVER2-NEXT: vpshufhw {{.*#+}} xmm0 = xmm0[0,1,2,3,5,4,7,6] sched: [1:0.50]			; BTVER2-NEXT: vpshufhw {{.*#+}} xmm0 = xmm0[0,1,2,3,5,4,7,6] sched: [1:0.50]
	; BTVER2-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 39 Lines
	; SANDY-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[1,0,3,2,4,5,6,7] sched: [1:0.50]			; SANDY-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[1,0,3,2,4,5,6,7] sched: [1:0.50]
	; SANDY-NEXT: vpshuflw {{.*#+}} xmm1 = mem[3,2,1,0,4,5,6,7] sched: [7:0.50]			; SANDY-NEXT: vpshuflw {{.*#+}} xmm1 = mem[3,2,1,0,4,5,6,7] sched: [7:0.50]
	; SANDY-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pshuflw:			; HASWELL-LABEL: test_pshuflw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[1,0,3,2,4,5,6,7] sched: [1:1.00]			; HASWELL-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[1,0,3,2,4,5,6,7] sched: [1:1.00]
	; HASWELL-NEXT: vpshuflw {{.*#+}} xmm1 = mem[3,2,1,0,4,5,6,7] sched: [5:1.00]			; HASWELL-NEXT: vpshuflw {{.*#+}} xmm1 = mem[3,2,1,0,4,5,6,7] sched: [1:1.00]
	; HASWELL-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pshuflw:			; BTVER2-LABEL: test_pshuflw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpshuflw {{.*#+}} xmm1 = mem[3,2,1,0,4,5,6,7] sched: [6:1.00]			; BTVER2-NEXT: vpshuflw {{.*#+}} xmm1 = mem[3,2,1,0,4,5,6,7] sched: [6:1.00]
	; BTVER2-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[1,0,3,2,4,5,6,7] sched: [1:0.50]			; BTVER2-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[1,0,3,2,4,5,6,7] sched: [1:0.50]
	; BTVER2-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 37 Lines
	; SANDY-NEXT: vpslld %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; SANDY-NEXT: vpslld %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; SANDY-NEXT: vpslld (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; SANDY-NEXT: vpslld (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; SANDY-NEXT: vpslld $2, %xmm0, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vpslld $2, %xmm0, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pslld:			; HASWELL-LABEL: test_pslld:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpslld %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; HASWELL-NEXT: vpslld %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: vpslld (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpslld (%rdi), %xmm0, %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: vpslld $2, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpslld $2, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pslld:			; BTVER2-LABEL: test_pslld:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpslld %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpslld %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpslld (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpslld (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vpslld $2, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpslld $2, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 37 Lines
	; SANDY-LABEL: test_pslldq:			; SANDY-LABEL: test_pslldq:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6,7,8,9,10,11] sched: [1:0.50]			; SANDY-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6,7,8,9,10,11] sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pslldq:			; HASWELL-LABEL: test_pslldq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6,7,8,9,10,11] sched: [1:1.00]			; HASWELL-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6,7,8,9,10,11] sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pslldq:			; BTVER2-LABEL: test_pslldq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6,7,8,9,10,11] sched: [1:0.50]			; BTVER2-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6,7,8,9,10,11] sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pslldq:			; ZNVER1-LABEL: test_pslldq:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 30 Lines
	; SANDY-NEXT: vpsllq %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; SANDY-NEXT: vpsllq %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; SANDY-NEXT: vpsllq (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; SANDY-NEXT: vpsllq (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; SANDY-NEXT: vpsllq $2, %xmm0, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vpsllq $2, %xmm0, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psllq:			; HASWELL-LABEL: test_psllq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsllq %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; HASWELL-NEXT: vpsllq %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: vpsllq (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpsllq (%rdi), %xmm0, %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: vpsllq $2, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpsllq $2, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_psllq:			; BTVER2-LABEL: test_psllq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpsllq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsllq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpsllq (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpsllq (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vpsllq $2, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsllq $2, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 39 Lines
	; SANDY-NEXT: vpsllw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; SANDY-NEXT: vpsllw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; SANDY-NEXT: vpsllw (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; SANDY-NEXT: vpsllw (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; SANDY-NEXT: vpsllw $2, %xmm0, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vpsllw $2, %xmm0, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psllw:			; HASWELL-LABEL: test_psllw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsllw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; HASWELL-NEXT: vpsllw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: vpsllw (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpsllw (%rdi), %xmm0, %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: vpsllw $2, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpsllw $2, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_psllw:			; BTVER2-LABEL: test_psllw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpsllw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsllw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpsllw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpsllw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vpsllw $2, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsllw $2, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 39 Lines
	; SANDY-NEXT: vpsrad %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; SANDY-NEXT: vpsrad %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; SANDY-NEXT: vpsrad (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; SANDY-NEXT: vpsrad (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; SANDY-NEXT: vpsrad $2, %xmm0, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vpsrad $2, %xmm0, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psrad:			; HASWELL-LABEL: test_psrad:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsrad %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; HASWELL-NEXT: vpsrad %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: vpsrad (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpsrad (%rdi), %xmm0, %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: vpsrad $2, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpsrad $2, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_psrad:			; BTVER2-LABEL: test_psrad:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpsrad %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsrad %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpsrad (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpsrad (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vpsrad $2, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsrad $2, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 39 Lines
	; SANDY-NEXT: vpsraw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; SANDY-NEXT: vpsraw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; SANDY-NEXT: vpsraw (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; SANDY-NEXT: vpsraw (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; SANDY-NEXT: vpsraw $2, %xmm0, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vpsraw $2, %xmm0, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psraw:			; HASWELL-LABEL: test_psraw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsraw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; HASWELL-NEXT: vpsraw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: vpsraw (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpsraw (%rdi), %xmm0, %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: vpsraw $2, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpsraw $2, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_psraw:			; BTVER2-LABEL: test_psraw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpsraw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsraw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpsraw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpsraw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vpsraw $2, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsraw $2, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 39 Lines
	; SANDY-NEXT: vpsrld %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; SANDY-NEXT: vpsrld %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; SANDY-NEXT: vpsrld (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; SANDY-NEXT: vpsrld (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; SANDY-NEXT: vpsrld $2, %xmm0, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vpsrld $2, %xmm0, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psrld:			; HASWELL-LABEL: test_psrld:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsrld %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; HASWELL-NEXT: vpsrld %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: vpsrld (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpsrld (%rdi), %xmm0, %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: vpsrld $2, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpsrld $2, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_psrld:			; BTVER2-LABEL: test_psrld:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpsrld %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsrld %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpsrld (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpsrld (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vpsrld $2, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsrld $2, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 37 Lines
	; SANDY-LABEL: test_psrldq:			; SANDY-LABEL: test_psrldq:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpsrldq {{.*#+}} xmm0 = xmm0[4,5,6,7,8,9,10,11,12,13,14,15],zero,zero,zero,zero sched: [1:0.50]			; SANDY-NEXT: vpsrldq {{.*#+}} xmm0 = xmm0[4,5,6,7,8,9,10,11,12,13,14,15],zero,zero,zero,zero sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psrldq:			; HASWELL-LABEL: test_psrldq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsrldq {{.*#+}} xmm0 = xmm0[4,5,6,7,8,9,10,11,12,13,14,15],zero,zero,zero,zero sched: [1:1.00]			; HASWELL-NEXT: vpsrldq {{.*#+}} xmm0 = xmm0[4,5,6,7,8,9,10,11,12,13,14,15],zero,zero,zero,zero sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_psrldq:			; BTVER2-LABEL: test_psrldq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpsrldq {{.*#+}} xmm0 = xmm0[4,5,6,7,8,9,10,11,12,13,14,15],zero,zero,zero,zero sched: [1:0.50]			; BTVER2-NEXT: vpsrldq {{.*#+}} xmm0 = xmm0[4,5,6,7,8,9,10,11,12,13,14,15],zero,zero,zero,zero sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_psrldq:			; ZNVER1-LABEL: test_psrldq:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 30 Lines
	; SANDY-NEXT: vpsrlq %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; SANDY-NEXT: vpsrlq %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; SANDY-NEXT: vpsrlq (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; SANDY-NEXT: vpsrlq (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; SANDY-NEXT: vpsrlq $2, %xmm0, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vpsrlq $2, %xmm0, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psrlq:			; HASWELL-LABEL: test_psrlq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsrlq %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; HASWELL-NEXT: vpsrlq %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: vpsrlq (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpsrlq (%rdi), %xmm0, %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: vpsrlq $2, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpsrlq $2, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_psrlq:			; BTVER2-LABEL: test_psrlq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpsrlq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsrlq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpsrlq (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpsrlq (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vpsrlq $2, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsrlq $2, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 39 Lines
	; SANDY-NEXT: vpsrlw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; SANDY-NEXT: vpsrlw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; SANDY-NEXT: vpsrlw (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; SANDY-NEXT: vpsrlw (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; SANDY-NEXT: vpsrlw $2, %xmm0, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vpsrlw $2, %xmm0, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psrlw:			; HASWELL-LABEL: test_psrlw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsrlw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; HASWELL-NEXT: vpsrlw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: vpsrlw (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpsrlw (%rdi), %xmm0, %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: vpsrlw $2, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpsrlw $2, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_psrlw:			; BTVER2-LABEL: test_psrlw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpsrlw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsrlw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpsrlw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpsrlw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vpsrlw $2, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsrlw $2, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 39 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpsubb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpsubb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpsubb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpsubb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psubb:			; HASWELL-LABEL: test_psubb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsubb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpsubb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpsubb (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpsubb (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_psubb:			; BTVER2-LABEL: test_psubb:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpsubb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsubb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpsubb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpsubb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_psubb:			; ZNVER1-LABEL: test_psubb:
	Show All 34 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpsubd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpsubd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpsubd (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpsubd (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psubd:			; HASWELL-LABEL: test_psubd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsubd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpsubd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpsubd (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpsubd (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_psubd:			; BTVER2-LABEL: test_psubd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpsubd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsubd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpsubd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpsubd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_psubd:			; ZNVER1-LABEL: test_psubd:
	Show All 30 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpsubq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpsubq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpsubq (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpsubq (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psubq:			; HASWELL-LABEL: test_psubq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsubq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpsubq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpsubq (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpsubq (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_psubq:			; BTVER2-LABEL: test_psubq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpsubq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsubq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpsubq (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpsubq (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_psubq:			; ZNVER1-LABEL: test_psubq:
	Show All 34 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpsubsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpsubsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpsubsb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpsubsb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psubsb:			; HASWELL-LABEL: test_psubsb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsubsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpsubsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpsubsb (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpsubsb (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_psubsb:			; BTVER2-LABEL: test_psubsb:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpsubsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsubsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpsubsb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpsubsb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_psubsb:			; ZNVER1-LABEL: test_psubsb:
	Show All 35 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpsubsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpsubsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpsubsw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpsubsw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psubsw:			; HASWELL-LABEL: test_psubsw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsubsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpsubsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpsubsw (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpsubsw (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_psubsw:			; BTVER2-LABEL: test_psubsw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpsubsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsubsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpsubsw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpsubsw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_psubsw:			; ZNVER1-LABEL: test_psubsw:
	Show All 35 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpsubusb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpsubusb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpsubusb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpsubusb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psubusb:			; HASWELL-LABEL: test_psubusb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsubusb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpsubusb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpsubusb (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpsubusb (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_psubusb:			; BTVER2-LABEL: test_psubusb:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpsubusb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsubusb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpsubusb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpsubusb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_psubusb:			; ZNVER1-LABEL: test_psubusb:
	Show All 35 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpsubusw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpsubusw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpsubusw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpsubusw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psubusw:			; HASWELL-LABEL: test_psubusw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsubusw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpsubusw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpsubusw (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpsubusw (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_psubusw:			; BTVER2-LABEL: test_psubusw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpsubusw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsubusw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpsubusw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpsubusw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_psubusw:			; ZNVER1-LABEL: test_psubusw:
	Show All 35 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpsubw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpsubw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpsubw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpsubw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psubw:			; HASWELL-LABEL: test_psubw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsubw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpsubw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpsubw (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpsubw (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_psubw:			; BTVER2-LABEL: test_psubw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpsubw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsubw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpsubw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpsubw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_psubw:			; ZNVER1-LABEL: test_psubw:
	Show All 34 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpunpckhbw {{.*#+}} xmm0 = xmm0[8],xmm1[8],xmm0[9],xmm1[9],xmm0[10],xmm1[10],xmm0[11],xmm1[11],xmm0[12],xmm1[12],xmm0[13],xmm1[13],xmm0[14],xmm1[14],xmm0[15],xmm1[15] sched: [1:0.50]			; SANDY-NEXT: vpunpckhbw {{.*#+}} xmm0 = xmm0[8],xmm1[8],xmm0[9],xmm1[9],xmm0[10],xmm1[10],xmm0[11],xmm1[11],xmm0[12],xmm1[12],xmm0[13],xmm1[13],xmm0[14],xmm1[14],xmm0[15],xmm1[15] sched: [1:0.50]
	; SANDY-NEXT: vpunpckhbw {{.*#+}} xmm0 = xmm0[8],mem[8],xmm0[9],mem[9],xmm0[10],mem[10],xmm0[11],mem[11],xmm0[12],mem[12],xmm0[13],mem[13],xmm0[14],mem[14],xmm0[15],mem[15] sched: [7:0.50]			; SANDY-NEXT: vpunpckhbw {{.*#+}} xmm0 = xmm0[8],mem[8],xmm0[9],mem[9],xmm0[10],mem[10],xmm0[11],mem[11],xmm0[12],mem[12],xmm0[13],mem[13],xmm0[14],mem[14],xmm0[15],mem[15] sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_punpckhbw:			; HASWELL-LABEL: test_punpckhbw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpunpckhbw {{.*#+}} xmm0 = xmm0[8],xmm1[8],xmm0[9],xmm1[9],xmm0[10],xmm1[10],xmm0[11],xmm1[11],xmm0[12],xmm1[12],xmm0[13],xmm1[13],xmm0[14],xmm1[14],xmm0[15],xmm1[15] sched: [1:1.00]			; HASWELL-NEXT: vpunpckhbw {{.*#+}} xmm0 = xmm0[8],xmm1[8],xmm0[9],xmm1[9],xmm0[10],xmm1[10],xmm0[11],xmm1[11],xmm0[12],xmm1[12],xmm0[13],xmm1[13],xmm0[14],xmm1[14],xmm0[15],xmm1[15] sched: [1:1.00]
	; HASWELL-NEXT: vpunpckhbw {{.*#+}} xmm0 = xmm0[8],mem[8],xmm0[9],mem[9],xmm0[10],mem[10],xmm0[11],mem[11],xmm0[12],mem[12],xmm0[13],mem[13],xmm0[14],mem[14],xmm0[15],mem[15] sched: [5:1.00]			; HASWELL-NEXT: vpunpckhbw {{.*#+}} xmm0 = xmm0[8],mem[8],xmm0[9],mem[9],xmm0[10],mem[10],xmm0[11],mem[11],xmm0[12],mem[12],xmm0[13],mem[13],xmm0[14],mem[14],xmm0[15],mem[15] sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_punpckhbw:			; BTVER2-LABEL: test_punpckhbw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpunpckhbw {{.*#+}} xmm0 = xmm0[8],xmm1[8],xmm0[9],xmm1[9],xmm0[10],xmm1[10],xmm0[11],xmm1[11],xmm0[12],xmm1[12],xmm0[13],xmm1[13],xmm0[14],xmm1[14],xmm0[15],xmm1[15] sched: [1:0.50]			; BTVER2-NEXT: vpunpckhbw {{.*#+}} xmm0 = xmm0[8],xmm1[8],xmm0[9],xmm1[9],xmm0[10],xmm1[10],xmm0[11],xmm1[11],xmm0[12],xmm1[12],xmm0[13],xmm1[13],xmm0[14],xmm1[14],xmm0[15],xmm1[15] sched: [1:0.50]
	; BTVER2-NEXT: vpunpckhbw {{.*#+}} xmm0 = xmm0[8],mem[8],xmm0[9],mem[9],xmm0[10],mem[10],xmm0[11],mem[11],xmm0[12],mem[12],xmm0[13],mem[13],xmm0[14],mem[14],xmm0[15],mem[15] sched: [6:1.00]			; BTVER2-NEXT: vpunpckhbw {{.*#+}} xmm0 = xmm0[8],mem[8],xmm0[9],mem[9],xmm0[10],mem[10],xmm0[11],mem[11],xmm0[12],mem[12],xmm0[13],mem[13],xmm0[14],mem[14],xmm0[15],mem[15] sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_punpckhbw:			; ZNVER1-LABEL: test_punpckhbw:
	Show All 36 Lines
	; SANDY-NEXT: vpunpckhdq {{.*#+}} xmm0 = xmm0[2],xmm1[2],xmm0[3],xmm1[3] sched: [1:0.50]			; SANDY-NEXT: vpunpckhdq {{.*#+}} xmm0 = xmm0[2],xmm1[2],xmm0[3],xmm1[3] sched: [1:0.50]
	; SANDY-NEXT: vpunpckhdq {{.*#+}} xmm1 = xmm1[2],mem[2],xmm1[3],mem[3] sched: [7:0.50]			; SANDY-NEXT: vpunpckhdq {{.*#+}} xmm1 = xmm1[2],mem[2],xmm1[3],mem[3] sched: [7:0.50]
	; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_punpckhdq:			; HASWELL-LABEL: test_punpckhdq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpunpckhdq {{.*#+}} xmm0 = xmm0[2],xmm1[2],xmm0[3],xmm1[3] sched: [1:1.00]			; HASWELL-NEXT: vpunpckhdq {{.*#+}} xmm0 = xmm0[2],xmm1[2],xmm0[3],xmm1[3] sched: [1:1.00]
	; HASWELL-NEXT: vpunpckhdq {{.*#+}} xmm1 = xmm1[2],mem[2],xmm1[3],mem[3] sched: [5:1.00]			; HASWELL-NEXT: vpunpckhdq {{.*#+}} xmm1 = xmm1[2],mem[2],xmm1[3],mem[3] sched: [1:1.00]
	; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_punpckhdq:			; BTVER2-LABEL: test_punpckhdq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpunpckhdq {{.*#+}} xmm0 = xmm0[2],xmm1[2],xmm0[3],xmm1[3] sched: [1:0.50]			; BTVER2-NEXT: vpunpckhdq {{.*#+}} xmm0 = xmm0[2],xmm1[2],xmm0[3],xmm1[3] sched: [1:0.50]
	; BTVER2-NEXT: vpunpckhdq {{.*#+}} xmm1 = xmm1[2],mem[2],xmm1[3],mem[3] sched: [6:1.00]			; BTVER2-NEXT: vpunpckhdq {{.*#+}} xmm1 = xmm1[2],mem[2],xmm1[3],mem[3] sched: [6:1.00]
	; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 37 Lines
	; SANDY-NEXT: vpunpckhqdq {{.*#+}} xmm0 = xmm0[1],xmm1[1] sched: [1:0.50]			; SANDY-NEXT: vpunpckhqdq {{.*#+}} xmm0 = xmm0[1],xmm1[1] sched: [1:0.50]
	; SANDY-NEXT: vpunpckhqdq {{.*#+}} xmm1 = xmm1[1],mem[1] sched: [7:0.50]			; SANDY-NEXT: vpunpckhqdq {{.*#+}} xmm1 = xmm1[1],mem[1] sched: [7:0.50]
	; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_punpckhqdq:			; HASWELL-LABEL: test_punpckhqdq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpunpckhqdq {{.*#+}} xmm0 = xmm0[1],xmm1[1] sched: [1:1.00]			; HASWELL-NEXT: vpunpckhqdq {{.*#+}} xmm0 = xmm0[1],xmm1[1] sched: [1:1.00]
	; HASWELL-NEXT: vpunpckhqdq {{.*#+}} xmm1 = xmm1[1],mem[1] sched: [5:1.00]			; HASWELL-NEXT: vpunpckhqdq {{.*#+}} xmm1 = xmm1[1],mem[1] sched: [1:1.00]
	; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_punpckhqdq:			; BTVER2-LABEL: test_punpckhqdq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpunpckhqdq {{.*#+}} xmm0 = xmm0[1],xmm1[1] sched: [1:0.50]			; BTVER2-NEXT: vpunpckhqdq {{.*#+}} xmm0 = xmm0[1],xmm1[1] sched: [1:0.50]
	; BTVER2-NEXT: vpunpckhqdq {{.*#+}} xmm1 = xmm1[1],mem[1] sched: [6:1.00]			; BTVER2-NEXT: vpunpckhqdq {{.*#+}} xmm1 = xmm1[1],mem[1] sched: [6:1.00]
	; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 37 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpunpckhwd {{.*#+}} xmm0 = xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7] sched: [1:0.50]			; SANDY-NEXT: vpunpckhwd {{.*#+}} xmm0 = xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7] sched: [1:0.50]
	; SANDY-NEXT: vpunpckhwd {{.*#+}} xmm0 = xmm0[4],mem[4],xmm0[5],mem[5],xmm0[6],mem[6],xmm0[7],mem[7] sched: [7:0.50]			; SANDY-NEXT: vpunpckhwd {{.*#+}} xmm0 = xmm0[4],mem[4],xmm0[5],mem[5],xmm0[6],mem[6],xmm0[7],mem[7] sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_punpckhwd:			; HASWELL-LABEL: test_punpckhwd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpunpckhwd {{.*#+}} xmm0 = xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7] sched: [1:1.00]			; HASWELL-NEXT: vpunpckhwd {{.*#+}} xmm0 = xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7] sched: [1:1.00]
	; HASWELL-NEXT: vpunpckhwd {{.*#+}} xmm0 = xmm0[4],mem[4],xmm0[5],mem[5],xmm0[6],mem[6],xmm0[7],mem[7] sched: [5:1.00]			; HASWELL-NEXT: vpunpckhwd {{.*#+}} xmm0 = xmm0[4],mem[4],xmm0[5],mem[5],xmm0[6],mem[6],xmm0[7],mem[7] sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_punpckhwd:			; BTVER2-LABEL: test_punpckhwd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpunpckhwd {{.*#+}} xmm0 = xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7] sched: [1:0.50]			; BTVER2-NEXT: vpunpckhwd {{.*#+}} xmm0 = xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7] sched: [1:0.50]
	; BTVER2-NEXT: vpunpckhwd {{.*#+}} xmm0 = xmm0[4],mem[4],xmm0[5],mem[5],xmm0[6],mem[6],xmm0[7],mem[7] sched: [6:1.00]			; BTVER2-NEXT: vpunpckhwd {{.*#+}} xmm0 = xmm0[4],mem[4],xmm0[5],mem[5],xmm0[6],mem[6],xmm0[7],mem[7] sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_punpckhwd:			; ZNVER1-LABEL: test_punpckhwd:
	Show All 34 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpunpcklbw {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3],xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7] sched: [1:0.50]			; SANDY-NEXT: vpunpcklbw {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3],xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7] sched: [1:0.50]
	; SANDY-NEXT: vpunpcklbw {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1],xmm0[2],mem[2],xmm0[3],mem[3],xmm0[4],mem[4],xmm0[5],mem[5],xmm0[6],mem[6],xmm0[7],mem[7] sched: [7:0.50]			; SANDY-NEXT: vpunpcklbw {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1],xmm0[2],mem[2],xmm0[3],mem[3],xmm0[4],mem[4],xmm0[5],mem[5],xmm0[6],mem[6],xmm0[7],mem[7] sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_punpcklbw:			; HASWELL-LABEL: test_punpcklbw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpunpcklbw {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3],xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7] sched: [1:1.00]			; HASWELL-NEXT: vpunpcklbw {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3],xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7] sched: [1:1.00]
	; HASWELL-NEXT: vpunpcklbw {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1],xmm0[2],mem[2],xmm0[3],mem[3],xmm0[4],mem[4],xmm0[5],mem[5],xmm0[6],mem[6],xmm0[7],mem[7] sched: [5:1.00]			; HASWELL-NEXT: vpunpcklbw {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1],xmm0[2],mem[2],xmm0[3],mem[3],xmm0[4],mem[4],xmm0[5],mem[5],xmm0[6],mem[6],xmm0[7],mem[7] sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_punpcklbw:			; BTVER2-LABEL: test_punpcklbw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpunpcklbw {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3],xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7] sched: [1:0.50]			; BTVER2-NEXT: vpunpcklbw {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3],xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7] sched: [1:0.50]
	; BTVER2-NEXT: vpunpcklbw {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1],xmm0[2],mem[2],xmm0[3],mem[3],xmm0[4],mem[4],xmm0[5],mem[5],xmm0[6],mem[6],xmm0[7],mem[7] sched: [6:1.00]			; BTVER2-NEXT: vpunpcklbw {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1],xmm0[2],mem[2],xmm0[3],mem[3],xmm0[4],mem[4],xmm0[5],mem[5],xmm0[6],mem[6],xmm0[7],mem[7] sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_punpcklbw:			; ZNVER1-LABEL: test_punpcklbw:
	Show All 36 Lines
	; SANDY-NEXT: vpunpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1] sched: [1:0.50]			; SANDY-NEXT: vpunpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1] sched: [1:0.50]
	; SANDY-NEXT: vpunpckldq {{.*#+}} xmm1 = xmm1[0],mem[0],xmm1[1],mem[1] sched: [7:0.50]			; SANDY-NEXT: vpunpckldq {{.*#+}} xmm1 = xmm1[0],mem[0],xmm1[1],mem[1] sched: [7:0.50]
	; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_punpckldq:			; HASWELL-LABEL: test_punpckldq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpunpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1] sched: [1:1.00]			; HASWELL-NEXT: vpunpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1] sched: [1:1.00]
	; HASWELL-NEXT: vpunpckldq {{.*#+}} xmm1 = xmm1[0],mem[0],xmm1[1],mem[1] sched: [5:1.00]			; HASWELL-NEXT: vpunpckldq {{.*#+}} xmm1 = xmm1[0],mem[0],xmm1[1],mem[1] sched: [1:1.00]
	; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_punpckldq:			; BTVER2-LABEL: test_punpckldq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpunpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1] sched: [1:0.50]			; BTVER2-NEXT: vpunpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1] sched: [1:0.50]
	; BTVER2-NEXT: vpunpckldq {{.*#+}} xmm1 = xmm1[0],mem[0],xmm1[1],mem[1] sched: [6:1.00]			; BTVER2-NEXT: vpunpckldq {{.*#+}} xmm1 = xmm1[0],mem[0],xmm1[1],mem[1] sched: [6:1.00]
	; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 37 Lines
	; SANDY-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0] sched: [1:0.50]			; SANDY-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0] sched: [1:0.50]
	; SANDY-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],mem[0] sched: [7:0.50]			; SANDY-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],mem[0] sched: [7:0.50]
	; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_punpcklqdq:			; HASWELL-LABEL: test_punpcklqdq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0] sched: [1:1.00]			; HASWELL-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0] sched: [1:1.00]
	; HASWELL-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],mem[0] sched: [5:1.00]			; HASWELL-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],mem[0] sched: [1:1.00]
	; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_punpcklqdq:			; BTVER2-LABEL: test_punpcklqdq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0] sched: [1:0.50]			; BTVER2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0] sched: [1:0.50]
	; BTVER2-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],mem[0] sched: [6:1.00]			; BTVER2-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],mem[0] sched: [6:1.00]
	; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 37 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpunpcklwd {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3] sched: [1:0.50]			; SANDY-NEXT: vpunpcklwd {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3] sched: [1:0.50]
	; SANDY-NEXT: vpunpcklwd {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1],xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:0.50]			; SANDY-NEXT: vpunpcklwd {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1],xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_punpcklwd:			; HASWELL-LABEL: test_punpcklwd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpunpcklwd {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3] sched: [1:1.00]			; HASWELL-NEXT: vpunpcklwd {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3] sched: [1:1.00]
	; HASWELL-NEXT: vpunpcklwd {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1],xmm0[2],mem[2],xmm0[3],mem[3] sched: [5:1.00]			; HASWELL-NEXT: vpunpcklwd {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1],xmm0[2],mem[2],xmm0[3],mem[3] sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_punpcklwd:			; BTVER2-LABEL: test_punpcklwd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpunpcklwd {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3] sched: [1:0.50]			; BTVER2-NEXT: vpunpcklwd {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3] sched: [1:0.50]
	; BTVER2-NEXT: vpunpcklwd {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1],xmm0[2],mem[2],xmm0[3],mem[3] sched: [6:1.00]			; BTVER2-NEXT: vpunpcklwd {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1],xmm0[2],mem[2],xmm0[3],mem[3] sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_punpcklwd:			; ZNVER1-LABEL: test_punpcklwd:
	Show All 34 Lines
	; SANDY-NEXT: vpxor %xmm1, %xmm0, %xmm0 # sched: [1:0.33]			; SANDY-NEXT: vpxor %xmm1, %xmm0, %xmm0 # sched: [1:0.33]
	; SANDY-NEXT: vpxor (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpxor (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pxor:			; HASWELL-LABEL: test_pxor:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpxor %xmm1, %xmm0, %xmm0 # sched: [1:0.33]			; HASWELL-NEXT: vpxor %xmm1, %xmm0, %xmm0 # sched: [1:0.33]
	; HASWELL-NEXT: vpxor (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpxor (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pxor:			; BTVER2-LABEL: test_pxor:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpxor %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpxor %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpxor (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpxor (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 37 Lines
	; SANDY-NEXT: vshufpd {{.*#+}} xmm0 = xmm0[1],xmm1[0] sched: [1:1.00]			; SANDY-NEXT: vshufpd {{.*#+}} xmm0 = xmm0[1],xmm1[0] sched: [1:1.00]
	; SANDY-NEXT: vshufpd {{.*#+}} xmm1 = xmm1[1],mem[0] sched: [7:1.00]			; SANDY-NEXT: vshufpd {{.*#+}} xmm1 = xmm1[1],mem[0] sched: [7:1.00]
	; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_shufpd:			; HASWELL-LABEL: test_shufpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vshufpd {{.*#+}} xmm0 = xmm0[1],xmm1[0] sched: [1:1.00]			; HASWELL-NEXT: vshufpd {{.*#+}} xmm0 = xmm0[1],xmm1[0] sched: [1:1.00]
	; HASWELL-NEXT: vshufpd {{.*#+}} xmm1 = xmm1[1],mem[0] sched: [5:1.00]			; HASWELL-NEXT: vshufpd {{.*#+}} xmm1 = xmm1[1],mem[0] sched: [1:1.00]
	; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_shufpd:			; BTVER2-LABEL: test_shufpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vshufpd {{.*#+}} xmm0 = xmm0[1],xmm1[0] sched: [1:0.50]			; BTVER2-NEXT: vshufpd {{.*#+}} xmm0 = xmm0[1],xmm1[0] sched: [1:0.50]
	; BTVER2-NEXT: vshufpd {{.*#+}} xmm1 = xmm1[1],mem[0] sched: [6:1.00]			; BTVER2-NEXT: vshufpd {{.*#+}} xmm1 = xmm1[1],mem[0] sched: [6:1.00]
	; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 37 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vsqrtpd %xmm0, %xmm0 # sched: [22:1.00]			; SANDY-NEXT: vsqrtpd %xmm0, %xmm0 # sched: [22:1.00]
	; SANDY-NEXT: vsqrtpd (%rdi), %xmm1 # sched: [28:1.00]			; SANDY-NEXT: vsqrtpd (%rdi), %xmm1 # sched: [28:1.00]
	; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_sqrtpd:			; HASWELL-LABEL: test_sqrtpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vsqrtpd %xmm0, %xmm0 # sched: [15:1.00]			; HASWELL-NEXT: vsqrtpd %xmm0, %xmm0 # sched: [21:1.00]
	; HASWELL-NEXT: vsqrtpd (%rdi), %xmm1 # sched: [19:1.00]			; HASWELL-NEXT: vsqrtpd (%rdi), %xmm1 # sched: [21:1.00]
	; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_sqrtpd:			; BTVER2-LABEL: test_sqrtpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vsqrtpd (%rdi), %xmm1 # sched: [26:21.00]			; BTVER2-NEXT: vsqrtpd (%rdi), %xmm1 # sched: [26:21.00]
	; BTVER2-NEXT: vsqrtpd %xmm0, %xmm0 # sched: [21:21.00]			; BTVER2-NEXT: vsqrtpd %xmm0, %xmm0 # sched: [21:21.00]
	; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vsqrtsd %xmm0, %xmm0, %xmm0 # sched: [21:1.00]			; SANDY-NEXT: vsqrtsd %xmm0, %xmm0, %xmm0 # sched: [21:1.00]
	; SANDY-NEXT: vmovapd (%rdi), %xmm1 # sched: [6:0.50]			; SANDY-NEXT: vmovapd (%rdi), %xmm1 # sched: [6:0.50]
	; SANDY-NEXT: vsqrtsd %xmm1, %xmm1, %xmm1 # sched: [21:1.00]			; SANDY-NEXT: vsqrtsd %xmm1, %xmm1, %xmm1 # sched: [21:1.00]
	; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_sqrtsd:			; HASWELL-LABEL: test_sqrtsd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vsqrtsd %xmm0, %xmm0, %xmm0 # sched: [19:1.00]			; HASWELL-NEXT: vsqrtsd %xmm0, %xmm0, %xmm0 # sched: [21:1.00]
	; HASWELL-NEXT: vmovapd (%rdi), %xmm1 # sched: [4:0.50]			; HASWELL-NEXT: vmovapd (%rdi), %xmm1 # sched: [1:0.50]
	; HASWELL-NEXT: vsqrtsd %xmm1, %xmm1, %xmm1 # sched: [19:1.00]			; HASWELL-NEXT: vsqrtsd %xmm1, %xmm1, %xmm1 # sched: [21:1.00]
	; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_sqrtsd:			; BTVER2-LABEL: test_sqrtsd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovapd (%rdi), %xmm1 # sched: [5:1.00]			; BTVER2-NEXT: vmovapd (%rdi), %xmm1 # sched: [5:1.00]
	; BTVER2-NEXT: vsqrtsd %xmm0, %xmm0, %xmm0 # sched: [26:21.00]			; BTVER2-NEXT: vsqrtsd %xmm0, %xmm0, %xmm0 # sched: [26:21.00]
	; BTVER2-NEXT: vsqrtsd %xmm1, %xmm1, %xmm1 # sched: [26:21.00]			; BTVER2-NEXT: vsqrtsd %xmm1, %xmm1, %xmm1 # sched: [26:21.00]
	; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	Show All 36 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vsubpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vsubpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vsubpd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vsubpd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_subpd:			; HASWELL-LABEL: test_subpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vsubpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vsubpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vsubpd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vsubpd (%rdi), %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_subpd:			; BTVER2-LABEL: test_subpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vsubpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vsubpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vsubpd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vsubpd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_subpd:			; ZNVER1-LABEL: test_subpd:
	Show All 30 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vsubsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vsubsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vsubsd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vsubsd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_subsd:			; HASWELL-LABEL: test_subsd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vsubsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vsubsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vsubsd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vsubsd (%rdi), %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_subsd:			; BTVER2-LABEL: test_subsd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vsubsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vsubsd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vsubsd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vsubsd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_subsd:			; ZNVER1-LABEL: test_subsd:
	▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
	; HASWELL-NEXT: sete %cl # sched: [1:0.50]			; HASWELL-NEXT: sete %cl # sched: [1:0.50]
	; HASWELL-NEXT: andb %al, %cl # sched: [1:0.25]			; HASWELL-NEXT: andb %al, %cl # sched: [1:0.25]
	; HASWELL-NEXT: vucomisd (%rdi), %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vucomisd (%rdi), %xmm0 # sched: [7:1.00]
	; HASWELL-NEXT: setnp %al # sched: [1:0.50]			; HASWELL-NEXT: setnp %al # sched: [1:0.50]
	; HASWELL-NEXT: sete %dl # sched: [1:0.50]			; HASWELL-NEXT: sete %dl # sched: [1:0.50]
	; HASWELL-NEXT: andb %al, %dl # sched: [1:0.25]			; HASWELL-NEXT: andb %al, %dl # sched: [1:0.25]
	; HASWELL-NEXT: orb %cl, %dl # sched: [1:0.25]			; HASWELL-NEXT: orb %cl, %dl # sched: [1:0.25]
	; HASWELL-NEXT: movzbl %dl, %eax # sched: [1:0.25]			; HASWELL-NEXT: movzbl %dl, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_ucomisd:			; BTVER2-LABEL: test_ucomisd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vucomisd %xmm1, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vucomisd %xmm1, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: setnp %al # sched: [1:0.50]			; BTVER2-NEXT: setnp %al # sched: [1:0.50]
	; BTVER2-NEXT: sete %cl # sched: [1:0.50]			; BTVER2-NEXT: sete %cl # sched: [1:0.50]
	; BTVER2-NEXT: andb %al, %cl # sched: [1:0.50]			; BTVER2-NEXT: andb %al, %cl # sched: [1:0.50]
	; BTVER2-NEXT: vucomisd (%rdi), %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vucomisd (%rdi), %xmm0 # sched: [8:1.00]
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vunpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1] sched: [1:1.00]			; SANDY-NEXT: vunpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1] sched: [1:1.00]
	; SANDY-NEXT: vunpckhpd {{.*#+}} xmm1 = xmm1[1],mem[1] sched: [7:1.00]			; SANDY-NEXT: vunpckhpd {{.*#+}} xmm1 = xmm1[1],mem[1] sched: [7:1.00]
	; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_unpckhpd:			; HASWELL-LABEL: test_unpckhpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vunpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1] sched: [1:1.00]			; HASWELL-NEXT: vunpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1] sched: [1:1.00]
	; HASWELL-NEXT: vunpckhpd {{.*#+}} xmm1 = xmm1[1],mem[1] sched: [5:1.00]			; HASWELL-NEXT: vunpckhpd {{.*#+}} xmm1 = xmm1[1],mem[1] sched: [1:1.00]
	; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_unpckhpd:			; BTVER2-LABEL: test_unpckhpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vunpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1] sched: [1:0.50]			; BTVER2-NEXT: vunpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1] sched: [1:0.50]
	; BTVER2-NEXT: vunpckhpd {{.*#+}} xmm1 = xmm1[1],mem[1] sched: [6:1.00]			; BTVER2-NEXT: vunpckhpd {{.*#+}} xmm1 = xmm1[1],mem[1] sched: [6:1.00]
	; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0] sched: [1:1.00]			; SANDY-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0] sched: [1:1.00]
	; SANDY-NEXT: vunpcklpd {{.*#+}} xmm1 = xmm0[0],mem[0] sched: [7:1.00]			; SANDY-NEXT: vunpcklpd {{.*#+}} xmm1 = xmm0[0],mem[0] sched: [7:1.00]
	; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_unpcklpd:			; HASWELL-LABEL: test_unpcklpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0] sched: [1:1.00]			; HASWELL-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0] sched: [1:1.00]
	; HASWELL-NEXT: vunpcklpd {{.*#+}} xmm1 = xmm0[0],mem[0] sched: [5:1.00]			; HASWELL-NEXT: vunpcklpd {{.*#+}} xmm1 = xmm0[0],mem[0] sched: [1:1.00]
	; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_unpcklpd:			; BTVER2-LABEL: test_unpcklpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0] sched: [1:0.50]			; BTVER2-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0] sched: [1:0.50]
	; BTVER2-NEXT: vunpcklpd {{.*#+}} xmm1 = xmm0[0],mem[0] sched: [6:1.00]			; BTVER2-NEXT: vunpcklpd {{.*#+}} xmm1 = xmm0[0],mem[0] sched: [6:1.00]
	; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 37 Lines
	; SANDY-NEXT: vxorpd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; SANDY-NEXT: vxorpd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; SANDY-NEXT: vxorpd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; SANDY-NEXT: vxorpd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; SANDY-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_xorpd:			; HASWELL-LABEL: test_xorpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vxorpd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vxorpd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vxorpd (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vxorpd (%rdi), %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_xorpd:			; BTVER2-LABEL: test_xorpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vxorpd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vxorpd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vxorpd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vxorpd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 18 Lines

test/CodeGen/X86/sse3-schedule.ll

	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vaddsubpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddsubpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vaddsubpd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vaddsubpd (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_addsubpd:			; HASWELL-LABEL: test_addsubpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vaddsubpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddsubpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vaddsubpd (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vaddsubpd (%rdi), %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_addsubpd:			; BTVER2-LABEL: test_addsubpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vaddsubpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddsubpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vaddsubpd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vaddsubpd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_addsubpd:			; ZNVER1-LABEL: test_addsubpd:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vaddsubps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddsubps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vaddsubps (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vaddsubps (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_addsubps:			; HASWELL-LABEL: test_addsubps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vaddsubps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddsubps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vaddsubps (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; HASWELL-NEXT: vaddsubps (%rdi), %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_addsubps:			; BTVER2-LABEL: test_addsubps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vaddsubps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddsubps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vaddsubps (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vaddsubps (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_addsubps:			; ZNVER1-LABEL: test_addsubps:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vhaddpd %xmm1, %xmm0, %xmm0 # sched: [5:2.00]			; SANDY-NEXT: vhaddpd %xmm1, %xmm0, %xmm0 # sched: [5:2.00]
	; SANDY-NEXT: vhaddpd (%rdi), %xmm0, %xmm0 # sched: [11:2.00]			; SANDY-NEXT: vhaddpd (%rdi), %xmm0, %xmm0 # sched: [11:2.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_haddpd:			; HASWELL-LABEL: test_haddpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vhaddpd %xmm1, %xmm0, %xmm0 # sched: [5:2.00]			; HASWELL-NEXT: vhaddpd %xmm1, %xmm0, %xmm0 # sched: [5:2.00]
	; HASWELL-NEXT: vhaddpd (%rdi), %xmm0, %xmm0 # sched: [9:2.00]			; HASWELL-NEXT: vhaddpd (%rdi), %xmm0, %xmm0 # sched: [5:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_haddpd:			; BTVER2-LABEL: test_haddpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vhaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vhaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vhaddpd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vhaddpd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_haddpd:			; ZNVER1-LABEL: test_haddpd:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vhaddps %xmm1, %xmm0, %xmm0 # sched: [5:2.00]			; SANDY-NEXT: vhaddps %xmm1, %xmm0, %xmm0 # sched: [5:2.00]
	; SANDY-NEXT: vhaddps (%rdi), %xmm0, %xmm0 # sched: [11:2.00]			; SANDY-NEXT: vhaddps (%rdi), %xmm0, %xmm0 # sched: [11:2.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_haddps:			; HASWELL-LABEL: test_haddps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vhaddps %xmm1, %xmm0, %xmm0 # sched: [5:2.00]			; HASWELL-NEXT: vhaddps %xmm1, %xmm0, %xmm0 # sched: [5:2.00]
	; HASWELL-NEXT: vhaddps (%rdi), %xmm0, %xmm0 # sched: [9:2.00]			; HASWELL-NEXT: vhaddps (%rdi), %xmm0, %xmm0 # sched: [5:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_haddps:			; BTVER2-LABEL: test_haddps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vhaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vhaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vhaddps (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vhaddps (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_haddps:			; ZNVER1-LABEL: test_haddps:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vhsubpd %xmm1, %xmm0, %xmm0 # sched: [5:2.00]			; SANDY-NEXT: vhsubpd %xmm1, %xmm0, %xmm0 # sched: [5:2.00]
	; SANDY-NEXT: vhsubpd (%rdi), %xmm0, %xmm0 # sched: [11:2.00]			; SANDY-NEXT: vhsubpd (%rdi), %xmm0, %xmm0 # sched: [11:2.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_hsubpd:			; HASWELL-LABEL: test_hsubpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vhsubpd %xmm1, %xmm0, %xmm0 # sched: [5:2.00]			; HASWELL-NEXT: vhsubpd %xmm1, %xmm0, %xmm0 # sched: [5:2.00]
	; HASWELL-NEXT: vhsubpd (%rdi), %xmm0, %xmm0 # sched: [9:2.00]			; HASWELL-NEXT: vhsubpd (%rdi), %xmm0, %xmm0 # sched: [5:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_hsubpd:			; BTVER2-LABEL: test_hsubpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vhsubpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vhsubpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vhsubpd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vhsubpd (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_hsubpd:			; ZNVER1-LABEL: test_hsubpd:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vhsubps %xmm1, %xmm0, %xmm0 # sched: [5:2.00]			; SANDY-NEXT: vhsubps %xmm1, %xmm0, %xmm0 # sched: [5:2.00]
	; SANDY-NEXT: vhsubps (%rdi), %xmm0, %xmm0 # sched: [11:2.00]			; SANDY-NEXT: vhsubps (%rdi), %xmm0, %xmm0 # sched: [11:2.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_hsubps:			; HASWELL-LABEL: test_hsubps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vhsubps %xmm1, %xmm0, %xmm0 # sched: [5:2.00]			; HASWELL-NEXT: vhsubps %xmm1, %xmm0, %xmm0 # sched: [5:2.00]
	; HASWELL-NEXT: vhsubps (%rdi), %xmm0, %xmm0 # sched: [9:2.00]			; HASWELL-NEXT: vhsubps (%rdi), %xmm0, %xmm0 # sched: [5:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_hsubps:			; BTVER2-LABEL: test_hsubps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vhsubps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vhsubps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vhsubps (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vhsubps (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_hsubps:			; ZNVER1-LABEL: test_hsubps:
	Show All 28 Lines
	;			;
	; SANDY-LABEL: test_lddqu:			; SANDY-LABEL: test_lddqu:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vlddqu (%rdi), %xmm0 # sched: [6:0.50]			; SANDY-NEXT: vlddqu (%rdi), %xmm0 # sched: [6:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_lddqu:			; HASWELL-LABEL: test_lddqu:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vlddqu (%rdi), %xmm0 # sched: [4:0.50]			; HASWELL-NEXT: vlddqu (%rdi), %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_lddqu:			; BTVER2-LABEL: test_lddqu:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vlddqu (%rdi), %xmm0 # sched: [5:1.00]			; BTVER2-NEXT: vlddqu (%rdi), %xmm0 # sched: [5:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_lddqu:			; ZNVER1-LABEL: test_lddqu:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 33 Lines
	; SANDY-NEXT: monitor # sched: [100:0.33]			; SANDY-NEXT: monitor # sched: [100:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_monitor:			; HASWELL-LABEL: test_monitor:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: leaq (%rdi), %rax # sched: [1:0.50]			; HASWELL-NEXT: leaq (%rdi), %rax # sched: [1:0.50]
	; HASWELL-NEXT: movl %esi, %ecx # sched: [1:0.25]			; HASWELL-NEXT: movl %esi, %ecx # sched: [1:0.25]
	; HASWELL-NEXT: monitor # sched: [100:0.25]			; HASWELL-NEXT: monitor # sched: [100:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_monitor:			; BTVER2-LABEL: test_monitor:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: leaq (%rdi), %rax # sched: [1:0.50]			; BTVER2-NEXT: leaq (%rdi), %rax # sched: [1:0.50]
	; BTVER2-NEXT: movl %esi, %ecx # sched: [1:0.17]			; BTVER2-NEXT: movl %esi, %ecx # sched: [1:0.17]
	; BTVER2-NEXT: monitor # sched: [100:0.17]			; BTVER2-NEXT: monitor # sched: [100:0.17]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 36 Lines
	; SANDY-NEXT: vmovddup {{.*#+}} xmm0 = xmm0[0,0] sched: [1:1.00]			; SANDY-NEXT: vmovddup {{.*#+}} xmm0 = xmm0[0,0] sched: [1:1.00]
	; SANDY-NEXT: vmovddup {{.*#+}} xmm1 = mem[0,0] sched: [6:0.50]			; SANDY-NEXT: vmovddup {{.*#+}} xmm1 = mem[0,0] sched: [6:0.50]
	; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movddup:			; HASWELL-LABEL: test_movddup:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovddup {{.*#+}} xmm0 = xmm0[0,0] sched: [1:1.00]			; HASWELL-NEXT: vmovddup {{.*#+}} xmm0 = xmm0[0,0] sched: [1:1.00]
	; HASWELL-NEXT: vmovddup {{.*#+}} xmm1 = mem[0,0] sched: [4:0.50]			; HASWELL-NEXT: vmovddup {{.*#+}} xmm1 = mem[0,0] sched: [1:0.50]
	; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movddup:			; BTVER2-LABEL: test_movddup:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovddup {{.*#+}} xmm1 = mem[0,0] sched: [5:1.00]			; BTVER2-NEXT: vmovddup {{.*#+}} xmm1 = mem[0,0] sched: [5:1.00]
	; BTVER2-NEXT: vmovddup {{.*#+}} xmm0 = xmm0[0,0] sched: [1:0.50]			; BTVER2-NEXT: vmovddup {{.*#+}} xmm0 = xmm0[0,0] sched: [1:0.50]
	; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 38 Lines
	; SANDY-NEXT: vmovshdup {{.*#+}} xmm0 = xmm0[1,1,3,3] sched: [1:1.00]			; SANDY-NEXT: vmovshdup {{.*#+}} xmm0 = xmm0[1,1,3,3] sched: [1:1.00]
	; SANDY-NEXT: vmovshdup {{.*#+}} xmm1 = mem[1,1,3,3] sched: [6:0.50]			; SANDY-NEXT: vmovshdup {{.*#+}} xmm1 = mem[1,1,3,3] sched: [6:0.50]
	; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movshdup:			; HASWELL-LABEL: test_movshdup:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovshdup {{.*#+}} xmm0 = xmm0[1,1,3,3] sched: [1:1.00]			; HASWELL-NEXT: vmovshdup {{.*#+}} xmm0 = xmm0[1,1,3,3] sched: [1:1.00]
	; HASWELL-NEXT: vmovshdup {{.*#+}} xmm1 = mem[1,1,3,3] sched: [4:0.50]			; HASWELL-NEXT: vmovshdup {{.*#+}} xmm1 = mem[1,1,3,3] sched: [1:0.50]
	; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movshdup:			; BTVER2-LABEL: test_movshdup:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovshdup {{.*#+}} xmm1 = mem[1,1,3,3] sched: [5:1.00]			; BTVER2-NEXT: vmovshdup {{.*#+}} xmm1 = mem[1,1,3,3] sched: [5:1.00]
	; BTVER2-NEXT: vmovshdup {{.*#+}} xmm0 = xmm0[1,1,3,3] sched: [1:0.50]			; BTVER2-NEXT: vmovshdup {{.*#+}} xmm0 = xmm0[1,1,3,3] sched: [1:0.50]
	; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 38 Lines
	; SANDY-NEXT: vmovsldup {{.*#+}} xmm0 = xmm0[0,0,2,2] sched: [1:1.00]			; SANDY-NEXT: vmovsldup {{.*#+}} xmm0 = xmm0[0,0,2,2] sched: [1:1.00]
	; SANDY-NEXT: vmovsldup {{.*#+}} xmm1 = mem[0,0,2,2] sched: [6:0.50]			; SANDY-NEXT: vmovsldup {{.*#+}} xmm1 = mem[0,0,2,2] sched: [6:0.50]
	; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movsldup:			; HASWELL-LABEL: test_movsldup:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovsldup {{.*#+}} xmm0 = xmm0[0,0,2,2] sched: [1:1.00]			; HASWELL-NEXT: vmovsldup {{.*#+}} xmm0 = xmm0[0,0,2,2] sched: [1:1.00]
	; HASWELL-NEXT: vmovsldup {{.*#+}} xmm1 = mem[0,0,2,2] sched: [4:0.50]			; HASWELL-NEXT: vmovsldup {{.*#+}} xmm1 = mem[0,0,2,2] sched: [1:0.50]
	; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movsldup:			; BTVER2-LABEL: test_movsldup:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovsldup {{.*#+}} xmm1 = mem[0,0,2,2] sched: [5:1.00]			; BTVER2-NEXT: vmovsldup {{.*#+}} xmm1 = mem[0,0,2,2] sched: [5:1.00]
	; BTVER2-NEXT: vmovsldup {{.*#+}} xmm0 = xmm0[0,0,2,2] sched: [1:0.50]			; BTVER2-NEXT: vmovsldup {{.*#+}} xmm0 = xmm0[0,0,2,2] sched: [1:0.50]
	; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 38 Lines
	; SANDY-NEXT: movl %esi, %eax # sched: [1:0.33]			; SANDY-NEXT: movl %esi, %eax # sched: [1:0.33]
	; SANDY-NEXT: mwait # sched: [100:0.33]			; SANDY-NEXT: mwait # sched: [100:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_mwait:			; HASWELL-LABEL: test_mwait:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: movl %edi, %ecx # sched: [1:0.25]			; HASWELL-NEXT: movl %edi, %ecx # sched: [1:0.25]
	; HASWELL-NEXT: movl %esi, %eax # sched: [1:0.25]			; HASWELL-NEXT: movl %esi, %eax # sched: [1:0.25]
	; HASWELL-NEXT: mwait # sched: [100:0.25]			; HASWELL-NEXT: mwait # sched: [20:2.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_mwait:			; BTVER2-LABEL: test_mwait:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: movl %edi, %ecx # sched: [1:0.17]			; BTVER2-NEXT: movl %edi, %ecx # sched: [1:0.17]
	; BTVER2-NEXT: movl %esi, %eax # sched: [1:0.17]			; BTVER2-NEXT: movl %esi, %eax # sched: [1:0.17]
	; BTVER2-NEXT: mwait # sched: [100:0.17]			; BTVER2-NEXT: mwait # sched: [100:0.17]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 10 Lines

test/CodeGen/X86/sse41-schedule.ll

	Show All 28 Lines
	; SANDY-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vblendpd {{.*#+}} xmm0 = xmm0[0],mem[1] sched: [7:0.50]			; SANDY-NEXT: vblendpd {{.*#+}} xmm0 = xmm0[0],mem[1] sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_blendpd:			; HASWELL-LABEL: test_blendpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vblendpd {{.*#+}} xmm0 = xmm0[0],xmm1[1] sched: [1:0.33]			; HASWELL-NEXT: vblendpd {{.*#+}} xmm0 = xmm0[0],xmm1[1] sched: [1:0.33]
	; HASWELL-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: vblendpd {{.*#+}} xmm0 = xmm0[0],mem[1] sched: [5:0.50]			; HASWELL-NEXT: vblendpd {{.*#+}} xmm0 = xmm0[0],mem[1] sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_blendpd:			; BTVER2-LABEL: test_blendpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vblendpd {{.*#+}} xmm0 = xmm0[0],xmm1[1] sched: [1:0.50]			; BTVER2-NEXT: vblendpd {{.*#+}} xmm0 = xmm0[0],xmm1[1] sched: [1:0.50]
	; BTVER2-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vblendpd {{.*#+}} xmm0 = xmm0[0],mem[1] sched: [6:1.00]			; BTVER2-NEXT: vblendpd {{.*#+}} xmm0 = xmm0[0],mem[1] sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 27 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vblendps {{.*#+}} xmm0 = xmm0[0],xmm1[1,2],xmm0[3] sched: [1:0.50]			; SANDY-NEXT: vblendps {{.*#+}} xmm0 = xmm0[0],xmm1[1,2],xmm0[3] sched: [1:0.50]
	; SANDY-NEXT: vblendps {{.*#+}} xmm0 = xmm0[0],mem[1],xmm0[2,3] sched: [7:0.50]			; SANDY-NEXT: vblendps {{.*#+}} xmm0 = xmm0[0],mem[1],xmm0[2,3] sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_blendps:			; HASWELL-LABEL: test_blendps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vblendps {{.*#+}} xmm0 = xmm0[0],xmm1[1,2],xmm0[3] sched: [1:0.33]			; HASWELL-NEXT: vblendps {{.*#+}} xmm0 = xmm0[0],xmm1[1,2],xmm0[3] sched: [1:0.33]
	; HASWELL-NEXT: vblendps {{.*#+}} xmm0 = xmm0[0],mem[1],xmm0[2,3] sched: [5:0.50]			; HASWELL-NEXT: vblendps {{.*#+}} xmm0 = xmm0[0],mem[1],xmm0[2,3] sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_blendps:			; BTVER2-LABEL: test_blendps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vblendps {{.*#+}} xmm0 = xmm0[0],xmm1[1,2],xmm0[3] sched: [1:0.50]			; BTVER2-NEXT: vblendps {{.*#+}} xmm0 = xmm0[0],xmm1[1,2],xmm0[3] sched: [1:0.50]
	; BTVER2-NEXT: vblendps {{.*#+}} xmm0 = xmm0[0],mem[1],xmm0[2,3] sched: [6:1.00]			; BTVER2-NEXT: vblendps {{.*#+}} xmm0 = xmm0[0],mem[1],xmm0[2,3] sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_blendps:			; ZNVER1-LABEL: test_blendps:
	Show All 30 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vblendvpd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; SANDY-NEXT: vblendvpd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; SANDY-NEXT: vblendvpd %xmm2, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; SANDY-NEXT: vblendvpd %xmm2, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_blendvpd:			; HASWELL-LABEL: test_blendvpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vblendvpd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [2:2.00]			; HASWELL-NEXT: vblendvpd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [2:2.00]
	; HASWELL-NEXT: vblendvpd %xmm2, (%rdi), %xmm0, %xmm0 # sched: [6:2.00]			; HASWELL-NEXT: vblendvpd %xmm2, (%rdi), %xmm0, %xmm0 # sched: [2:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_blendvpd:			; BTVER2-LABEL: test_blendvpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vblendvpd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; BTVER2-NEXT: vblendvpd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; BTVER2-NEXT: vblendvpd %xmm2, (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vblendvpd %xmm2, (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_blendvpd:			; ZNVER1-LABEL: test_blendvpd:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vblendvps %xmm2, %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; SANDY-NEXT: vblendvps %xmm2, %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; SANDY-NEXT: vblendvps %xmm2, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; SANDY-NEXT: vblendvps %xmm2, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_blendvps:			; HASWELL-LABEL: test_blendvps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vblendvps %xmm2, %xmm1, %xmm0, %xmm0 # sched: [2:2.00]			; HASWELL-NEXT: vblendvps %xmm2, %xmm1, %xmm0, %xmm0 # sched: [2:2.00]
	; HASWELL-NEXT: vblendvps %xmm2, (%rdi), %xmm0, %xmm0 # sched: [6:2.00]			; HASWELL-NEXT: vblendvps %xmm2, (%rdi), %xmm0, %xmm0 # sched: [2:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_blendvps:			; BTVER2-LABEL: test_blendvps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vblendvps %xmm2, %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; BTVER2-NEXT: vblendvps %xmm2, %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; BTVER2-NEXT: vblendvps %xmm2, (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vblendvps %xmm2, (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_blendvps:			; ZNVER1-LABEL: test_blendvps:
	Show All 25 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vdppd $7, %xmm1, %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vdppd $7, %xmm1, %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: vdppd $7, (%rdi), %xmm0, %xmm0 # sched: [15:1.00]			; SANDY-NEXT: vdppd $7, (%rdi), %xmm0, %xmm0 # sched: [15:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_dppd:			; HASWELL-LABEL: test_dppd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vdppd $7, %xmm1, %xmm0, %xmm0 # sched: [9:1.00]			; HASWELL-NEXT: vdppd $7, %xmm1, %xmm0, %xmm0 # sched: [9:1.00]
	; HASWELL-NEXT: vdppd $7, (%rdi), %xmm0, %xmm0 # sched: [13:1.00]			; HASWELL-NEXT: vdppd $7, (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_dppd:			; BTVER2-LABEL: test_dppd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vdppd $7, %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vdppd $7, %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vdppd $7, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vdppd $7, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_dppd:			; ZNVER1-LABEL: test_dppd:
	Show All 25 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vdpps $7, %xmm1, %xmm0, %xmm0 # sched: [12:2.00]			; SANDY-NEXT: vdpps $7, %xmm1, %xmm0, %xmm0 # sched: [12:2.00]
	; SANDY-NEXT: vdpps $7, (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; SANDY-NEXT: vdpps $7, (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_dpps:			; HASWELL-LABEL: test_dpps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vdpps $7, %xmm1, %xmm0, %xmm0 # sched: [14:2.00]			; HASWELL-NEXT: vdpps $7, %xmm1, %xmm0, %xmm0 # sched: [14:2.00]
	; HASWELL-NEXT: vdpps $7, (%rdi), %xmm0, %xmm0 # sched: [18:2.00]			; HASWELL-NEXT: vdpps $7, (%rdi), %xmm0, %xmm0 # sched: [14:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_dpps:			; BTVER2-LABEL: test_dpps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vdpps $7, %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vdpps $7, %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vdpps $7, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vdpps $7, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_dpps:			; ZNVER1-LABEL: test_dpps:
	Show All 25 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vinsertps {{.*#+}} xmm0 = zero,xmm1[0],xmm0[2,3] sched: [1:1.00]			; SANDY-NEXT: vinsertps {{.*#+}} xmm0 = zero,xmm1[0],xmm0[2,3] sched: [1:1.00]
	; SANDY-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,1,2],mem[0] sched: [7:1.00]			; SANDY-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,1,2],mem[0] sched: [7:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_insertps:			; HASWELL-LABEL: test_insertps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vinsertps {{.*#+}} xmm0 = zero,xmm1[0],xmm0[2,3] sched: [1:1.00]			; HASWELL-NEXT: vinsertps {{.*#+}} xmm0 = zero,xmm1[0],xmm0[2,3] sched: [1:1.00]
	; HASWELL-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,1,2],mem[0] sched: [5:1.00]			; HASWELL-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,1,2],mem[0] sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_insertps:			; BTVER2-LABEL: test_insertps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vinsertps {{.*#+}} xmm0 = zero,xmm1[0],xmm0[2,3] sched: [1:0.50]			; BTVER2-NEXT: vinsertps {{.*#+}} xmm0 = zero,xmm1[0],xmm0[2,3] sched: [1:0.50]
	; BTVER2-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,1,2],mem[0] sched: [6:1.00]			; BTVER2-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,1,2],mem[0] sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_insertps:			; ZNVER1-LABEL: test_insertps:
	Show All 21 Lines
	;			;
	; SANDY-LABEL: test_movntdqa:			; SANDY-LABEL: test_movntdqa:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmovntdqa (%rdi), %xmm0 # sched: [6:0.50]			; SANDY-NEXT: vmovntdqa (%rdi), %xmm0 # sched: [6:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_movntdqa:			; HASWELL-LABEL: test_movntdqa:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmovntdqa (%rdi), %xmm0 # sched: [4:0.50]			; HASWELL-NEXT: vmovntdqa (%rdi), %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_movntdqa:			; BTVER2-LABEL: test_movntdqa:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmovntdqa (%rdi), %xmm0 # sched: [5:1.00]			; BTVER2-NEXT: vmovntdqa (%rdi), %xmm0 # sched: [5:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_movntdqa:			; ZNVER1-LABEL: test_movntdqa:
	; ZNVER1: # BB#0:			; ZNVER1: # BB#0:
	Show All 20 Lines
	; SANDY-LABEL: test_mpsadbw:			; SANDY-LABEL: test_mpsadbw:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vmpsadbw $7, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vmpsadbw $7, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: vmpsadbw $7, (%rdi), %xmm0, %xmm0 # sched: [11:1.00]			; SANDY-NEXT: vmpsadbw $7, (%rdi), %xmm0, %xmm0 # sched: [11:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_mpsadbw:			; HASWELL-LABEL: test_mpsadbw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vmpsadbw $7, %xmm1, %xmm0, %xmm0 # sched: [6:2.00]			; HASWELL-NEXT: vmpsadbw $7, %xmm1, %xmm0, %xmm0 # sched: [7:2.00]
	; HASWELL-NEXT: vmpsadbw $7, (%rdi), %xmm0, %xmm0 # sched: [6:2.00]			; HASWELL-NEXT: vmpsadbw $7, (%rdi), %xmm0, %xmm0 # sched: [7:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_mpsadbw:			; BTVER2-LABEL: test_mpsadbw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vmpsadbw $7, %xmm1, %xmm0, %xmm0 # sched: [3:2.00]			; BTVER2-NEXT: vmpsadbw $7, %xmm1, %xmm0, %xmm0 # sched: [3:2.00]
	; BTVER2-NEXT: vmpsadbw $7, (%rdi), %xmm0, %xmm0 # sched: [8:2.00]			; BTVER2-NEXT: vmpsadbw $7, (%rdi), %xmm0, %xmm0 # sched: [8:2.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_mpsadbw:			; ZNVER1-LABEL: test_mpsadbw:
	Show All 26 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpackusdw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpackusdw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpackusdw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpackusdw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_packusdw:			; HASWELL-LABEL: test_packusdw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpackusdw %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpackusdw %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vpackusdw (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpackusdw (%rdi), %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_packusdw:			; BTVER2-LABEL: test_packusdw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpackusdw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpackusdw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpackusdw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpackusdw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_packusdw:			; ZNVER1-LABEL: test_packusdw:
	Show All 32 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; SANDY-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; SANDY-NEXT: vpblendvb %xmm2, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; SANDY-NEXT: vpblendvb %xmm2, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pblendvb:			; HASWELL-LABEL: test_pblendvb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0 # sched: [2:2.00]			; HASWELL-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0 # sched: [2:2.00]
	; HASWELL-NEXT: vpblendvb %xmm2, (%rdi), %xmm0, %xmm0 # sched: [6:2.00]			; HASWELL-NEXT: vpblendvb %xmm2, (%rdi), %xmm0, %xmm0 # sched: [2:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pblendvb:			; BTVER2-LABEL: test_pblendvb:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; BTVER2-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; BTVER2-NEXT: vpblendvb %xmm2, (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vpblendvb %xmm2, (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pblendvb:			; ZNVER1-LABEL: test_pblendvb:
	Show All 26 Lines
	; SANDY-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3],xmm0[4],xmm1[5],xmm0[6],xmm1[7] sched: [1:0.50]			; SANDY-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3],xmm0[4],xmm1[5],xmm0[6],xmm1[7] sched: [1:0.50]
	; SANDY-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1],mem[2,3],xmm0[4,5,6],mem[7] sched: [7:0.50]			; SANDY-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1],mem[2,3],xmm0[4,5,6],mem[7] sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pblendw:			; HASWELL-LABEL: test_pblendw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3],xmm0[4],xmm1[5],xmm0[6],xmm1[7] sched: [1:1.00]			; HASWELL-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3],xmm0[4],xmm1[5],xmm0[6],xmm1[7] sched: [1:1.00]
	; HASWELL-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1],mem[2,3],xmm0[4,5,6],mem[7] sched: [4:1.00]			; HASWELL-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1],mem[2,3],xmm0[4,5,6],mem[7] sched: [4:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pblendw:			; BTVER2-LABEL: test_pblendw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3],xmm0[4],xmm1[5],xmm0[6],xmm1[7] sched: [1:0.50]			; BTVER2-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3],xmm0[4],xmm1[5],xmm0[6],xmm1[7] sched: [1:0.50]
	; BTVER2-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1],mem[2,3],xmm0[4,5,6],mem[7] sched: [6:1.00]			; BTVER2-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1],mem[2,3],xmm0[4,5,6],mem[7] sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pblendw:			; ZNVER1-LABEL: test_pblendw:
	Show All 24 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpcmpeqq (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpcmpeqq (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pcmpeqq:			; HASWELL-LABEL: test_pcmpeqq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpcmpeqq (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpcmpeqq (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pcmpeqq:			; BTVER2-LABEL: test_pcmpeqq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpcmpeqq (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpcmpeqq (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pcmpeqq:			; ZNVER1-LABEL: test_pcmpeqq:
	Show All 25 Lines
	; SANDY-LABEL: test_pextrb:			; SANDY-LABEL: test_pextrb:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpextrb $3, %xmm0, %eax # sched: [3:1.00]			; SANDY-NEXT: vpextrb $3, %xmm0, %eax # sched: [3:1.00]
	; SANDY-NEXT: vpextrb $1, %xmm0, (%rdi) # sched: [5:1.00]			; SANDY-NEXT: vpextrb $1, %xmm0, (%rdi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pextrb:			; HASWELL-LABEL: test_pextrb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpextrb $3, %xmm0, %eax # sched: [1:1.00]			; HASWELL-NEXT: vpextrb $3, %xmm0, %eax # sched: [2:1.00]
	; HASWELL-NEXT: vpextrb $1, %xmm0, (%rdi) # sched: [5:1.00]			; HASWELL-NEXT: vpextrb $1, %xmm0, (%rdi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pextrb:			; BTVER2-LABEL: test_pextrb:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpextrb $3, %xmm0, %eax # sched: [1:0.50]			; BTVER2-NEXT: vpextrb $3, %xmm0, %eax # sched: [1:0.50]
	; BTVER2-NEXT: vpextrb $1, %xmm0, (%rdi) # sched: [6:1.00]			; BTVER2-NEXT: vpextrb $1, %xmm0, (%rdi) # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pextrb:			; ZNVER1-LABEL: test_pextrb:
	Show All 24 Lines
	; SANDY-LABEL: test_pextrd:			; SANDY-LABEL: test_pextrd:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpextrd $3, %xmm0, %eax # sched: [3:1.00]			; SANDY-NEXT: vpextrd $3, %xmm0, %eax # sched: [3:1.00]
	; SANDY-NEXT: vpextrd $1, %xmm0, (%rdi) # sched: [5:1.00]			; SANDY-NEXT: vpextrd $1, %xmm0, (%rdi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pextrd:			; HASWELL-LABEL: test_pextrd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpextrd $3, %xmm0, %eax # sched: [1:1.00]			; HASWELL-NEXT: vpextrd $3, %xmm0, %eax # sched: [2:1.00]
	; HASWELL-NEXT: vpextrd $1, %xmm0, (%rdi) # sched: [5:1.00]			; HASWELL-NEXT: vpextrd $1, %xmm0, (%rdi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pextrd:			; BTVER2-LABEL: test_pextrd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpextrd $3, %xmm0, %eax # sched: [1:0.50]			; BTVER2-NEXT: vpextrd $3, %xmm0, %eax # sched: [1:0.50]
	; BTVER2-NEXT: vpextrd $1, %xmm0, (%rdi) # sched: [6:1.00]			; BTVER2-NEXT: vpextrd $1, %xmm0, (%rdi) # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pextrd:			; ZNVER1-LABEL: test_pextrd:
	Show All 23 Lines
	; SANDY-LABEL: test_pextrq:			; SANDY-LABEL: test_pextrq:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpextrq $1, %xmm0, %rax # sched: [3:1.00]			; SANDY-NEXT: vpextrq $1, %xmm0, %rax # sched: [3:1.00]
	; SANDY-NEXT: vpextrq $1, %xmm0, (%rdi) # sched: [5:1.00]			; SANDY-NEXT: vpextrq $1, %xmm0, (%rdi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pextrq:			; HASWELL-LABEL: test_pextrq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpextrq $1, %xmm0, %rax # sched: [1:1.00]			; HASWELL-NEXT: vpextrq $1, %xmm0, %rax # sched: [2:1.00]
	; HASWELL-NEXT: vpextrq $1, %xmm0, (%rdi) # sched: [5:1.00]			; HASWELL-NEXT: vpextrq $1, %xmm0, (%rdi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pextrq:			; BTVER2-LABEL: test_pextrq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpextrq $1, %xmm0, %rax # sched: [1:0.50]			; BTVER2-NEXT: vpextrq $1, %xmm0, %rax # sched: [1:0.50]
	; BTVER2-NEXT: vpextrq $1, %xmm0, (%rdi) # sched: [6:1.00]			; BTVER2-NEXT: vpextrq $1, %xmm0, (%rdi) # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pextrq:			; ZNVER1-LABEL: test_pextrq:
	Show All 23 Lines
	; SANDY-LABEL: test_pextrw:			; SANDY-LABEL: test_pextrw:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpextrw $3, %xmm0, %eax # sched: [3:1.00]			; SANDY-NEXT: vpextrw $3, %xmm0, %eax # sched: [3:1.00]
	; SANDY-NEXT: vpextrw $1, %xmm0, (%rdi) # sched: [5:1.00]			; SANDY-NEXT: vpextrw $1, %xmm0, (%rdi) # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pextrw:			; HASWELL-LABEL: test_pextrw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpextrw $3, %xmm0, %eax # sched: [1:1.00]			; HASWELL-NEXT: vpextrw $3, %xmm0, %eax # sched: [2:1.00]
	; HASWELL-NEXT: vpextrw $1, %xmm0, (%rdi) # sched: [5:1.00]			; HASWELL-NEXT: vpextrw $1, %xmm0, (%rdi) # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pextrw:			; BTVER2-LABEL: test_pextrw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpextrw $3, %xmm0, %eax # sched: [1:0.50]			; BTVER2-NEXT: vpextrw $3, %xmm0, %eax # sched: [1:0.50]
	; BTVER2-NEXT: vpextrw $1, %xmm0, (%rdi) # sched: [6:1.00]			; BTVER2-NEXT: vpextrw $1, %xmm0, (%rdi) # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pextrw:			; ZNVER1-LABEL: test_pextrw:
	Show All 24 Lines
	; SANDY-LABEL: test_phminposuw:			; SANDY-LABEL: test_phminposuw:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vphminposuw (%rdi), %xmm0 # sched: [11:1.00]			; SANDY-NEXT: vphminposuw (%rdi), %xmm0 # sched: [11:1.00]
	; SANDY-NEXT: vphminposuw %xmm0, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vphminposuw %xmm0, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_phminposuw:			; HASWELL-LABEL: test_phminposuw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vphminposuw (%rdi), %xmm0 # sched: [9:1.00]			; HASWELL-NEXT: vphminposuw (%rdi), %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: vphminposuw %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vphminposuw %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_phminposuw:			; BTVER2-LABEL: test_phminposuw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vphminposuw (%rdi), %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vphminposuw (%rdi), %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: vphminposuw %xmm0, %xmm0 # sched: [2:1.00]			; BTVER2-NEXT: vphminposuw %xmm0, %xmm0 # sched: [2:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_phminposuw:			; ZNVER1-LABEL: test_phminposuw:
	Show All 24 Lines
	; SANDY-LABEL: test_pinsrb:			; SANDY-LABEL: test_pinsrb:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpinsrb $1, %edi, %xmm0, %xmm0 # sched: [2:1.00]			; SANDY-NEXT: vpinsrb $1, %edi, %xmm0, %xmm0 # sched: [2:1.00]
	; SANDY-NEXT: vpinsrb $3, (%rsi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpinsrb $3, (%rsi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pinsrb:			; HASWELL-LABEL: test_pinsrb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpinsrb $1, %edi, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpinsrb $1, %edi, %xmm0, %xmm0 # sched: [2:2.00]
	; HASWELL-NEXT: vpinsrb $3, (%rsi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpinsrb $3, (%rsi), %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pinsrb:			; BTVER2-LABEL: test_pinsrb:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpinsrb $1, %edi, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpinsrb $1, %edi, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpinsrb $3, (%rsi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpinsrb $3, (%rsi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pinsrb:			; ZNVER1-LABEL: test_pinsrb:
	Show All 23 Lines
	; SANDY-LABEL: test_pinsrd:			; SANDY-LABEL: test_pinsrd:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpinsrd $1, %edi, %xmm0, %xmm0 # sched: [2:1.00]			; SANDY-NEXT: vpinsrd $1, %edi, %xmm0, %xmm0 # sched: [2:1.00]
	; SANDY-NEXT: vpinsrd $3, (%rsi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpinsrd $3, (%rsi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pinsrd:			; HASWELL-LABEL: test_pinsrd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpinsrd $1, %edi, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpinsrd $1, %edi, %xmm0, %xmm0 # sched: [2:2.00]
	; HASWELL-NEXT: vpinsrd $3, (%rsi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpinsrd $3, (%rsi), %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pinsrd:			; BTVER2-LABEL: test_pinsrd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpinsrd $1, %edi, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpinsrd $1, %edi, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpinsrd $3, (%rsi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpinsrd $3, (%rsi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pinsrd:			; ZNVER1-LABEL: test_pinsrd:
	Show All 26 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpinsrq $1, %rdi, %xmm0, %xmm0 # sched: [2:1.00]			; SANDY-NEXT: vpinsrq $1, %rdi, %xmm0, %xmm0 # sched: [2:1.00]
	; SANDY-NEXT: vpinsrq $1, (%rsi), %xmm1, %xmm1 # sched: [7:0.50]			; SANDY-NEXT: vpinsrq $1, (%rsi), %xmm1, %xmm1 # sched: [7:0.50]
	; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pinsrq:			; HASWELL-LABEL: test_pinsrq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpinsrq $1, %rdi, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpinsrq $1, %rdi, %xmm0, %xmm0 # sched: [2:2.00]
	; HASWELL-NEXT: vpinsrq $1, (%rsi), %xmm1, %xmm1 # sched: [5:1.00]			; HASWELL-NEXT: vpinsrq $1, (%rsi), %xmm1, %xmm1 # sched: [1:1.00]
	; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pinsrq:			; BTVER2-LABEL: test_pinsrq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpinsrq $1, (%rsi), %xmm1, %xmm1 # sched: [6:1.00]			; BTVER2-NEXT: vpinsrq $1, (%rsi), %xmm1, %xmm1 # sched: [6:1.00]
	; BTVER2-NEXT: vpinsrq $1, %rdi, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpinsrq $1, %rdi, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 27 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpmaxsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpmaxsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpmaxsb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpmaxsb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmaxsb:			; HASWELL-LABEL: test_pmaxsb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmaxsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpmaxsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpmaxsb (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpmaxsb (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmaxsb:			; BTVER2-LABEL: test_pmaxsb:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmaxsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpmaxsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpmaxsb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpmaxsb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pmaxsb:			; ZNVER1-LABEL: test_pmaxsb:
	Show All 25 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpmaxsd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpmaxsd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpmaxsd (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpmaxsd (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmaxsd:			; HASWELL-LABEL: test_pmaxsd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmaxsd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpmaxsd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpmaxsd (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpmaxsd (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmaxsd:			; BTVER2-LABEL: test_pmaxsd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmaxsd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpmaxsd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpmaxsd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpmaxsd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pmaxsd:			; ZNVER1-LABEL: test_pmaxsd:
	Show All 25 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpmaxud %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpmaxud %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpmaxud (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpmaxud (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmaxud:			; HASWELL-LABEL: test_pmaxud:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmaxud %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpmaxud %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpmaxud (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpmaxud (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmaxud:			; BTVER2-LABEL: test_pmaxud:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmaxud %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpmaxud %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpmaxud (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpmaxud (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pmaxud:			; ZNVER1-LABEL: test_pmaxud:
	Show All 25 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpmaxuw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpmaxuw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmaxuw:			; HASWELL-LABEL: test_pmaxuw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpmaxuw (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpmaxuw (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmaxuw:			; BTVER2-LABEL: test_pmaxuw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpmaxuw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpmaxuw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pmaxuw:			; ZNVER1-LABEL: test_pmaxuw:
	Show All 25 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpminsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpminsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpminsb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpminsb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pminsb:			; HASWELL-LABEL: test_pminsb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpminsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpminsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpminsb (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpminsb (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pminsb:			; BTVER2-LABEL: test_pminsb:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpminsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpminsb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpminsb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpminsb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pminsb:			; ZNVER1-LABEL: test_pminsb:
	Show All 25 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpminsd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpminsd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpminsd (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpminsd (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pminsd:			; HASWELL-LABEL: test_pminsd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpminsd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpminsd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpminsd (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpminsd (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pminsd:			; BTVER2-LABEL: test_pminsd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpminsd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpminsd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpminsd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpminsd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pminsd:			; ZNVER1-LABEL: test_pminsd:
	Show All 25 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpminud %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpminud %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpminud (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpminud (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pminud:			; HASWELL-LABEL: test_pminud:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpminud %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpminud %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpminud (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpminud (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pminud:			; BTVER2-LABEL: test_pminud:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpminud %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpminud %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpminud (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpminud (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pminud:			; ZNVER1-LABEL: test_pminud:
	Show All 25 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpminuw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpminuw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpminuw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpminuw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pminuw:			; HASWELL-LABEL: test_pminuw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpminuw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpminuw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpminuw (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpminuw (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pminuw:			; BTVER2-LABEL: test_pminuw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpminuw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpminuw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpminuw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpminuw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pminuw:			; ZNVER1-LABEL: test_pminuw:
	Show All 29 Lines
	; SANDY-NEXT: vpmovsxbw %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpmovsxbw %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpmovsxbw (%rdi), %xmm1 # sched: [7:0.50]			; SANDY-NEXT: vpmovsxbw (%rdi), %xmm1 # sched: [7:0.50]
	; SANDY-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmovsxbw:			; HASWELL-LABEL: test_pmovsxbw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmovsxbw %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpmovsxbw %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vpmovsxbw (%rdi), %xmm1 # sched: [5:1.00]			; HASWELL-NEXT: vpmovsxbw (%rdi), %xmm1 # sched: [1:1.00]
	; HASWELL-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmovsxbw:			; BTVER2-LABEL: test_pmovsxbw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmovsxbw (%rdi), %xmm1 # sched: [6:1.00]			; BTVER2-NEXT: vpmovsxbw (%rdi), %xmm1 # sched: [6:1.00]
	; BTVER2-NEXT: vpmovsxbw %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpmovsxbw %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY-NEXT: vpmovsxbd %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpmovsxbd %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpmovsxbd (%rdi), %xmm1 # sched: [7:0.50]			; SANDY-NEXT: vpmovsxbd (%rdi), %xmm1 # sched: [7:0.50]
	; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmovsxbd:			; HASWELL-LABEL: test_pmovsxbd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmovsxbd %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpmovsxbd %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vpmovsxbd (%rdi), %xmm1 # sched: [5:1.00]			; HASWELL-NEXT: vpmovsxbd (%rdi), %xmm1 # sched: [1:1.00]
	; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmovsxbd:			; BTVER2-LABEL: test_pmovsxbd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmovsxbd (%rdi), %xmm1 # sched: [6:1.00]			; BTVER2-NEXT: vpmovsxbd (%rdi), %xmm1 # sched: [6:1.00]
	; BTVER2-NEXT: vpmovsxbd %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpmovsxbd %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY-NEXT: vpmovsxbq %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpmovsxbq %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpmovsxbq (%rdi), %xmm1 # sched: [7:0.50]			; SANDY-NEXT: vpmovsxbq (%rdi), %xmm1 # sched: [7:0.50]
	; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmovsxbq:			; HASWELL-LABEL: test_pmovsxbq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmovsxbq %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpmovsxbq %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vpmovsxbq (%rdi), %xmm1 # sched: [5:1.00]			; HASWELL-NEXT: vpmovsxbq (%rdi), %xmm1 # sched: [1:1.00]
	; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmovsxbq:			; BTVER2-LABEL: test_pmovsxbq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmovsxbq (%rdi), %xmm1 # sched: [6:1.00]			; BTVER2-NEXT: vpmovsxbq (%rdi), %xmm1 # sched: [6:1.00]
	; BTVER2-NEXT: vpmovsxbq %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpmovsxbq %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY-NEXT: vpmovsxdq %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpmovsxdq %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpmovsxdq (%rdi), %xmm1 # sched: [7:0.50]			; SANDY-NEXT: vpmovsxdq (%rdi), %xmm1 # sched: [7:0.50]
	; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmovsxdq:			; HASWELL-LABEL: test_pmovsxdq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmovsxdq %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpmovsxdq %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vpmovsxdq (%rdi), %xmm1 # sched: [5:1.00]			; HASWELL-NEXT: vpmovsxdq (%rdi), %xmm1 # sched: [1:1.00]
	; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmovsxdq:			; BTVER2-LABEL: test_pmovsxdq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmovsxdq (%rdi), %xmm1 # sched: [6:1.00]			; BTVER2-NEXT: vpmovsxdq (%rdi), %xmm1 # sched: [6:1.00]
	; BTVER2-NEXT: vpmovsxdq %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpmovsxdq %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY-NEXT: vpmovsxwd %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpmovsxwd %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpmovsxwd (%rdi), %xmm1 # sched: [7:0.50]			; SANDY-NEXT: vpmovsxwd (%rdi), %xmm1 # sched: [7:0.50]
	; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmovsxwd:			; HASWELL-LABEL: test_pmovsxwd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmovsxwd %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpmovsxwd %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vpmovsxwd (%rdi), %xmm1 # sched: [5:1.00]			; HASWELL-NEXT: vpmovsxwd (%rdi), %xmm1 # sched: [1:1.00]
	; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmovsxwd:			; BTVER2-LABEL: test_pmovsxwd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmovsxwd (%rdi), %xmm1 # sched: [6:1.00]			; BTVER2-NEXT: vpmovsxwd (%rdi), %xmm1 # sched: [6:1.00]
	; BTVER2-NEXT: vpmovsxwd %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpmovsxwd %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY-NEXT: vpmovsxwq %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpmovsxwq %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpmovsxwq (%rdi), %xmm1 # sched: [7:0.50]			; SANDY-NEXT: vpmovsxwq (%rdi), %xmm1 # sched: [7:0.50]
	; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmovsxwq:			; HASWELL-LABEL: test_pmovsxwq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmovsxwq %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpmovsxwq %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vpmovsxwq (%rdi), %xmm1 # sched: [5:1.00]			; HASWELL-NEXT: vpmovsxwq (%rdi), %xmm1 # sched: [1:1.00]
	; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmovsxwq:			; BTVER2-LABEL: test_pmovsxwq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmovsxwq (%rdi), %xmm1 # sched: [6:1.00]			; BTVER2-NEXT: vpmovsxwq (%rdi), %xmm1 # sched: [6:1.00]
	; BTVER2-NEXT: vpmovsxwq %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpmovsxwq %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY-NEXT: vpmovzxbw {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero sched: [1:0.50]			; SANDY-NEXT: vpmovzxbw {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero sched: [1:0.50]
	; SANDY-NEXT: vpmovzxbw {{.*#+}} xmm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [7:0.50]			; SANDY-NEXT: vpmovzxbw {{.*#+}} xmm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [7:0.50]
	; SANDY-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmovzxbw:			; HASWELL-LABEL: test_pmovzxbw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmovzxbw {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero sched: [1:1.00]			; HASWELL-NEXT: vpmovzxbw {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero sched: [1:1.00]
	; HASWELL-NEXT: vpmovzxbw {{.*#+}} xmm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [5:1.00]			; HASWELL-NEXT: vpmovzxbw {{.*#+}} xmm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [1:1.00]
	; HASWELL-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmovzxbw:			; BTVER2-LABEL: test_pmovzxbw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmovzxbw {{.*#+}} xmm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [6:1.00]			; BTVER2-NEXT: vpmovzxbw {{.*#+}} xmm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [6:1.00]
	; BTVER2-NEXT: vpmovzxbw {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero sched: [1:0.50]			; BTVER2-NEXT: vpmovzxbw {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero sched: [1:0.50]
	; BTVER2-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY-NEXT: vpmovzxbd {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero,xmm0[2],zero,zero,zero,xmm0[3],zero,zero,zero sched: [1:0.50]			; SANDY-NEXT: vpmovzxbd {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero,xmm0[2],zero,zero,zero,xmm0[3],zero,zero,zero sched: [1:0.50]
	; SANDY-NEXT: vpmovzxbd {{.*#+}} xmm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero sched: [7:0.50]			; SANDY-NEXT: vpmovzxbd {{.*#+}} xmm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero sched: [7:0.50]
	; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmovzxbd:			; HASWELL-LABEL: test_pmovzxbd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmovzxbd {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero,xmm0[2],zero,zero,zero,xmm0[3],zero,zero,zero sched: [1:1.00]			; HASWELL-NEXT: vpmovzxbd {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero,xmm0[2],zero,zero,zero,xmm0[3],zero,zero,zero sched: [1:1.00]
	; HASWELL-NEXT: vpmovzxbd {{.*#+}} xmm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero sched: [5:1.00]			; HASWELL-NEXT: vpmovzxbd {{.*#+}} xmm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero sched: [1:1.00]
	; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmovzxbd:			; BTVER2-LABEL: test_pmovzxbd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmovzxbd {{.*#+}} xmm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero sched: [6:1.00]			; BTVER2-NEXT: vpmovzxbd {{.*#+}} xmm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero sched: [6:1.00]
	; BTVER2-NEXT: vpmovzxbd {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero,xmm0[2],zero,zero,zero,xmm0[3],zero,zero,zero sched: [1:0.50]			; BTVER2-NEXT: vpmovzxbd {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero,xmm0[2],zero,zero,zero,xmm0[3],zero,zero,zero sched: [1:0.50]
	; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY-NEXT: vpmovzxbq {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,zero,zero,zero,zero,xmm0[1],zero,zero,zero,zero,zero,zero,zero sched: [1:0.50]			; SANDY-NEXT: vpmovzxbq {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,zero,zero,zero,zero,xmm0[1],zero,zero,zero,zero,zero,zero,zero sched: [1:0.50]
	; SANDY-NEXT: vpmovzxbq {{.*#+}} xmm1 = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero sched: [7:0.50]			; SANDY-NEXT: vpmovzxbq {{.*#+}} xmm1 = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero sched: [7:0.50]
	; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmovzxbq:			; HASWELL-LABEL: test_pmovzxbq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmovzxbq {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,zero,zero,zero,zero,xmm0[1],zero,zero,zero,zero,zero,zero,zero sched: [1:1.00]			; HASWELL-NEXT: vpmovzxbq {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,zero,zero,zero,zero,xmm0[1],zero,zero,zero,zero,zero,zero,zero sched: [1:1.00]
	; HASWELL-NEXT: vpmovzxbq {{.*#+}} xmm1 = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero sched: [5:1.00]			; HASWELL-NEXT: vpmovzxbq {{.*#+}} xmm1 = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero sched: [1:1.00]
	; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmovzxbq:			; BTVER2-LABEL: test_pmovzxbq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmovzxbq {{.*#+}} xmm1 = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero sched: [6:1.00]			; BTVER2-NEXT: vpmovzxbq {{.*#+}} xmm1 = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero sched: [6:1.00]
	; BTVER2-NEXT: vpmovzxbq {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,zero,zero,zero,zero,xmm0[1],zero,zero,zero,zero,zero,zero,zero sched: [1:0.50]			; BTVER2-NEXT: vpmovzxbq {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,zero,zero,zero,zero,xmm0[1],zero,zero,zero,zero,zero,zero,zero sched: [1:0.50]
	; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY-NEXT: vpmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero sched: [1:0.50]			; SANDY-NEXT: vpmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero sched: [1:0.50]
	; SANDY-NEXT: vpmovzxdq {{.*#+}} xmm1 = mem[0],zero,mem[1],zero sched: [7:0.50]			; SANDY-NEXT: vpmovzxdq {{.*#+}} xmm1 = mem[0],zero,mem[1],zero sched: [7:0.50]
	; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmovzxdq:			; HASWELL-LABEL: test_pmovzxdq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero sched: [1:1.00]			; HASWELL-NEXT: vpmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero sched: [1:1.00]
	; HASWELL-NEXT: vpmovzxdq {{.*#+}} xmm1 = mem[0],zero,mem[1],zero sched: [5:1.00]			; HASWELL-NEXT: vpmovzxdq {{.*#+}} xmm1 = mem[0],zero,mem[1],zero sched: [1:1.00]
	; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmovzxdq:			; BTVER2-LABEL: test_pmovzxdq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmovzxdq {{.*#+}} xmm1 = mem[0],zero,mem[1],zero sched: [6:1.00]			; BTVER2-NEXT: vpmovzxdq {{.*#+}} xmm1 = mem[0],zero,mem[1],zero sched: [6:1.00]
	; BTVER2-NEXT: vpmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero sched: [1:0.50]			; BTVER2-NEXT: vpmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero sched: [1:0.50]
	; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY-NEXT: vpmovzxwd {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero sched: [1:0.50]			; SANDY-NEXT: vpmovzxwd {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero sched: [1:0.50]
	; SANDY-NEXT: vpmovzxwd {{.*#+}} xmm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero sched: [7:0.50]			; SANDY-NEXT: vpmovzxwd {{.*#+}} xmm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero sched: [7:0.50]
	; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmovzxwd:			; HASWELL-LABEL: test_pmovzxwd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmovzxwd {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero sched: [1:1.00]			; HASWELL-NEXT: vpmovzxwd {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero sched: [1:1.00]
	; HASWELL-NEXT: vpmovzxwd {{.*#+}} xmm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero sched: [5:1.00]			; HASWELL-NEXT: vpmovzxwd {{.*#+}} xmm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero sched: [1:1.00]
	; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmovzxwd:			; BTVER2-LABEL: test_pmovzxwd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmovzxwd {{.*#+}} xmm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero sched: [6:1.00]			; BTVER2-NEXT: vpmovzxwd {{.*#+}} xmm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero sched: [6:1.00]
	; BTVER2-NEXT: vpmovzxwd {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero sched: [1:0.50]			; BTVER2-NEXT: vpmovzxwd {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero sched: [1:0.50]
	; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY-NEXT: vpmovzxwq {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero sched: [1:0.50]			; SANDY-NEXT: vpmovzxwq {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero sched: [1:0.50]
	; SANDY-NEXT: vpmovzxwq {{.*#+}} xmm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero sched: [7:0.50]			; SANDY-NEXT: vpmovzxwq {{.*#+}} xmm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero sched: [7:0.50]
	; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmovzxwq:			; HASWELL-LABEL: test_pmovzxwq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmovzxwq {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero sched: [1:1.00]			; HASWELL-NEXT: vpmovzxwq {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero sched: [1:1.00]
	; HASWELL-NEXT: vpmovzxwq {{.*#+}} xmm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero sched: [5:1.00]			; HASWELL-NEXT: vpmovzxwq {{.*#+}} xmm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero sched: [1:1.00]
	; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmovzxwq:			; BTVER2-LABEL: test_pmovzxwq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmovzxwq {{.*#+}} xmm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero sched: [6:1.00]			; BTVER2-NEXT: vpmovzxwq {{.*#+}} xmm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero sched: [6:1.00]
	; BTVER2-NEXT: vpmovzxwq {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero sched: [1:0.50]			; BTVER2-NEXT: vpmovzxwq {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero sched: [1:0.50]
	; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 28 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpmuldq %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vpmuldq %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vpmuldq (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vpmuldq (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmuldq:			; HASWELL-LABEL: test_pmuldq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmuldq %xmm1, %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpmuldq %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: vpmuldq (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; HASWELL-NEXT: vpmuldq (%rdi), %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmuldq:			; BTVER2-LABEL: test_pmuldq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmuldq %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; BTVER2-NEXT: vpmuldq %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; BTVER2-NEXT: vpmuldq (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vpmuldq (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pmuldq:			; ZNVER1-LABEL: test_pmuldq:
	Show All 27 Lines
	; SANDY-NEXT: vpmulld %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vpmulld %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vpmulld (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vpmulld (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmulld:			; HASWELL-LABEL: test_pmulld:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmulld %xmm1, %xmm0, %xmm0 # sched: [10:2.00]			; HASWELL-NEXT: vpmulld %xmm1, %xmm0, %xmm0 # sched: [10:2.00]
	; HASWELL-NEXT: vpmulld (%rdi), %xmm0, %xmm0 # sched: [10:2.00]			; HASWELL-NEXT: vpmulld (%rdi), %xmm0, %xmm0 # sched: [10:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmulld:			; BTVER2-LABEL: test_pmulld:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmulld %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; BTVER2-NEXT: vpmulld %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; BTVER2-NEXT: vpmulld (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vpmulld (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pmulld:			; ZNVER1-LABEL: test_pmulld:
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; HASWELL-LABEL: test_ptest:			; HASWELL-LABEL: test_ptest:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vptest %xmm1, %xmm0 # sched: [2:1.00]			; HASWELL-NEXT: vptest %xmm1, %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: setb %al # sched: [1:0.50]			; HASWELL-NEXT: setb %al # sched: [1:0.50]
	; HASWELL-NEXT: vptest (%rdi), %xmm0 # sched: [2:1.00]			; HASWELL-NEXT: vptest (%rdi), %xmm0 # sched: [2:1.00]
	; HASWELL-NEXT: setb %cl # sched: [1:0.50]			; HASWELL-NEXT: setb %cl # sched: [1:0.50]
	; HASWELL-NEXT: andb %al, %cl # sched: [1:0.25]			; HASWELL-NEXT: andb %al, %cl # sched: [1:0.25]
	; HASWELL-NEXT: movzbl %cl, %eax # sched: [1:0.25]			; HASWELL-NEXT: movzbl %cl, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_ptest:			; BTVER2-LABEL: test_ptest:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vptest %xmm1, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vptest %xmm1, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: setb %al # sched: [1:0.50]			; BTVER2-NEXT: setb %al # sched: [1:0.50]
	; BTVER2-NEXT: vptest (%rdi), %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vptest (%rdi), %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: setb %cl # sched: [1:0.50]			; BTVER2-NEXT: setb %cl # sched: [1:0.50]
	; BTVER2-NEXT: andb %al, %cl # sched: [1:0.50]			; BTVER2-NEXT: andb %al, %cl # sched: [1:0.50]
	Show All 37 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vroundpd $7, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vroundpd $7, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vroundpd $7, (%rdi), %xmm1 # sched: [9:1.00]			; SANDY-NEXT: vroundpd $7, (%rdi), %xmm1 # sched: [9:1.00]
	; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_roundpd:			; HASWELL-LABEL: test_roundpd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vroundpd $7, %xmm0, %xmm0 # sched: [6:2.00]			; HASWELL-NEXT: vroundpd $7, %xmm0, %xmm0 # sched: [5:1.25]
	; HASWELL-NEXT: vroundpd $7, (%rdi), %xmm1 # sched: [10:2.00]			; HASWELL-NEXT: vroundpd $7, (%rdi), %xmm1 # sched: [6:2.00]
	; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_roundpd:			; BTVER2-LABEL: test_roundpd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vroundpd $7, (%rdi), %xmm1 # sched: [8:1.00]			; BTVER2-NEXT: vroundpd $7, (%rdi), %xmm1 # sched: [8:1.00]
	; BTVER2-NEXT: vroundpd $7, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vroundpd $7, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vroundps $7, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vroundps $7, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vroundps $7, (%rdi), %xmm1 # sched: [9:1.00]			; SANDY-NEXT: vroundps $7, (%rdi), %xmm1 # sched: [9:1.00]
	; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_roundps:			; HASWELL-LABEL: test_roundps:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vroundps $7, %xmm0, %xmm0 # sched: [6:2.00]			; HASWELL-NEXT: vroundps $7, %xmm0, %xmm0 # sched: [5:1.25]
	; HASWELL-NEXT: vroundps $7, (%rdi), %xmm1 # sched: [10:2.00]			; HASWELL-NEXT: vroundps $7, (%rdi), %xmm1 # sched: [6:2.00]
	; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_roundps:			; BTVER2-LABEL: test_roundps:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vroundps $7, (%rdi), %xmm1 # sched: [8:1.00]			; BTVER2-NEXT: vroundps $7, (%rdi), %xmm1 # sched: [8:1.00]
	; BTVER2-NEXT: vroundps $7, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vroundps $7, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddps %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vroundsd $7, %xmm1, %xmm0, %xmm1 # sched: [3:1.00]			; SANDY-NEXT: vroundsd $7, %xmm1, %xmm0, %xmm1 # sched: [3:1.00]
	; SANDY-NEXT: vroundsd $7, (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vroundsd $7, (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_roundsd:			; HASWELL-LABEL: test_roundsd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vroundsd $7, %xmm1, %xmm0, %xmm1 # sched: [6:2.00]			; HASWELL-NEXT: vroundsd $7, %xmm1, %xmm0, %xmm1 # sched: [5:1.25]
	; HASWELL-NEXT: vroundsd $7, (%rdi), %xmm0, %xmm0 # sched: [10:2.00]			; HASWELL-NEXT: vroundsd $7, (%rdi), %xmm0, %xmm0 # sched: [6:2.00]
	; HASWELL-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_roundsd:			; BTVER2-LABEL: test_roundsd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vroundsd $7, %xmm1, %xmm0, %xmm1 # sched: [3:1.00]			; BTVER2-NEXT: vroundsd $7, %xmm1, %xmm0, %xmm1 # sched: [3:1.00]
	; BTVER2-NEXT: vroundsd $7, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vroundsd $7, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddpd %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vroundss $7, %xmm1, %xmm0, %xmm1 # sched: [3:1.00]			; SANDY-NEXT: vroundss $7, %xmm1, %xmm0, %xmm1 # sched: [3:1.00]
	; SANDY-NEXT: vroundss $7, (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vroundss $7, (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_roundss:			; HASWELL-LABEL: test_roundss:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vroundss $7, %xmm1, %xmm0, %xmm1 # sched: [6:2.00]			; HASWELL-NEXT: vroundss $7, %xmm1, %xmm0, %xmm1 # sched: [5:1.25]
	; HASWELL-NEXT: vroundss $7, (%rdi), %xmm0, %xmm0 # sched: [10:2.00]			; HASWELL-NEXT: vroundss $7, (%rdi), %xmm0, %xmm0 # sched: [6:2.00]
	; HASWELL-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; HASWELL-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_roundss:			; BTVER2-LABEL: test_roundss:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vroundss $7, %xmm1, %xmm0, %xmm1 # sched: [3:1.00]			; BTVER2-NEXT: vroundss $7, %xmm1, %xmm0, %xmm1 # sched: [3:1.00]
	; BTVER2-NEXT: vroundss $7, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]			; BTVER2-NEXT: vroundss $7, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
	; BTVER2-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]			; BTVER2-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 13 Lines

test/CodeGen/X86/sse42-schedule.ll

	Show All 29 Lines
	; SANDY-NEXT: movl %edi, %eax # sched: [1:0.33]			; SANDY-NEXT: movl %edi, %eax # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: crc32_32_8:			; HASWELL-LABEL: crc32_32_8:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: crc32b %sil, %edi # sched: [3:1.00]			; HASWELL-NEXT: crc32b %sil, %edi # sched: [3:1.00]
	; HASWELL-NEXT: crc32b (%rdx), %edi # sched: [7:1.00]			; HASWELL-NEXT: crc32b (%rdx), %edi # sched: [7:1.00]
	; HASWELL-NEXT: movl %edi, %eax # sched: [1:0.25]			; HASWELL-NEXT: movl %edi, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: crc32_32_8:			; BTVER2-LABEL: crc32_32_8:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: crc32b %sil, %edi # sched: [3:1.00]			; BTVER2-NEXT: crc32b %sil, %edi # sched: [3:1.00]
	; BTVER2-NEXT: crc32b (%rdx), %edi # sched: [8:1.00]			; BTVER2-NEXT: crc32b (%rdx), %edi # sched: [8:1.00]
	; BTVER2-NEXT: movl %edi, %eax # sched: [1:0.17]			; BTVER2-NEXT: movl %edi, %eax # sched: [1:0.17]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY-NEXT: movl %edi, %eax # sched: [1:0.33]			; SANDY-NEXT: movl %edi, %eax # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: crc32_32_16:			; HASWELL-LABEL: crc32_32_16:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: crc32w %si, %edi # sched: [3:1.00]			; HASWELL-NEXT: crc32w %si, %edi # sched: [3:1.00]
	; HASWELL-NEXT: crc32w (%rdx), %edi # sched: [7:1.00]			; HASWELL-NEXT: crc32w (%rdx), %edi # sched: [7:1.00]
	; HASWELL-NEXT: movl %edi, %eax # sched: [1:0.25]			; HASWELL-NEXT: movl %edi, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: crc32_32_16:			; BTVER2-LABEL: crc32_32_16:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: crc32w %si, %edi # sched: [3:1.00]			; BTVER2-NEXT: crc32w %si, %edi # sched: [3:1.00]
	; BTVER2-NEXT: crc32w (%rdx), %edi # sched: [8:1.00]			; BTVER2-NEXT: crc32w (%rdx), %edi # sched: [8:1.00]
	; BTVER2-NEXT: movl %edi, %eax # sched: [1:0.17]			; BTVER2-NEXT: movl %edi, %eax # sched: [1:0.17]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY-NEXT: movl %edi, %eax # sched: [1:0.33]			; SANDY-NEXT: movl %edi, %eax # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: crc32_32_32:			; HASWELL-LABEL: crc32_32_32:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: crc32l %esi, %edi # sched: [3:1.00]			; HASWELL-NEXT: crc32l %esi, %edi # sched: [3:1.00]
	; HASWELL-NEXT: crc32l (%rdx), %edi # sched: [7:1.00]			; HASWELL-NEXT: crc32l (%rdx), %edi # sched: [7:1.00]
	; HASWELL-NEXT: movl %edi, %eax # sched: [1:0.25]			; HASWELL-NEXT: movl %edi, %eax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: crc32_32_32:			; BTVER2-LABEL: crc32_32_32:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: crc32l %esi, %edi # sched: [3:1.00]			; BTVER2-NEXT: crc32l %esi, %edi # sched: [3:1.00]
	; BTVER2-NEXT: crc32l (%rdx), %edi # sched: [8:1.00]			; BTVER2-NEXT: crc32l (%rdx), %edi # sched: [8:1.00]
	; BTVER2-NEXT: movl %edi, %eax # sched: [1:0.17]			; BTVER2-NEXT: movl %edi, %eax # sched: [1:0.17]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY-NEXT: movq %rdi, %rax # sched: [1:0.33]			; SANDY-NEXT: movq %rdi, %rax # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: crc32_64_8:			; HASWELL-LABEL: crc32_64_8:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: crc32b %sil, %edi # sched: [3:1.00]			; HASWELL-NEXT: crc32b %sil, %edi # sched: [3:1.00]
	; HASWELL-NEXT: crc32b (%rdx), %edi # sched: [7:1.00]			; HASWELL-NEXT: crc32b (%rdx), %edi # sched: [7:1.00]
	; HASWELL-NEXT: movq %rdi, %rax # sched: [1:0.25]			; HASWELL-NEXT: movq %rdi, %rax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: crc32_64_8:			; BTVER2-LABEL: crc32_64_8:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: crc32b %sil, %edi # sched: [3:1.00]			; BTVER2-NEXT: crc32b %sil, %edi # sched: [3:1.00]
	; BTVER2-NEXT: crc32b (%rdx), %edi # sched: [8:1.00]			; BTVER2-NEXT: crc32b (%rdx), %edi # sched: [8:1.00]
	; BTVER2-NEXT: movq %rdi, %rax # sched: [1:0.17]			; BTVER2-NEXT: movq %rdi, %rax # sched: [1:0.17]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 32 Lines
	; SANDY-NEXT: movq %rdi, %rax # sched: [1:0.33]			; SANDY-NEXT: movq %rdi, %rax # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: crc32_64_64:			; HASWELL-LABEL: crc32_64_64:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: crc32q %rsi, %rdi # sched: [3:1.00]			; HASWELL-NEXT: crc32q %rsi, %rdi # sched: [3:1.00]
	; HASWELL-NEXT: crc32q (%rdx), %rdi # sched: [7:1.00]			; HASWELL-NEXT: crc32q (%rdx), %rdi # sched: [7:1.00]
	; HASWELL-NEXT: movq %rdi, %rax # sched: [1:0.25]			; HASWELL-NEXT: movq %rdi, %rax # sched: [1:0.25]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: crc32_64_64:			; BTVER2-LABEL: crc32_64_64:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: crc32q %rsi, %rdi # sched: [3:1.00]			; BTVER2-NEXT: crc32q %rsi, %rdi # sched: [3:1.00]
	; BTVER2-NEXT: crc32q (%rdx), %rdi # sched: [8:1.00]			; BTVER2-NEXT: crc32q (%rdx), %rdi # sched: [8:1.00]
	; BTVER2-NEXT: movq %rdi, %rax # sched: [1:0.17]			; BTVER2-NEXT: movq %rdi, %rax # sched: [1:0.17]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: # kill: %ECX<def> %ECX<kill> %RCX<def>			; SANDY-NEXT: # kill: %ECX<def> %ECX<kill> %RCX<def>
	; SANDY-NEXT: leal (%rcx,%rsi), %eax # sched: [1:0.50]			; SANDY-NEXT: leal (%rcx,%rsi), %eax # sched: [1:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pcmpestri:			; HASWELL-LABEL: test_pcmpestri:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: movl $7, %eax # sched: [1:0.25]			; HASWELL-NEXT: movl $7, %eax # sched: [1:0.25]
	; HASWELL-NEXT: movl $7, %edx # sched: [1:0.25]			; HASWELL-NEXT: movl $7, %edx # sched: [1:0.25]
	; HASWELL-NEXT: vpcmpestri $7, %xmm1, %xmm0 # sched: [11:3.00]			; HASWELL-NEXT: vpcmpestri $7, %xmm1, %xmm0 # sched: [18:4.00]
	; HASWELL-NEXT: movl %ecx, %esi # sched: [1:0.25]			; HASWELL-NEXT: movl %ecx, %esi # sched: [1:0.25]
	; HASWELL-NEXT: movl $7, %eax # sched: [1:0.25]			; HASWELL-NEXT: movl $7, %eax # sched: [1:0.25]
	; HASWELL-NEXT: movl $7, %edx # sched: [1:0.25]			; HASWELL-NEXT: movl $7, %edx # sched: [1:0.25]
	; HASWELL-NEXT: vpcmpestri $7, (%rdi), %xmm0 # sched: [11:3.00]			; HASWELL-NEXT: vpcmpestri $7, (%rdi), %xmm0 # sched: [18:4.00]
	; HASWELL-NEXT: # kill: %ECX<def> %ECX<kill> %RCX<def>			; HASWELL-NEXT: # kill: %ECX<def> %ECX<kill> %RCX<def>
	; HASWELL-NEXT: leal (%rcx,%rsi), %eax # sched: [1:0.50]			; HASWELL-NEXT: leal (%rcx,%rsi), %eax # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pcmpestri:			; BTVER2-LABEL: test_pcmpestri:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: movl $7, %eax # sched: [1:0.17]			; BTVER2-NEXT: movl $7, %eax # sched: [1:0.17]
	; BTVER2-NEXT: movl $7, %edx # sched: [1:0.17]			; BTVER2-NEXT: movl $7, %edx # sched: [1:0.17]
	; BTVER2-NEXT: vpcmpestri $7, %xmm1, %xmm0 # sched: [13:2.50]			; BTVER2-NEXT: vpcmpestri $7, %xmm1, %xmm0 # sched: [13:2.50]
	; BTVER2-NEXT: movl $7, %eax # sched: [1:0.17]			; BTVER2-NEXT: movl $7, %eax # sched: [1:0.17]
	; BTVER2-NEXT: movl $7, %edx # sched: [1:0.17]			; BTVER2-NEXT: movl $7, %edx # sched: [1:0.17]
	▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: movl $7, %edx # sched: [1:0.33]			; SANDY-NEXT: movl $7, %edx # sched: [1:0.33]
	; SANDY-NEXT: vpcmpestrm $7, (%rdi), %xmm0 # sched: [11:2.33]			; SANDY-NEXT: vpcmpestrm $7, (%rdi), %xmm0 # sched: [11:2.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pcmpestrm:			; HASWELL-LABEL: test_pcmpestrm:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: movl $7, %eax # sched: [1:0.25]			; HASWELL-NEXT: movl $7, %eax # sched: [1:0.25]
	; HASWELL-NEXT: movl $7, %edx # sched: [1:0.25]			; HASWELL-NEXT: movl $7, %edx # sched: [1:0.25]
	; HASWELL-NEXT: vpcmpestrm $7, %xmm1, %xmm0 # sched: [10:4.00]			; HASWELL-NEXT: vpcmpestrm $7, %xmm1, %xmm0 # sched: [19:4.00]
	; HASWELL-NEXT: movl $7, %eax # sched: [1:0.25]			; HASWELL-NEXT: movl $7, %eax # sched: [1:0.25]
	; HASWELL-NEXT: movl $7, %edx # sched: [1:0.25]			; HASWELL-NEXT: movl $7, %edx # sched: [1:0.25]
	; HASWELL-NEXT: vpcmpestrm $7, (%rdi), %xmm0 # sched: [10:3.00]			; HASWELL-NEXT: vpcmpestrm $7, (%rdi), %xmm0 # sched: [19:4.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pcmpestrm:			; BTVER2-LABEL: test_pcmpestrm:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: movl $7, %eax # sched: [1:0.17]			; BTVER2-NEXT: movl $7, %eax # sched: [1:0.17]
	; BTVER2-NEXT: movl $7, %edx # sched: [1:0.17]			; BTVER2-NEXT: movl $7, %edx # sched: [1:0.17]
	; BTVER2-NEXT: vpcmpestrm $7, %xmm1, %xmm0 # sched: [13:2.50]			; BTVER2-NEXT: vpcmpestrm $7, %xmm1, %xmm0 # sched: [13:2.50]
	; BTVER2-NEXT: movl $7, %eax # sched: [1:0.17]			; BTVER2-NEXT: movl $7, %eax # sched: [1:0.17]
	; BTVER2-NEXT: movl $7, %edx # sched: [1:0.17]			; BTVER2-NEXT: movl $7, %edx # sched: [1:0.17]
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	;			;
	; HASWELL-LABEL: test_pcmpistri:			; HASWELL-LABEL: test_pcmpistri:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpcmpistri $7, %xmm1, %xmm0 # sched: [11:3.00]			; HASWELL-NEXT: vpcmpistri $7, %xmm1, %xmm0 # sched: [11:3.00]
	; HASWELL-NEXT: movl %ecx, %eax # sched: [1:0.25]			; HASWELL-NEXT: movl %ecx, %eax # sched: [1:0.25]
	; HASWELL-NEXT: vpcmpistri $7, (%rdi), %xmm0 # sched: [11:3.00]			; HASWELL-NEXT: vpcmpistri $7, (%rdi), %xmm0 # sched: [11:3.00]
	; HASWELL-NEXT: # kill: %ECX<def> %ECX<kill> %RCX<def>			; HASWELL-NEXT: # kill: %ECX<def> %ECX<kill> %RCX<def>
	; HASWELL-NEXT: leal (%rcx,%rax), %eax # sched: [1:0.50]			; HASWELL-NEXT: leal (%rcx,%rax), %eax # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pcmpistri:			; BTVER2-LABEL: test_pcmpistri:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpcmpistri $7, %xmm1, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpcmpistri $7, %xmm1, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: movl %ecx, %eax # sched: [1:0.17]			; BTVER2-NEXT: movl %ecx, %eax # sched: [1:0.17]
	; BTVER2-NEXT: vpcmpistri $7, (%rdi), %xmm0 # sched: [11:1.00]			; BTVER2-NEXT: vpcmpistri $7, (%rdi), %xmm0 # sched: [11:1.00]
	; BTVER2-NEXT: # kill: %ECX<def> %ECX<kill> %RCX<def>			; BTVER2-NEXT: # kill: %ECX<def> %ECX<kill> %RCX<def>
	; BTVER2-NEXT: leal (%rcx,%rax), %eax # sched: [1:0.50]			; BTVER2-NEXT: leal (%rcx,%rax), %eax # sched: [1:0.50]
	Show All 31 Lines
	; SANDY-LABEL: test_pcmpistrm:			; SANDY-LABEL: test_pcmpistrm:
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpcmpistrm $7, %xmm1, %xmm0 # sched: [11:3.00]			; SANDY-NEXT: vpcmpistrm $7, %xmm1, %xmm0 # sched: [11:3.00]
	; SANDY-NEXT: vpcmpistrm $7, (%rdi), %xmm0 # sched: [17:3.00]			; SANDY-NEXT: vpcmpistrm $7, (%rdi), %xmm0 # sched: [17:3.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pcmpistrm:			; HASWELL-LABEL: test_pcmpistrm:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpcmpistrm $7, %xmm1, %xmm0 # sched: [10:3.00]			; HASWELL-NEXT: vpcmpistrm $7, %xmm1, %xmm0 # sched: [11:3.00]
	; HASWELL-NEXT: vpcmpistrm $7, (%rdi), %xmm0 # sched: [10:3.00]			; HASWELL-NEXT: vpcmpistrm $7, (%rdi), %xmm0 # sched: [11:3.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pcmpistrm:			; BTVER2-LABEL: test_pcmpistrm:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpcmpistrm $7, %xmm1, %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vpcmpistrm $7, %xmm1, %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: vpcmpistrm $7, (%rdi), %xmm0 # sched: [12:1.00]			; BTVER2-NEXT: vpcmpistrm $7, (%rdi), %xmm0 # sched: [12:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pcmpistrm:			; ZNVER1-LABEL: test_pcmpistrm:
	Show All 26 Lines
	; SANDY-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0 # sched: [5:1.00]			; SANDY-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
	; SANDY-NEXT: vpcmpgtq (%rdi), %xmm0, %xmm0 # sched: [11:1.00]			; SANDY-NEXT: vpcmpgtq (%rdi), %xmm0, %xmm0 # sched: [11:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pcmpgtq:			; HASWELL-LABEL: test_pcmpgtq:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: vpcmpgtq (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpcmpgtq (%rdi), %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pcmpgtq:			; BTVER2-LABEL: test_pcmpgtq:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpcmpgtq (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpcmpgtq (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pcmpgtq:			; ZNVER1-LABEL: test_pcmpgtq:
	Show All 11 Lines

test/CodeGen/X86/ssse3-schedule.ll

	Show All 36 Lines
	; SANDY-NEXT: vpabsb %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpabsb %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpabsb (%rdi), %xmm1 # sched: [7:0.50]			; SANDY-NEXT: vpabsb (%rdi), %xmm1 # sched: [7:0.50]
	; SANDY-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.33]			; SANDY-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pabsb:			; HASWELL-LABEL: test_pabsb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpabsb %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpabsb %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpabsb (%rdi), %xmm1 # sched: [5:0.50]			; HASWELL-NEXT: vpabsb (%rdi), %xmm1 # sched: [1:0.50]
	; HASWELL-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.33]			; HASWELL-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.33]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pabsb:			; BTVER2-LABEL: test_pabsb:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpabsb (%rdi), %xmm1 # sched: [6:1.00]			; BTVER2-NEXT: vpabsb (%rdi), %xmm1 # sched: [6:1.00]
	; BTVER2-NEXT: vpabsb %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpabsb %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 39 Lines
	; SANDY-NEXT: vpabsd %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpabsd %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpabsd (%rdi), %xmm1 # sched: [7:0.50]			; SANDY-NEXT: vpabsd (%rdi), %xmm1 # sched: [7:0.50]
	; SANDY-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.33]			; SANDY-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pabsd:			; HASWELL-LABEL: test_pabsd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpabsd %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpabsd %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpabsd (%rdi), %xmm1 # sched: [5:0.50]			; HASWELL-NEXT: vpabsd (%rdi), %xmm1 # sched: [1:0.50]
	; HASWELL-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.33]			; HASWELL-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.33]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pabsd:			; BTVER2-LABEL: test_pabsd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpabsd (%rdi), %xmm1 # sched: [6:1.00]			; BTVER2-NEXT: vpabsd (%rdi), %xmm1 # sched: [6:1.00]
	; BTVER2-NEXT: vpabsd %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpabsd %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 39 Lines
	; SANDY-NEXT: vpabsw %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpabsw %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpabsw (%rdi), %xmm1 # sched: [7:0.50]			; SANDY-NEXT: vpabsw (%rdi), %xmm1 # sched: [7:0.50]
	; SANDY-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.33]			; SANDY-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.33]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pabsw:			; HASWELL-LABEL: test_pabsw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpabsw %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpabsw %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpabsw (%rdi), %xmm1 # sched: [5:0.50]			; HASWELL-NEXT: vpabsw (%rdi), %xmm1 # sched: [1:0.50]
	; HASWELL-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.33]			; HASWELL-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.33]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pabsw:			; BTVER2-LABEL: test_pabsw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpabsw (%rdi), %xmm1 # sched: [6:1.00]			; BTVER2-NEXT: vpabsw (%rdi), %xmm1 # sched: [6:1.00]
	; BTVER2-NEXT: vpabsw %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpabsw %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpor %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	Show All 39 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpalignr {{.*#+}} xmm0 = xmm0[6,7,8,9,10,11,12,13,14,15],xmm1[0,1,2,3,4,5] sched: [1:0.50]			; SANDY-NEXT: vpalignr {{.*#+}} xmm0 = xmm0[6,7,8,9,10,11,12,13,14,15],xmm1[0,1,2,3,4,5] sched: [1:0.50]
	; SANDY-NEXT: vpalignr {{.*#+}} xmm0 = mem[14,15],xmm0[0,1,2,3,4,5,6,7,8,9,10,11,12,13] sched: [7:0.50]			; SANDY-NEXT: vpalignr {{.*#+}} xmm0 = mem[14,15],xmm0[0,1,2,3,4,5,6,7,8,9,10,11,12,13] sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_palignr:			; HASWELL-LABEL: test_palignr:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpalignr {{.*#+}} xmm0 = xmm0[6,7,8,9,10,11,12,13,14,15],xmm1[0,1,2,3,4,5] sched: [1:1.00]			; HASWELL-NEXT: vpalignr {{.*#+}} xmm0 = xmm0[6,7,8,9,10,11,12,13,14,15],xmm1[0,1,2,3,4,5] sched: [1:1.00]
	; HASWELL-NEXT: vpalignr {{.*#+}} xmm0 = mem[14,15],xmm0[0,1,2,3,4,5,6,7,8,9,10,11,12,13] sched: [5:1.00]			; HASWELL-NEXT: vpalignr {{.*#+}} xmm0 = mem[14,15],xmm0[0,1,2,3,4,5,6,7,8,9,10,11,12,13] sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_palignr:			; BTVER2-LABEL: test_palignr:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpalignr {{.*#+}} xmm0 = xmm0[6,7,8,9,10,11,12,13,14,15],xmm1[0,1,2,3,4,5] sched: [1:0.50]			; BTVER2-NEXT: vpalignr {{.*#+}} xmm0 = xmm0[6,7,8,9,10,11,12,13,14,15],xmm1[0,1,2,3,4,5] sched: [1:0.50]
	; BTVER2-NEXT: vpalignr {{.*#+}} xmm0 = mem[14,15],xmm0[0,1,2,3,4,5,6,7,8,9,10,11,12,13] sched: [6:1.00]			; BTVER2-NEXT: vpalignr {{.*#+}} xmm0 = mem[14,15],xmm0[0,1,2,3,4,5,6,7,8,9,10,11,12,13] sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_palignr:			; ZNVER1-LABEL: test_palignr:
	Show All 30 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vphaddd %xmm1, %xmm0, %xmm0 # sched: [3:1.50]			; SANDY-NEXT: vphaddd %xmm1, %xmm0, %xmm0 # sched: [3:1.50]
	; SANDY-NEXT: vphaddd (%rdi), %xmm0, %xmm0 # sched: [9:1.50]			; SANDY-NEXT: vphaddd (%rdi), %xmm0, %xmm0 # sched: [9:1.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_phaddd:			; HASWELL-LABEL: test_phaddd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vphaddd %xmm1, %xmm0, %xmm0 # sched: [3:2.00]			; HASWELL-NEXT: vphaddd %xmm1, %xmm0, %xmm0 # sched: [3:2.00]
	; HASWELL-NEXT: vphaddd (%rdi), %xmm0, %xmm0 # sched: [6:2.00]			; HASWELL-NEXT: vphaddd (%rdi), %xmm0, %xmm0 # sched: [3:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_phaddd:			; BTVER2-LABEL: test_phaddd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vphaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vphaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vphaddd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vphaddd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_phaddd:			; ZNVER1-LABEL: test_phaddd:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vphaddsw %xmm1, %xmm0, %xmm0 # sched: [3:1.50]			; SANDY-NEXT: vphaddsw %xmm1, %xmm0, %xmm0 # sched: [3:1.50]
	; SANDY-NEXT: vphaddsw (%rdi), %xmm0, %xmm0 # sched: [9:1.50]			; SANDY-NEXT: vphaddsw (%rdi), %xmm0, %xmm0 # sched: [9:1.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_phaddsw:			; HASWELL-LABEL: test_phaddsw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vphaddsw %xmm1, %xmm0, %xmm0 # sched: [3:2.00]			; HASWELL-NEXT: vphaddsw %xmm1, %xmm0, %xmm0 # sched: [3:2.00]
	; HASWELL-NEXT: vphaddsw (%rdi), %xmm0, %xmm0 # sched: [6:2.00]			; HASWELL-NEXT: vphaddsw (%rdi), %xmm0, %xmm0 # sched: [3:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_phaddsw:			; BTVER2-LABEL: test_phaddsw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vphaddsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vphaddsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vphaddsw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vphaddsw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_phaddsw:			; ZNVER1-LABEL: test_phaddsw:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vphaddw %xmm1, %xmm0, %xmm0 # sched: [3:1.50]			; SANDY-NEXT: vphaddw %xmm1, %xmm0, %xmm0 # sched: [3:1.50]
	; SANDY-NEXT: vphaddw (%rdi), %xmm0, %xmm0 # sched: [9:1.50]			; SANDY-NEXT: vphaddw (%rdi), %xmm0, %xmm0 # sched: [9:1.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_phaddw:			; HASWELL-LABEL: test_phaddw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vphaddw %xmm1, %xmm0, %xmm0 # sched: [3:2.00]			; HASWELL-NEXT: vphaddw %xmm1, %xmm0, %xmm0 # sched: [3:2.00]
	; HASWELL-NEXT: vphaddw (%rdi), %xmm0, %xmm0 # sched: [6:2.00]			; HASWELL-NEXT: vphaddw (%rdi), %xmm0, %xmm0 # sched: [3:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_phaddw:			; BTVER2-LABEL: test_phaddw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vphaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vphaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vphaddw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vphaddw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_phaddw:			; ZNVER1-LABEL: test_phaddw:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vphsubd %xmm1, %xmm0, %xmm0 # sched: [3:1.50]			; SANDY-NEXT: vphsubd %xmm1, %xmm0, %xmm0 # sched: [3:1.50]
	; SANDY-NEXT: vphsubd (%rdi), %xmm0, %xmm0 # sched: [9:1.50]			; SANDY-NEXT: vphsubd (%rdi), %xmm0, %xmm0 # sched: [9:1.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_phsubd:			; HASWELL-LABEL: test_phsubd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vphsubd %xmm1, %xmm0, %xmm0 # sched: [3:2.00]			; HASWELL-NEXT: vphsubd %xmm1, %xmm0, %xmm0 # sched: [3:2.00]
	; HASWELL-NEXT: vphsubd (%rdi), %xmm0, %xmm0 # sched: [6:2.00]			; HASWELL-NEXT: vphsubd (%rdi), %xmm0, %xmm0 # sched: [3:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_phsubd:			; BTVER2-LABEL: test_phsubd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vphsubd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vphsubd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vphsubd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vphsubd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_phsubd:			; ZNVER1-LABEL: test_phsubd:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vphsubsw %xmm1, %xmm0, %xmm0 # sched: [3:1.50]			; SANDY-NEXT: vphsubsw %xmm1, %xmm0, %xmm0 # sched: [3:1.50]
	; SANDY-NEXT: vphsubsw (%rdi), %xmm0, %xmm0 # sched: [9:1.50]			; SANDY-NEXT: vphsubsw (%rdi), %xmm0, %xmm0 # sched: [9:1.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_phsubsw:			; HASWELL-LABEL: test_phsubsw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vphsubsw %xmm1, %xmm0, %xmm0 # sched: [3:2.00]			; HASWELL-NEXT: vphsubsw %xmm1, %xmm0, %xmm0 # sched: [3:2.00]
	; HASWELL-NEXT: vphsubsw (%rdi), %xmm0, %xmm0 # sched: [6:2.00]			; HASWELL-NEXT: vphsubsw (%rdi), %xmm0, %xmm0 # sched: [3:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_phsubsw:			; BTVER2-LABEL: test_phsubsw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vphsubsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vphsubsw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vphsubsw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vphsubsw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_phsubsw:			; ZNVER1-LABEL: test_phsubsw:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vphsubw %xmm1, %xmm0, %xmm0 # sched: [3:1.50]			; SANDY-NEXT: vphsubw %xmm1, %xmm0, %xmm0 # sched: [3:1.50]
	; SANDY-NEXT: vphsubw (%rdi), %xmm0, %xmm0 # sched: [9:1.50]			; SANDY-NEXT: vphsubw (%rdi), %xmm0, %xmm0 # sched: [9:1.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_phsubw:			; HASWELL-LABEL: test_phsubw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vphsubw %xmm1, %xmm0, %xmm0 # sched: [3:2.00]			; HASWELL-NEXT: vphsubw %xmm1, %xmm0, %xmm0 # sched: [3:2.00]
	; HASWELL-NEXT: vphsubw (%rdi), %xmm0, %xmm0 # sched: [6:2.00]			; HASWELL-NEXT: vphsubw (%rdi), %xmm0, %xmm0 # sched: [3:2.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_phsubw:			; BTVER2-LABEL: test_phsubw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vphsubw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vphsubw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vphsubw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vphsubw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_phsubw:			; ZNVER1-LABEL: test_phsubw:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpmaddubsw %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vpmaddubsw %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vpmaddubsw (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vpmaddubsw (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmaddubsw:			; HASWELL-LABEL: test_pmaddubsw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmaddubsw %xmm1, %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpmaddubsw %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: vpmaddubsw (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; HASWELL-NEXT: vpmaddubsw (%rdi), %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmaddubsw:			; BTVER2-LABEL: test_pmaddubsw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmaddubsw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; BTVER2-NEXT: vpmaddubsw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; BTVER2-NEXT: vpmaddubsw (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vpmaddubsw (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pmaddubsw:			; ZNVER1-LABEL: test_pmaddubsw:
	Show All 32 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpmulhrsw %xmm1, %xmm0, %xmm0 # sched: [3:1.00]			; SANDY-NEXT: vpmulhrsw %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
	; SANDY-NEXT: vpmulhrsw (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; SANDY-NEXT: vpmulhrsw (%rdi), %xmm0, %xmm0 # sched: [9:1.00]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pmulhrsw:			; HASWELL-LABEL: test_pmulhrsw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpmulhrsw %xmm1, %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpmulhrsw %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: vpmulhrsw (%rdi), %xmm0, %xmm0 # sched: [9:1.00]			; HASWELL-NEXT: vpmulhrsw (%rdi), %xmm0, %xmm0 # sched: [5:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pmulhrsw:			; BTVER2-LABEL: test_pmulhrsw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpmulhrsw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]			; BTVER2-NEXT: vpmulhrsw %xmm1, %xmm0, %xmm0 # sched: [2:1.00]
	; BTVER2-NEXT: vpmulhrsw (%rdi), %xmm0, %xmm0 # sched: [7:1.00]			; BTVER2-NEXT: vpmulhrsw (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pmulhrsw:			; ZNVER1-LABEL: test_pmulhrsw:
	Show All 31 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpshufb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpshufb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpshufb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpshufb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_pshufb:			; HASWELL-LABEL: test_pshufb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpshufb %xmm1, %xmm0, %xmm0 # sched: [1:1.00]			; HASWELL-NEXT: vpshufb %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: vpshufb (%rdi), %xmm0, %xmm0 # sched: [5:1.00]			; HASWELL-NEXT: vpshufb (%rdi), %xmm0, %xmm0 # sched: [1:1.00]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_pshufb:			; BTVER2-LABEL: test_pshufb:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpshufb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpshufb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpshufb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpshufb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_pshufb:			; ZNVER1-LABEL: test_pshufb:
	Show All 35 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpsignb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpsignb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpsignb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpsignb (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psignb:			; HASWELL-LABEL: test_psignb:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsignb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpsignb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpsignb (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpsignb (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_psignb:			; BTVER2-LABEL: test_psignb:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpsignb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsignb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpsignb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpsignb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_psignb:			; ZNVER1-LABEL: test_psignb:
	Show All 35 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpsignd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpsignd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpsignd (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpsignd (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psignd:			; HASWELL-LABEL: test_psignd:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsignd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpsignd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpsignd (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpsignd (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_psignd:			; BTVER2-LABEL: test_psignd:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpsignd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsignd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpsignd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpsignd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_psignd:			; ZNVER1-LABEL: test_psignd:
	Show All 35 Lines
	; SANDY: # BB#0:			; SANDY: # BB#0:
	; SANDY-NEXT: vpsignw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; SANDY-NEXT: vpsignw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; SANDY-NEXT: vpsignw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]			; SANDY-NEXT: vpsignw (%rdi), %xmm0, %xmm0 # sched: [7:0.50]
	; SANDY-NEXT: retq # sched: [1:1.00]			; SANDY-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_psignw:			; HASWELL-LABEL: test_psignw:
	; HASWELL: # BB#0:			; HASWELL: # BB#0:
	; HASWELL-NEXT: vpsignw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; HASWELL-NEXT: vpsignw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: vpsignw (%rdi), %xmm0, %xmm0 # sched: [5:0.50]			; HASWELL-NEXT: vpsignw (%rdi), %xmm0, %xmm0 # sched: [1:0.50]
	; HASWELL-NEXT: retq # sched: [1:1.00]			; HASWELL-NEXT: retq # sched: [2:1.00]
	;			;
	; BTVER2-LABEL: test_psignw:			; BTVER2-LABEL: test_psignw:
	; BTVER2: # BB#0:			; BTVER2: # BB#0:
	; BTVER2-NEXT: vpsignw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]			; BTVER2-NEXT: vpsignw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
	; BTVER2-NEXT: vpsignw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]			; BTVER2-NEXT: vpsignw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
	; BTVER2-NEXT: retq # sched: [4:1.00]			; BTVER2-NEXT: retq # sched: [4:1.00]
	;			;
	; ZNVER1-LABEL: test_psignw:			; ZNVER1-LABEL: test_psignw:
	Show All 10 Lines

test/CodeGen/X86/vector-shift-ashr-512.ll

	Show First 20 Lines • Show All 195 Lines • ▼ Show 20 Lines
	; AVX512DQ-NEXT: vpsrlw $8, %ymm4, %ymm4			; AVX512DQ-NEXT: vpsrlw $8, %ymm4, %ymm4
	; AVX512DQ-NEXT: vpunpcklbw {{.*#+}} ymm2 = ymm0[0],ymm2[0],ymm0[1],ymm2[1],ymm0[2],ymm2[2],ymm0[3],ymm2[3],ymm0[4],ymm2[4],ymm0[5],ymm2[5],ymm0[6],ymm2[6],ymm0[7],ymm2[7],ymm0[16],ymm2[16],ymm0[17],ymm2[17],ymm0[18],ymm2[18],ymm0[19],ymm2[19],ymm0[20],ymm2[20],ymm0[21],ymm2[21],ymm0[22],ymm2[22],ymm0[23],ymm2[23]			; AVX512DQ-NEXT: vpunpcklbw {{.*#+}} ymm2 = ymm0[0],ymm2[0],ymm0[1],ymm2[1],ymm0[2],ymm2[2],ymm0[3],ymm2[3],ymm0[4],ymm2[4],ymm0[5],ymm2[5],ymm0[6],ymm2[6],ymm0[7],ymm2[7],ymm0[16],ymm2[16],ymm0[17],ymm2[17],ymm0[18],ymm2[18],ymm0[19],ymm2[19],ymm0[20],ymm2[20],ymm0[21],ymm2[21],ymm0[22],ymm2[22],ymm0[23],ymm2[23]
	; AVX512DQ-NEXT: vpunpcklbw {{.*#+}} ymm0 = ymm0[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7,16,16,17,17,18,18,19,19,20,20,21,21,22,22,23,23]			; AVX512DQ-NEXT: vpunpcklbw {{.*#+}} ymm0 = ymm0[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7,16,16,17,17,18,18,19,19,20,20,21,21,22,22,23,23]
	; AVX512DQ-NEXT: vpsraw $4, %ymm0, %ymm5			; AVX512DQ-NEXT: vpsraw $4, %ymm0, %ymm5
	; AVX512DQ-NEXT: vpblendvb %ymm2, %ymm5, %ymm0, %ymm0			; AVX512DQ-NEXT: vpblendvb %ymm2, %ymm5, %ymm0, %ymm0
	; AVX512DQ-NEXT: vpsraw $2, %ymm0, %ymm5			; AVX512DQ-NEXT: vpsraw $2, %ymm0, %ymm5
	; AVX512DQ-NEXT: vpaddw %ymm2, %ymm2, %ymm8			; AVX512DQ-NEXT: vpaddw %ymm2, %ymm2, %ymm8
	; AVX512DQ-NEXT: vpblendvb %ymm8, %ymm5, %ymm0, %ymm0			; AVX512DQ-NEXT: vpblendvb %ymm8, %ymm5, %ymm0, %ymm0
				; AVX512DQ-NEXT: vpunpckhbw {{.*#+}} ymm5 = ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm0[11],ymm1[11],ymm0[12],ymm1[12],ymm0[13],ymm1[13],ymm0[14],ymm1[14],ymm0[15],ymm1[15],ymm0[24],ymm1[24],ymm0[25],ymm1[25],ymm0[26],ymm1[26],ymm0[27],ymm1[27],ymm0[28],ymm1[28],ymm0[29],ymm1[29],ymm0[30],ymm1[30],ymm0[31],ymm1[31]
				; AVX512DQ-NEXT: vpsraw $4, %ymm5, %ymm9
				; AVX512DQ-NEXT: vpblendvb %ymm3, %ymm9, %ymm5, %ymm3
	; AVX512DQ-NEXT: vpsraw $1, %ymm0, %ymm5			; AVX512DQ-NEXT: vpsraw $1, %ymm0, %ymm5
	; AVX512DQ-NEXT: vpaddw %ymm8, %ymm8, %ymm9			; AVX512DQ-NEXT: vpaddw %ymm8, %ymm8, %ymm9
	; AVX512DQ-NEXT: vpblendvb %ymm9, %ymm5, %ymm0, %ymm0			; AVX512DQ-NEXT: vpblendvb %ymm9, %ymm5, %ymm0, %ymm0
	; AVX512DQ-NEXT: vpsrlw $8, %ymm0, %ymm0			; AVX512DQ-NEXT: vpsrlw $8, %ymm0, %ymm0
	; AVX512DQ-NEXT: vpackuswb %ymm4, %ymm0, %ymm0			; AVX512DQ-NEXT: vpackuswb %ymm4, %ymm0, %ymm0
	; AVX512DQ-NEXT: vpunpckhbw {{.*#+}} ymm4 = ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm0[11],ymm1[11],ymm0[12],ymm1[12],ymm0[13],ymm1[13],ymm0[14],ymm1[14],ymm0[15],ymm1[15],ymm0[24],ymm1[24],ymm0[25],ymm1[25],ymm0[26],ymm1[26],ymm0[27],ymm1[27],ymm0[28],ymm1[28],ymm0[29],ymm1[29],ymm0[30],ymm1[30],ymm0[31],ymm1[31]
	; AVX512DQ-NEXT: vpsraw $4, %ymm4, %ymm5
	; AVX512DQ-NEXT: vpblendvb %ymm3, %ymm5, %ymm4, %ymm3
	; AVX512DQ-NEXT: vpsraw $2, %ymm3, %ymm4			; AVX512DQ-NEXT: vpsraw $2, %ymm3, %ymm4
	; AVX512DQ-NEXT: vpblendvb %ymm6, %ymm4, %ymm3, %ymm3			; AVX512DQ-NEXT: vpblendvb %ymm6, %ymm4, %ymm3, %ymm3
	; AVX512DQ-NEXT: vpsraw $1, %ymm3, %ymm4			; AVX512DQ-NEXT: vpsraw $1, %ymm3, %ymm4
	; AVX512DQ-NEXT: vpblendvb %ymm7, %ymm4, %ymm3, %ymm3			; AVX512DQ-NEXT: vpblendvb %ymm7, %ymm4, %ymm3, %ymm3
	; AVX512DQ-NEXT: vpsrlw $8, %ymm3, %ymm3			; AVX512DQ-NEXT: vpsrlw $8, %ymm3, %ymm3
	; AVX512DQ-NEXT: vpunpcklbw {{.*#+}} ymm1 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[4],ymm1[4],ymm0[5],ymm1[5],ymm0[6],ymm1[6],ymm0[7],ymm1[7],ymm0[16],ymm1[16],ymm0[17],ymm1[17],ymm0[18],ymm1[18],ymm0[19],ymm1[19],ymm0[20],ymm1[20],ymm0[21],ymm1[21],ymm0[22],ymm1[22],ymm0[23],ymm1[23]			; AVX512DQ-NEXT: vpunpcklbw {{.*#+}} ymm1 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[4],ymm1[4],ymm0[5],ymm1[5],ymm0[6],ymm1[6],ymm0[7],ymm1[7],ymm0[16],ymm1[16],ymm0[17],ymm1[17],ymm0[18],ymm1[18],ymm0[19],ymm1[19],ymm0[20],ymm1[20],ymm0[21],ymm1[21],ymm0[22],ymm1[22],ymm0[23],ymm1[23]
	; AVX512DQ-NEXT: vpsraw $4, %ymm1, %ymm4			; AVX512DQ-NEXT: vpsraw $4, %ymm1, %ymm4
	; AVX512DQ-NEXT: vpblendvb %ymm2, %ymm4, %ymm1, %ymm1			; AVX512DQ-NEXT: vpblendvb %ymm2, %ymm4, %ymm1, %ymm1
	▲ Show 20 Lines • Show All 103 Lines • ▼ Show 20 Lines
	; AVX512DQ-NEXT: vpsrlw $8, %ymm4, %ymm4			; AVX512DQ-NEXT: vpsrlw $8, %ymm4, %ymm4
	; AVX512DQ-NEXT: vpunpcklbw {{.*#+}} ymm2 = ymm0[0],ymm2[0],ymm0[1],ymm2[1],ymm0[2],ymm2[2],ymm0[3],ymm2[3],ymm0[4],ymm2[4],ymm0[5],ymm2[5],ymm0[6],ymm2[6],ymm0[7],ymm2[7],ymm0[16],ymm2[16],ymm0[17],ymm2[17],ymm0[18],ymm2[18],ymm0[19],ymm2[19],ymm0[20],ymm2[20],ymm0[21],ymm2[21],ymm0[22],ymm2[22],ymm0[23],ymm2[23]			; AVX512DQ-NEXT: vpunpcklbw {{.*#+}} ymm2 = ymm0[0],ymm2[0],ymm0[1],ymm2[1],ymm0[2],ymm2[2],ymm0[3],ymm2[3],ymm0[4],ymm2[4],ymm0[5],ymm2[5],ymm0[6],ymm2[6],ymm0[7],ymm2[7],ymm0[16],ymm2[16],ymm0[17],ymm2[17],ymm0[18],ymm2[18],ymm0[19],ymm2[19],ymm0[20],ymm2[20],ymm0[21],ymm2[21],ymm0[22],ymm2[22],ymm0[23],ymm2[23]
	; AVX512DQ-NEXT: vpunpcklbw {{.*#+}} ymm0 = ymm0[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7,16,16,17,17,18,18,19,19,20,20,21,21,22,22,23,23]			; AVX512DQ-NEXT: vpunpcklbw {{.*#+}} ymm0 = ymm0[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7,16,16,17,17,18,18,19,19,20,20,21,21,22,22,23,23]
	; AVX512DQ-NEXT: vpsraw $4, %ymm0, %ymm5			; AVX512DQ-NEXT: vpsraw $4, %ymm0, %ymm5
	; AVX512DQ-NEXT: vpblendvb %ymm2, %ymm5, %ymm0, %ymm0			; AVX512DQ-NEXT: vpblendvb %ymm2, %ymm5, %ymm0, %ymm0
	; AVX512DQ-NEXT: vpsraw $2, %ymm0, %ymm5			; AVX512DQ-NEXT: vpsraw $2, %ymm0, %ymm5
	; AVX512DQ-NEXT: vpaddw %ymm2, %ymm2, %ymm8			; AVX512DQ-NEXT: vpaddw %ymm2, %ymm2, %ymm8
	; AVX512DQ-NEXT: vpblendvb %ymm8, %ymm5, %ymm0, %ymm0			; AVX512DQ-NEXT: vpblendvb %ymm8, %ymm5, %ymm0, %ymm0
				; AVX512DQ-NEXT: vpunpckhbw {{.*#+}} ymm5 = ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm0[11],ymm1[11],ymm0[12],ymm1[12],ymm0[13],ymm1[13],ymm0[14],ymm1[14],ymm0[15],ymm1[15],ymm0[24],ymm1[24],ymm0[25],ymm1[25],ymm0[26],ymm1[26],ymm0[27],ymm1[27],ymm0[28],ymm1[28],ymm0[29],ymm1[29],ymm0[30],ymm1[30],ymm0[31],ymm1[31]
				; AVX512DQ-NEXT: vpsraw $4, %ymm5, %ymm9
				; AVX512DQ-NEXT: vpblendvb %ymm3, %ymm9, %ymm5, %ymm3
	; AVX512DQ-NEXT: vpsraw $1, %ymm0, %ymm5			; AVX512DQ-NEXT: vpsraw $1, %ymm0, %ymm5
	; AVX512DQ-NEXT: vpaddw %ymm8, %ymm8, %ymm9			; AVX512DQ-NEXT: vpaddw %ymm8, %ymm8, %ymm9
	; AVX512DQ-NEXT: vpblendvb %ymm9, %ymm5, %ymm0, %ymm0			; AVX512DQ-NEXT: vpblendvb %ymm9, %ymm5, %ymm0, %ymm0
	; AVX512DQ-NEXT: vpsrlw $8, %ymm0, %ymm0			; AVX512DQ-NEXT: vpsrlw $8, %ymm0, %ymm0
	; AVX512DQ-NEXT: vpackuswb %ymm4, %ymm0, %ymm0			; AVX512DQ-NEXT: vpackuswb %ymm4, %ymm0, %ymm0
	; AVX512DQ-NEXT: vpunpckhbw {{.*#+}} ymm4 = ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm0[11],ymm1[11],ymm0[12],ymm1[12],ymm0[13],ymm1[13],ymm0[14],ymm1[14],ymm0[15],ymm1[15],ymm0[24],ymm1[24],ymm0[25],ymm1[25],ymm0[26],ymm1[26],ymm0[27],ymm1[27],ymm0[28],ymm1[28],ymm0[29],ymm1[29],ymm0[30],ymm1[30],ymm0[31],ymm1[31]
	; AVX512DQ-NEXT: vpsraw $4, %ymm4, %ymm5
	; AVX512DQ-NEXT: vpblendvb %ymm3, %ymm5, %ymm4, %ymm3
	; AVX512DQ-NEXT: vpsraw $2, %ymm3, %ymm4			; AVX512DQ-NEXT: vpsraw $2, %ymm3, %ymm4
	; AVX512DQ-NEXT: vpblendvb %ymm6, %ymm4, %ymm3, %ymm3			; AVX512DQ-NEXT: vpblendvb %ymm6, %ymm4, %ymm3, %ymm3
	; AVX512DQ-NEXT: vpsraw $1, %ymm3, %ymm4			; AVX512DQ-NEXT: vpsraw $1, %ymm3, %ymm4
	; AVX512DQ-NEXT: vpblendvb %ymm7, %ymm4, %ymm3, %ymm3			; AVX512DQ-NEXT: vpblendvb %ymm7, %ymm4, %ymm3, %ymm3
	; AVX512DQ-NEXT: vpsrlw $8, %ymm3, %ymm3			; AVX512DQ-NEXT: vpsrlw $8, %ymm3, %ymm3
	; AVX512DQ-NEXT: vpunpcklbw {{.*#+}} ymm1 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[4],ymm1[4],ymm0[5],ymm1[5],ymm0[6],ymm1[6],ymm0[7],ymm1[7],ymm0[16],ymm1[16],ymm0[17],ymm1[17],ymm0[18],ymm1[18],ymm0[19],ymm1[19],ymm0[20],ymm1[20],ymm0[21],ymm1[21],ymm0[22],ymm1[22],ymm0[23],ymm1[23]			; AVX512DQ-NEXT: vpunpcklbw {{.*#+}} ymm1 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[4],ymm1[4],ymm0[5],ymm1[5],ymm0[6],ymm1[6],ymm0[7],ymm1[7],ymm0[16],ymm1[16],ymm0[17],ymm1[17],ymm0[18],ymm1[18],ymm0[19],ymm1[19],ymm0[20],ymm1[20],ymm0[21],ymm1[21],ymm0[22],ymm1[22],ymm0[23],ymm1[23]
	; AVX512DQ-NEXT: vpsraw $4, %ymm1, %ymm4			; AVX512DQ-NEXT: vpsraw $4, %ymm1, %ymm4
	; AVX512DQ-NEXT: vpblendvb %ymm2, %ymm4, %ymm1, %ymm1			; AVX512DQ-NEXT: vpblendvb %ymm2, %ymm4, %ymm1, %ymm1
	▲ Show 20 Lines • Show All 126 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-shift-lshr-256.ll

	Show First 20 Lines • Show All 771 Lines • ▼ Show 20 Lines
	; XOPAVX2-NEXT: vpshlb %xmm2, %xmm4, %xmm2			; XOPAVX2-NEXT: vpshlb %xmm2, %xmm4, %xmm2
	; XOPAVX2-NEXT: vpsubb %xmm1, %xmm3, %xmm1			; XOPAVX2-NEXT: vpsubb %xmm1, %xmm3, %xmm1
	; XOPAVX2-NEXT: vpshlb %xmm1, %xmm0, %xmm0			; XOPAVX2-NEXT: vpshlb %xmm1, %xmm0, %xmm0
	; XOPAVX2-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0			; XOPAVX2-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0
	; XOPAVX2-NEXT: retq			; XOPAVX2-NEXT: retq
	;			;
	; AVX512DQ-LABEL: splatvar_shift_v32i8:			; AVX512DQ-LABEL: splatvar_shift_v32i8:
	; AVX512DQ: # BB#0:			; AVX512DQ: # BB#0:
	; AVX512DQ-NEXT: vpbroadcastb %xmm1, %ymm1
	; AVX512DQ-NEXT: vpsrlw $4, %ymm0, %ymm2			; AVX512DQ-NEXT: vpsrlw $4, %ymm0, %ymm2
	; AVX512DQ-NEXT: vpand {{.*}}(%rip), %ymm2, %ymm2			; AVX512DQ-NEXT: vpand {{.*}}(%rip), %ymm2, %ymm2
				; AVX512DQ-NEXT: vpbroadcastb %xmm1, %ymm1
	; AVX512DQ-NEXT: vpsllw $5, %ymm1, %ymm1			; AVX512DQ-NEXT: vpsllw $5, %ymm1, %ymm1
	; AVX512DQ-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0			; AVX512DQ-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0
	; AVX512DQ-NEXT: vpsrlw $2, %ymm0, %ymm2			; AVX512DQ-NEXT: vpsrlw $2, %ymm0, %ymm2
	; AVX512DQ-NEXT: vpand {{.*}}(%rip), %ymm2, %ymm2			; AVX512DQ-NEXT: vpand {{.*}}(%rip), %ymm2, %ymm2
	; AVX512DQ-NEXT: vpaddb %ymm1, %ymm1, %ymm1			; AVX512DQ-NEXT: vpaddb %ymm1, %ymm1, %ymm1
	; AVX512DQ-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0			; AVX512DQ-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0
	; AVX512DQ-NEXT: vpsrlw $1, %ymm0, %ymm2			; AVX512DQ-NEXT: vpsrlw $1, %ymm0, %ymm2
	; AVX512DQ-NEXT: vpand {{.*}}(%rip), %ymm2, %ymm2			; AVX512DQ-NEXT: vpand {{.*}}(%rip), %ymm2, %ymm2
	▲ Show 20 Lines • Show All 748 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-shift-shl-256.ll

	Show First 20 Lines • Show All 707 Lines • ▼ Show 20 Lines
	; XOPAVX2-NEXT: vextracti128 $1, %ymm1, %xmm3			; XOPAVX2-NEXT: vextracti128 $1, %ymm1, %xmm3
	; XOPAVX2-NEXT: vpshlb %xmm3, %xmm2, %xmm2			; XOPAVX2-NEXT: vpshlb %xmm3, %xmm2, %xmm2
	; XOPAVX2-NEXT: vpshlb %xmm1, %xmm0, %xmm0			; XOPAVX2-NEXT: vpshlb %xmm1, %xmm0, %xmm0
	; XOPAVX2-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0			; XOPAVX2-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0
	; XOPAVX2-NEXT: retq			; XOPAVX2-NEXT: retq
	;			;
	; AVX512DQ-LABEL: splatvar_shift_v32i8:			; AVX512DQ-LABEL: splatvar_shift_v32i8:
	; AVX512DQ: # BB#0:			; AVX512DQ: # BB#0:
	; AVX512DQ-NEXT: vpbroadcastb %xmm1, %ymm1
	; AVX512DQ-NEXT: vpsllw $4, %ymm0, %ymm2			; AVX512DQ-NEXT: vpsllw $4, %ymm0, %ymm2
	; AVX512DQ-NEXT: vpand {{.*}}(%rip), %ymm2, %ymm2			; AVX512DQ-NEXT: vpand {{.*}}(%rip), %ymm2, %ymm2
				; AVX512DQ-NEXT: vpbroadcastb %xmm1, %ymm1
	; AVX512DQ-NEXT: vpsllw $5, %ymm1, %ymm1			; AVX512DQ-NEXT: vpsllw $5, %ymm1, %ymm1
	; AVX512DQ-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0			; AVX512DQ-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0
	; AVX512DQ-NEXT: vpsllw $2, %ymm0, %ymm2			; AVX512DQ-NEXT: vpsllw $2, %ymm0, %ymm2
	; AVX512DQ-NEXT: vpand {{.*}}(%rip), %ymm2, %ymm2			; AVX512DQ-NEXT: vpand {{.*}}(%rip), %ymm2, %ymm2
	; AVX512DQ-NEXT: vpaddb %ymm1, %ymm1, %ymm1			; AVX512DQ-NEXT: vpaddb %ymm1, %ymm1, %ymm1
	; AVX512DQ-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0			; AVX512DQ-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0
	; AVX512DQ-NEXT: vpaddb %ymm0, %ymm0, %ymm2			; AVX512DQ-NEXT: vpaddb %ymm0, %ymm0, %ymm2
	; AVX512DQ-NEXT: vpaddb %ymm1, %ymm1, %ymm1			; AVX512DQ-NEXT: vpaddb %ymm1, %ymm1, %ymm1
	▲ Show 20 Lines • Show All 651 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-shuffle-512-v32.ll

	Show First 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
	define <32 x i16> @shuffle_v32i16_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_38(<32 x i16> %a, <32 x i16> %b) {			define <32 x i16> @shuffle_v32i16_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_38(<32 x i16> %a, <32 x i16> %b) {
	; KNL-LABEL: shuffle_v32i16_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_38:			; KNL-LABEL: shuffle_v32i16_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_38:
	; KNL: ## BB#0:			; KNL: ## BB#0:
	; KNL-NEXT: vextracti128 $1, %ymm1, %xmm2			; KNL-NEXT: vextracti128 $1, %ymm1, %xmm2
	; KNL-NEXT: vpunpckhwd {{.*#+}} xmm1 = xmm2[4],xmm1[4],xmm2[5],xmm1[5],xmm2[6],xmm1[6],xmm2[7],xmm1[7]			; KNL-NEXT: vpunpckhwd {{.*#+}} xmm1 = xmm2[4],xmm1[4],xmm2[5],xmm1[5],xmm2[6],xmm1[6],xmm2[7],xmm1[7]
	; KNL-NEXT: vpshufb {{.*#+}} xmm4 = xmm1[8,9,12,13,12,13,10,11,0,1,4,5,4,5,0,1]			; KNL-NEXT: vpshufb {{.*#+}} xmm4 = xmm1[8,9,12,13,12,13,10,11,0,1,4,5,4,5,0,1]
	; KNL-NEXT: vpshufd {{.*#+}} xmm1 = xmm2[0,1,0,3]			; KNL-NEXT: vpshufd {{.*#+}} xmm1 = xmm2[0,1,0,3]
	; KNL-NEXT: vpshuflw {{.*#+}} xmm2 = xmm1[0,3,2,2,4,5,6,7]			; KNL-NEXT: vpshuflw {{.*#+}} xmm2 = xmm1[0,3,2,2,4,5,6,7]
	; KNL-NEXT: vinserti128 $1, %xmm2, %ymm4, %ymm1			; KNL-NEXT: vextracti128 $1, %ymm0, %xmm1
	; KNL-NEXT: vextracti128 $1, %ymm0, %xmm5			; KNL-NEXT: vpunpckhwd {{.*#+}} xmm0 = xmm1[4],xmm0[4],xmm1[5],xmm0[5],xmm1[6],xmm0[6],xmm1[7],xmm0[7]
	; KNL-NEXT: vpunpckhwd {{.*#+}} xmm0 = xmm5[4],xmm0[4],xmm5[5],xmm0[5],xmm5[6],xmm0[6],xmm5[7],xmm0[7]
	; KNL-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[12,13,10,11,8,9,14,15,4,5,2,3,2,3,6,7]			; KNL-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[12,13,10,11,8,9,14,15,4,5,2,3,2,3,6,7]
	; KNL-NEXT: vpshufb {{.*#+}} xmm5 = xmm5[6,7,2,3,4,5,6,7,2,3,2,3,0,1,14,15]			; KNL-NEXT: vpshufb {{.*#+}} xmm1 = xmm1[6,7,2,3,4,5,6,7,2,3,2,3,0,1,14,15]
	; KNL-NEXT: vinserti128 $1, %xmm5, %ymm0, %ymm0			; KNL-NEXT: vinserti128 $1, %xmm2, %ymm4, %ymm5
	; KNL-NEXT: vpblendw {{.*#+}} ymm1 = ymm0[0],ymm1[1],ymm0[2],ymm1[3],ymm0[4],ymm1[5],ymm0[6],ymm1[7],ymm0[8],ymm1[9],ymm0[10],ymm1[11],ymm0[12],ymm1[13],ymm0[14],ymm1[15]			; KNL-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm0
				; KNL-NEXT: vpblendw {{.*#+}} ymm1 = ymm0[0],ymm5[1],ymm0[2],ymm5[3],ymm0[4],ymm5[5],ymm0[6],ymm5[7],ymm0[8],ymm5[9],ymm0[10],ymm5[11],ymm0[12],ymm5[13],ymm0[14],ymm5[15]
	; KNL-NEXT: vextracti128 $1, %ymm3, %xmm3			; KNL-NEXT: vextracti128 $1, %ymm3, %xmm3
	; KNL-NEXT: vpbroadcastw %xmm3, %ymm3			; KNL-NEXT: vpbroadcastw %xmm3, %ymm3
	; KNL-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,0]			; KNL-NEXT: vmovdqa {{.*#+}} ymm5 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,0,0]
	; KNL-NEXT: vpblendvb %ymm5, %ymm1, %ymm3, %ymm1			; KNL-NEXT: vpblendvb %ymm5, %ymm1, %ymm3, %ymm1
	; KNL-NEXT: vpshufhw {{.*#+}} xmm2 = xmm2[0,1,2,3,4,5,6,4]			; KNL-NEXT: vpshufhw {{.*#+}} xmm2 = xmm2[0,1,2,3,4,5,6,4]
	; KNL-NEXT: vinserti128 $1, %xmm2, %ymm4, %ymm2			; KNL-NEXT: vinserti128 $1, %xmm2, %ymm4, %ymm2
	; KNL-NEXT: vpblendw {{.*#+}} ymm0 = ymm0[0],ymm2[1],ymm0[2],ymm2[3],ymm0[4],ymm2[5],ymm0[6],ymm2[7],ymm0[8],ymm2[9],ymm0[10],ymm2[11],ymm0[12],ymm2[13],ymm0[14],ymm2[15]			; KNL-NEXT: vpblendw {{.*#+}} ymm0 = ymm0[0],ymm2[1],ymm0[2],ymm2[3],ymm0[4],ymm2[5],ymm0[6],ymm2[7],ymm0[8],ymm2[9],ymm0[10],ymm2[11],ymm0[12],ymm2[13],ymm0[14],ymm2[15]
	; KNL-NEXT: retq			; KNL-NEXT: retq
	▲ Show 20 Lines • Show All 275 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86][Haswell] Updating HSW instruction scheduling informationClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 110916

lib/Target/X86/X86SchedHaswell.td

test/CodeGen/X86/avx-schedule.ll

test/CodeGen/X86/avx2-schedule.ll

test/CodeGen/X86/avx512-cmp.ll

test/CodeGen/X86/avx512-cvt.ll

test/CodeGen/X86/avx512-ext.ll

test/CodeGen/X86/avx512-insert-extract.ll

test/CodeGen/X86/avx512-intrinsics-upgrade.ll

test/CodeGen/X86/avx512-mask-op.ll

test/CodeGen/X86/avx512-vec-cmp.ll

test/CodeGen/X86/avx512bw-intrinsics-upgrade.ll

test/CodeGen/X86/avx512bwvl-intrinsics-upgrade.ll

test/CodeGen/X86/avx512vl-vec-cmp.ll

test/CodeGen/X86/avx512vl-vec-masked-cmp.ll

test/CodeGen/X86/bmi-schedule.ll

test/CodeGen/X86/bmi2-schedule.ll

test/CodeGen/X86/f16c-schedule.ll

test/CodeGen/X86/lea32-schedule.ll

test/CodeGen/X86/lea64-schedule.ll

test/CodeGen/X86/lzcnt-schedule.ll

test/CodeGen/X86/mul-constant-i32.ll

test/CodeGen/X86/mul-constant-i64.ll

test/CodeGen/X86/popcnt-schedule.ll

test/CodeGen/X86/pr32329.ll

test/CodeGen/X86/recip-fastmath.ll

test/CodeGen/X86/recip-fastmath2.ll

test/CodeGen/X86/sse-schedule.ll

test/CodeGen/X86/sse2-schedule.ll

test/CodeGen/X86/sse3-schedule.ll

test/CodeGen/X86/sse41-schedule.ll

test/CodeGen/X86/sse42-schedule.ll

test/CodeGen/X86/ssse3-schedule.ll

test/CodeGen/X86/vector-shift-ashr-512.ll

test/CodeGen/X86/vector-shift-lshr-256.ll

test/CodeGen/X86/vector-shift-shl-256.ll

test/CodeGen/X86/vector-shuffle-512-v32.ll

[X86][Haswell] Updating HSW instruction scheduling information
ClosedPublic