Diff 169651

lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 9,921 Lines • ▼ Show 20 Lines	static SDValue lowerVectorShuffleAsBitBlend(const SDLoc &DL, MVT VT, SDValue V1,
for (int i = 0, Size = Mask.size(); i < Size; ++i) {		for (int i = 0, Size = Mask.size(); i < Size; ++i) {
if (Mask[i] >= 0 && Mask[i] != i && Mask[i] != i + Size)		if (Mask[i] >= 0 && Mask[i] != i && Mask[i] != i + Size)
return SDValue(); // Shuffled input!		return SDValue(); // Shuffled input!
MaskOps.push_back(Mask[i] < Size ? AllOnes : Zero);		MaskOps.push_back(Mask[i] < Size ? AllOnes : Zero);
}		}

SDValue V1Mask = DAG.getBuildVector(VT, DL, MaskOps);		SDValue V1Mask = DAG.getBuildVector(VT, DL, MaskOps);
V1 = DAG.getNode(ISD::AND, DL, VT, V1, V1Mask);		V1 = DAG.getNode(ISD::AND, DL, VT, V1, V1Mask);
// We have to cast V2 around.		V2 = DAG.getNode(X86ISD::ANDNP, DL, VT, V1Mask, V2);
MVT MaskVT = MVT::getVectorVT(MVT::i64, VT.getSizeInBits() / 64);
V2 = DAG.getBitcast(VT, DAG.getNode(X86ISD::ANDNP, DL, MaskVT,
DAG.getBitcast(MaskVT, V1Mask),
DAG.getBitcast(MaskVT, V2)));
return DAG.getNode(ISD::OR, DL, VT, V1, V2);		return DAG.getNode(ISD::OR, DL, VT, V1, V2);
}		}

static SDValue getVectorMaskingNode(SDValue Op, SDValue Mask,		static SDValue getVectorMaskingNode(SDValue Op, SDValue Mask,
SDValue PreservedSrc,		SDValue PreservedSrc,
const X86Subtarget &Subtarget,		const X86Subtarget &Subtarget,
SelectionDAG &DAG);		SelectionDAG &DAG);

▲ Show 20 Lines • Show All 25,118 Lines • ▼ Show 20 Lines	static SDValue combineCompareEqual(SDNode *N, SelectionDAG &DAG,
}		}
return SDValue();		return SDValue();
}		}

/// Try to fold: (and (xor X, -1), Y) -> (andnp X, Y).		/// Try to fold: (and (xor X, -1), Y) -> (andnp X, Y).
static SDValue combineANDXORWithAllOnesIntoANDNP(SDNode *N, SelectionDAG &DAG) {		static SDValue combineANDXORWithAllOnesIntoANDNP(SDNode *N, SelectionDAG &DAG) {
assert(N->getOpcode() == ISD::AND);		assert(N->getOpcode() == ISD::AND);

EVT VT = N->getValueType(0);		MVT VT = N->getSimpleValueType(0);
if (VT != MVT::v2i64 && VT != MVT::v4i64 && VT != MVT::v8i64)		if (!VT.is128BitVector() && !VT.is256BitVector() && !VT.is512BitVector())
return SDValue();		return SDValue();

SDValue X, Y;		SDValue X, Y;
SDValue N0 = N->getOperand(0);		SDValue N0 = N->getOperand(0);
SDValue N1 = N->getOperand(1);		SDValue N1 = N->getOperand(1);
if (N0.getOpcode() == ISD::XOR &&		if (N0.getOpcode() == ISD::XOR &&
ISD::isBuildVectorAllOnes(N0.getOperand(1).getNode())) {		ISD::isBuildVectorAllOnes(N0.getOperand(1).getNode())) {
X = N0.getOperand(0);		X = N0.getOperand(0);
▲ Show 20 Lines • Show All 329 Lines • ▼ Show 20 Lines	static SDValue combineParity(SDNode *N, SelectionDAG &DAG,
SDValue Flags = DAG.getNode(X86ISD::XOR, DL, VTs, Lo, Hi).getValue(1);		SDValue Flags = DAG.getNode(X86ISD::XOR, DL, VTs, Lo, Hi).getValue(1);

// Copy the inverse of the parity flag into a register with setcc.		// Copy the inverse of the parity flag into a register with setcc.
SDValue Setnp = getSETCC(X86::COND_NP, Flags, DL, DAG);		SDValue Setnp = getSETCC(X86::COND_NP, Flags, DL, DAG);
// Zero extend to original type.		// Zero extend to original type.
return DAG.getNode(ISD::ZERO_EXTEND, DL, N->getValueType(0), Setnp);		return DAG.getNode(ISD::ZERO_EXTEND, DL, N->getValueType(0), Setnp);
}		}

// This promotes vectors and/or/xor to a vXi64 type. We used to do this during
// op legalization, but DAG combine yields better results.
// TODO: This is largely just to reduce the number of isel patterns. Maybe we
// can just add all the patterns or do C++ based selection in X86ISelDAGToDAG?
static SDValue promoteVecLogicOp(SDNode *N, SelectionDAG &DAG) {
MVT VT = N->getSimpleValueType(0);

if (!VT.is128BitVector() && !VT.is256BitVector() && !VT.is512BitVector())
return SDValue();

// Already correct type.
if (VT.getVectorElementType() == MVT::i64)
return SDValue();

MVT NewVT = MVT::getVectorVT(MVT::i64, VT.getSizeInBits() / 64);
SDValue Op0 = DAG.getBitcast(NewVT, N->getOperand(0));
SDValue Op1 = DAG.getBitcast(NewVT, N->getOperand(1));
return DAG.getBitcast(VT, DAG.getNode(N->getOpcode(), SDLoc(N), NewVT,
Op0, Op1));
}

static SDValue combineAnd(SDNode *N, SelectionDAG &DAG,		static SDValue combineAnd(SDNode *N, SelectionDAG &DAG,
TargetLowering::DAGCombinerInfo &DCI,		TargetLowering::DAGCombinerInfo &DCI,
const X86Subtarget &Subtarget) {		const X86Subtarget &Subtarget) {
EVT VT = N->getValueType(0);		EVT VT = N->getValueType(0);

// If this is SSE1 only convert to FAND to avoid scalarization.		// If this is SSE1 only convert to FAND to avoid scalarization.
if (Subtarget.hasSSE1() && !Subtarget.hasSSE2() && VT == MVT::v4i32) {		if (Subtarget.hasSSE1() && !Subtarget.hasSSE2() && VT == MVT::v4i32) {
return DAG.getBitcast(		return DAG.getBitcast(
Show All 18 Lines	static SDValue combineAnd(SDNode *N, SelectionDAG &DAG,

// This must be done before legalization has expanded the ctpop.		// This must be done before legalization has expanded the ctpop.
if (SDValue V = combineParity(N, DAG, Subtarget))		if (SDValue V = combineParity(N, DAG, Subtarget))
return V;		return V;

if (DCI.isBeforeLegalizeOps())		if (DCI.isBeforeLegalizeOps())
return SDValue();		return SDValue();

if (SDValue V = promoteVecLogicOp(N, DAG))
return V;

if (SDValue R = combineCompareEqual(N, DAG, DCI, Subtarget))		if (SDValue R = combineCompareEqual(N, DAG, DCI, Subtarget))
return R;		return R;

if (SDValue FPLogic = convertIntLogicToFPLogic(N, DAG, Subtarget))		if (SDValue FPLogic = convertIntLogicToFPLogic(N, DAG, Subtarget))
return FPLogic;		return FPLogic;

if (SDValue R = combineANDXORWithAllOnesIntoANDNP(N, DAG))		if (SDValue R = combineANDXORWithAllOnesIntoANDNP(N, DAG))
return R;		return R;
▲ Show 20 Lines • Show All 171 Lines • ▼ Show 20 Lines	if (V) {
return DAG.getBitcast(VT, Res);		return DAG.getBitcast(VT, Res);
}		}
}		}

// PBLENDVB is only available on SSE 4.1.		// PBLENDVB is only available on SSE 4.1.
if (!Subtarget.hasSSE41())		if (!Subtarget.hasSSE41())
return SDValue();		return SDValue();

MVT BlendVT = (VT == MVT::v4i64) ? MVT::v32i8 : MVT::v16i8;		MVT BlendVT = VT.is256BitVector() ? MVT::v32i8 : MVT::v16i8;

X = DAG.getBitcast(BlendVT, X);		X = DAG.getBitcast(BlendVT, X);
Y = DAG.getBitcast(BlendVT, Y);		Y = DAG.getBitcast(BlendVT, Y);
Mask = DAG.getBitcast(BlendVT, Mask);		Mask = DAG.getBitcast(BlendVT, Mask);
Mask = DAG.getSelect(DL, BlendVT, Mask, Y, X);		Mask = DAG.getSelect(DL, BlendVT, Mask, Y, X);
return DAG.getBitcast(VT, Mask);		return DAG.getBitcast(VT, Mask);
}		}

▲ Show 20 Lines • Show All 118 Lines • ▼ Show 20 Lines	return DAG.getBitcast(MVT::v4i32,
DAG.getNode(X86ISD::FOR, SDLoc(N), MVT::v4f32,		DAG.getNode(X86ISD::FOR, SDLoc(N), MVT::v4f32,
DAG.getBitcast(MVT::v4f32, N0),		DAG.getBitcast(MVT::v4f32, N0),
DAG.getBitcast(MVT::v4f32, N1)));		DAG.getBitcast(MVT::v4f32, N1)));
}		}

if (DCI.isBeforeLegalizeOps())		if (DCI.isBeforeLegalizeOps())
return SDValue();		return SDValue();

if (SDValue V = promoteVecLogicOp(N, DAG))
return V;

if (SDValue R = combineCompareEqual(N, DAG, DCI, Subtarget))		if (SDValue R = combineCompareEqual(N, DAG, DCI, Subtarget))
return R;		return R;

if (SDValue FPLogic = convertIntLogicToFPLogic(N, DAG, Subtarget))		if (SDValue FPLogic = convertIntLogicToFPLogic(N, DAG, Subtarget))
return FPLogic;		return FPLogic;

if (SDValue R = combineLogicBlendIntoPBLENDV(N, DAG, Subtarget))		if (SDValue R = combineLogicBlendIntoPBLENDV(N, DAG, Subtarget))
return R;		return R;
▲ Show 20 Lines • Show All 1,959 Lines • ▼ Show 20 Lines

static SDValue lowerX86FPLogicOp(SDNode *N, SelectionDAG &DAG,		static SDValue lowerX86FPLogicOp(SDNode *N, SelectionDAG &DAG,
const X86Subtarget &Subtarget) {		const X86Subtarget &Subtarget) {
MVT VT = N->getSimpleValueType(0);		MVT VT = N->getSimpleValueType(0);
// If we have integer vector types available, use the integer opcodes.		// If we have integer vector types available, use the integer opcodes.
if ((VT.isVector() \|\| VT == MVT::f128) && Subtarget.hasSSE2()) {		if ((VT.isVector() \|\| VT == MVT::f128) && Subtarget.hasSSE2()) {
SDLoc dl(N);		SDLoc dl(N);

MVT IntVT = MVT::getVectorVT(MVT::i64, VT.getSizeInBits() / 64);		unsigned IntBits = std::min(VT.getScalarSizeInBits(), 64U);
		MVT IntSVT = MVT::getIntegerVT(IntBits);
		MVT IntVT = MVT::getVectorVT(IntSVT, VT.getSizeInBits() / IntBits);

SDValue Op0 = DAG.getBitcast(IntVT, N->getOperand(0));		SDValue Op0 = DAG.getBitcast(IntVT, N->getOperand(0));
SDValue Op1 = DAG.getBitcast(IntVT, N->getOperand(1));		SDValue Op1 = DAG.getBitcast(IntVT, N->getOperand(1));
unsigned IntOpcode;		unsigned IntOpcode;
switch (N->getOpcode()) {		switch (N->getOpcode()) {
default: llvm_unreachable("Unexpected FP logic op");		default: llvm_unreachable("Unexpected FP logic op");
case X86ISD::FOR: IntOpcode = ISD::OR; break;		case X86ISD::FOR: IntOpcode = ISD::OR; break;
case X86ISD::FXOR: IntOpcode = ISD::XOR; break;		case X86ISD::FXOR: IntOpcode = ISD::XOR; break;
Show All 36 Lines	static SDValue combineXor(SDNode *N, SelectionDAG &DAG,
}		}

if (SDValue Cmp = foldVectorXorShiftIntoCmp(N, DAG, Subtarget))		if (SDValue Cmp = foldVectorXorShiftIntoCmp(N, DAG, Subtarget))
return Cmp;		return Cmp;

if (DCI.isBeforeLegalizeOps())		if (DCI.isBeforeLegalizeOps())
return SDValue();		return SDValue();

if (SDValue V = promoteVecLogicOp(N, DAG))
return V;

if (SDValue SetCC = foldXor1SetCC(N, DAG))		if (SDValue SetCC = foldXor1SetCC(N, DAG))
return SetCC;		return SetCC;

if (SDValue RV = foldXorTruncShiftIntoCmp(N, DAG))		if (SDValue RV = foldXorTruncShiftIntoCmp(N, DAG))
return RV;		return RV;

if (SDValue FPLogic = convertIntLogicToFPLogic(N, DAG, Subtarget))		if (SDValue FPLogic = convertIntLogicToFPLogic(N, DAG, Subtarget))
return FPLogic;		return FPLogic;
▲ Show 20 Lines • Show All 3,846 Lines • Show Last 20 Lines

lib/Target/X86/X86InstrAVX512.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 101 Lines • ▼ Show 20 Lines	SubRegIndex SubRegIdx = !if (!eq (Size, 128), sub_xmm,
!if (!eq (Size, 256), sub_ymm, ?));		!if (!eq (Size, 256), sub_ymm, ?));

Domain ExeDomain = !if (!eq (EltTypeName, "f32"), SSEPackedSingle,		Domain ExeDomain = !if (!eq (EltTypeName, "f32"), SSEPackedSingle,
!if (!eq (EltTypeName, "f64"), SSEPackedDouble,		!if (!eq (EltTypeName, "f64"), SSEPackedDouble,
SSEPackedInt));		SSEPackedInt));

RegisterClass FRC = !if (!eq (EltTypeName, "f32"), FR32X, FR64X);		RegisterClass FRC = !if (!eq (EltTypeName, "f32"), FR32X, FR64X);

// A vector tye of the same width with element type i64. This is used to
// create patterns for logic ops.
ValueType i64VT = !cast<ValueType>("v" # !srl(Size, 6) # "i64");

// A vector type of the same width with element type i32. This is used to		// A vector type of the same width with element type i32. This is used to
// create the canonical constant zero node ImmAllZerosV.		// create the canonical constant zero node ImmAllZerosV.
ValueType i32VT = !cast<ValueType>("v" # !srl(Size, 5) # "i32");		ValueType i32VT = !cast<ValueType>("v" # !srl(Size, 5) # "i32");
dag ImmAllZerosV = (VT (bitconvert (i32VT immAllZerosV)));		dag ImmAllZerosV = (VT (bitconvert (i32VT immAllZerosV)));

string ZSuffix = !if (!eq (Size, 128), "Z128",		string ZSuffix = !if (!eq (Size, 128), "Z128",
!if (!eq (Size, 256), "Z256", "Z"));		!if (!eq (Size, 256), "Z256", "Z"));
}		}
▲ Show 20 Lines • Show All 4,919 Lines • ▼ Show 20 Lines	let Predicates = [HasAVX512, NoVLX] in {
defm : avx512_min_max_lowering<VPMAXSQZrr, smax>;		defm : avx512_min_max_lowering<VPMAXSQZrr, smax>;
defm : avx512_min_max_lowering<VPMINSQZrr, smin>;		defm : avx512_min_max_lowering<VPMINSQZrr, smin>;
}		}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// AVX-512 Logical Instructions		// AVX-512 Logical Instructions
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

// OpNodeMsk is the OpNode to use when element size is important. OpNode will		defm VPAND : avx512_binop_rm_vl_dq<0xDB, 0xDB, "vpand", and,
// be set to null_frag for 32-bit elements.		SchedWriteVecLogic, HasAVX512, 1>;
multiclass avx512_logic_rm<bits<8> opc, string OpcodeStr,		defm VPOR : avx512_binop_rm_vl_dq<0xEB, 0xEB, "vpor", or,
SDPatternOperator OpNode,		SchedWriteVecLogic, HasAVX512, 1>;
SDNode OpNodeMsk, X86FoldableSchedWrite sched,		defm VPXOR : avx512_binop_rm_vl_dq<0xEF, 0xEF, "vpxor", xor,
X86VectorVTInfo _, bit IsCommutable = 0> {		SchedWriteVecLogic, HasAVX512, 1>;
let hasSideEffects = 0 in		defm VPANDN : avx512_binop_rm_vl_dq<0xDF, 0xDF, "vpandn", X86andnp,
defm rr : AVX512_maskable_logic<opc, MRMSrcReg, _, (outs _.RC:$dst),		SchedWriteVecLogic, HasAVX512>;
(ins _.RC:$src1, _.RC:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",
(_.i64VT (OpNode (bitconvert (_.VT _.RC:$src1)),
(bitconvert (_.VT _.RC:$src2)))),
(_.VT (bitconvert (_.i64VT (OpNodeMsk _.RC:$src1,
_.RC:$src2)))),
IsCommutable>, AVX512BIBase, EVEX_4V,
Sched<[sched]>;

let hasSideEffects = 0, mayLoad = 1 in
defm rm : AVX512_maskable_logic<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",
(_.i64VT (OpNode (bitconvert (_.VT _.RC:$src1)),
(bitconvert (_.LdFrag addr:$src2)))),
(_.VT (bitconvert (_.i64VT (OpNodeMsk _.RC:$src1,
(bitconvert (_.LdFrag addr:$src2))))))>,
AVX512BIBase, EVEX_4V,
Sched<[sched.Folded, sched.ReadAfterFold]>;
}

// OpNodeMsk is the OpNode to use where element size is important. So use		let Predicates = [HasVLX] in {
// for all of the broadcast patterns.		def : Pat<(v16i8 (and VR128X:$src1, VR128X:$src2)),
multiclass avx512_logic_rmb<bits<8> opc, string OpcodeStr,		(VPANDQZ128rr VR128X:$src1, VR128X:$src2)>;
SDPatternOperator OpNode,		def : Pat<(v8i16 (and VR128X:$src1, VR128X:$src2)),
SDNode OpNodeMsk, X86FoldableSchedWrite sched, X86VectorVTInfo _,		(VPANDQZ128rr VR128X:$src1, VR128X:$src2)>;
bit IsCommutable = 0> :
avx512_logic_rm<opc, OpcodeStr, OpNode, OpNodeMsk, sched, _,		def : Pat<(v16i8 (or VR128X:$src1, VR128X:$src2)),
IsCommutable> {		(VPORQZ128rr VR128X:$src1, VR128X:$src2)>;
defm rmb : AVX512_maskable_logic<opc, MRMSrcMem, _, (outs _.RC:$dst),		def : Pat<(v8i16 (or VR128X:$src1, VR128X:$src2)),
(ins _.RC:$src1, _.ScalarMemOp:$src2), OpcodeStr,		(VPORQZ128rr VR128X:$src1, VR128X:$src2)>;
"${src2}"##_.BroadcastStr##", $src1",
"$src1, ${src2}"##_.BroadcastStr,		def : Pat<(v16i8 (xor VR128X:$src1, VR128X:$src2)),
(_.i64VT (OpNodeMsk _.RC:$src1,		(VPXORQZ128rr VR128X:$src1, VR128X:$src2)>;
(bitconvert		def : Pat<(v8i16 (xor VR128X:$src1, VR128X:$src2)),
(_.VT (X86VBroadcast		(VPXORQZ128rr VR128X:$src1, VR128X:$src2)>;
(_.ScalarLdFrag addr:$src2)))))),
(_.VT (bitconvert (_.i64VT (OpNodeMsk _.RC:$src1,		def : Pat<(v16i8 (X86andnp VR128X:$src1, VR128X:$src2)),
(bitconvert		(VPANDNQZ128rr VR128X:$src1, VR128X:$src2)>;
(_.VT (X86VBroadcast		def : Pat<(v8i16 (X86andnp VR128X:$src1, VR128X:$src2)),
(_.ScalarLdFrag addr:$src2))))))))>,		(VPANDNQZ128rr VR128X:$src1, VR128X:$src2)>;
AVX512BIBase, EVEX_4V, EVEX_B,
Sched<[sched.Folded, sched.ReadAfterFold]>;		def : Pat<(and VR128X:$src1, (bc_v16i8 (loadv2i64 addr:$src2))),
}		(VPANDQZ128rm VR128X:$src1, addr:$src2)>;
		def : Pat<(and VR128X:$src1, (bc_v8i16 (loadv2i64 addr:$src2))),
multiclass avx512_logic_rmb_vl<bits<8> opc, string OpcodeStr,		(VPANDQZ128rm VR128X:$src1, addr:$src2)>;
SDPatternOperator OpNode,		def : Pat<(and VR128X:$src1, (bc_v4i32 (loadv4f32 addr:$src2))),
SDNode OpNodeMsk, X86SchedWriteWidths sched,		(VPANDQZ128rm VR128X:$src1, addr:$src2)>;
AVX512VLVectorVTInfo VTInfo,
bit IsCommutable = 0> {		def : Pat<(or VR128X:$src1, (bc_v16i8 (loadv2i64 addr:$src2))),
let Predicates = [HasAVX512] in		(VPORQZ128rm VR128X:$src1, addr:$src2)>;
defm Z : avx512_logic_rmb<opc, OpcodeStr, OpNode, OpNodeMsk, sched.ZMM,		def : Pat<(or VR128X:$src1, (bc_v8i16 (loadv2i64 addr:$src2))),
VTInfo.info512, IsCommutable>, EVEX_V512;		(VPORQZ128rm VR128X:$src1, addr:$src2)>;
		def : Pat<(or VR128X:$src1, (bc_v4i32 (loadv4f32 addr:$src2))),
let Predicates = [HasAVX512, HasVLX] in {		(VPORQZ128rm VR128X:$src1, addr:$src2)>;
defm Z256 : avx512_logic_rmb<opc, OpcodeStr, OpNode, OpNodeMsk, sched.YMM,
VTInfo.info256, IsCommutable>, EVEX_V256;		def : Pat<(xor VR128X:$src1, (bc_v16i8 (loadv2i64 addr:$src2))),
defm Z128 : avx512_logic_rmb<opc, OpcodeStr, OpNode, OpNodeMsk, sched.XMM,		(VPXORQZ128rm VR128X:$src1, addr:$src2)>;
VTInfo.info128, IsCommutable>, EVEX_V128;		def : Pat<(xor VR128X:$src1, (bc_v8i16 (loadv2i64 addr:$src2))),
}		(VPXORQZ128rm VR128X:$src1, addr:$src2)>;
}		def : Pat<(xor VR128X:$src1, (bc_v4i32 (loadv4f32 addr:$src2))),
		(VPXORQZ128rm VR128X:$src1, addr:$src2)>;
multiclass avx512_logic_rm_vl_dq<bits<8> opc_d, bits<8> opc_q, string OpcodeStr,
SDNode OpNode, X86SchedWriteWidths sched,		def : Pat<(X86andnp VR128X:$src1, (bc_v16i8 (loadv2i64 addr:$src2))),
bit IsCommutable = 0> {		(VPANDNQZ128rm VR128X:$src1, addr:$src2)>;
defm Q : avx512_logic_rmb_vl<opc_q, OpcodeStr#"q", OpNode, OpNode, sched,		def : Pat<(X86andnp VR128X:$src1, (bc_v8i16 (loadv2i64 addr:$src2))),
avx512vl_i64_info, IsCommutable>,		(VPANDNQZ128rm VR128X:$src1, addr:$src2)>;
VEX_W, EVEX_CD8<64, CD8VF>;		def : Pat<(X86andnp VR128X:$src1, (bc_v4i32 (loadv4f32 addr:$src2))),
defm D : avx512_logic_rmb_vl<opc_d, OpcodeStr#"d", null_frag, OpNode, sched,		(VPANDNQZ128rm VR128X:$src1, addr:$src2)>;
avx512vl_i32_info, IsCommutable>,
EVEX_CD8<32, CD8VF>;		def : Pat<(and VR128X:$src1,
		(bc_v4i32 (v4f32 (X86VBroadcast (loadf32 addr:$src2))))),
		(VPANDDZ128rmb VR128X:$src1, addr:$src2)>;
		def : Pat<(or VR128X:$src1,
		(bc_v4i32 (v4f32 (X86VBroadcast (loadf32 addr:$src2))))),
		(VPORDZ128rmb VR128X:$src1, addr:$src2)>;
		def : Pat<(xor VR128X:$src1,
		(bc_v4i32 (v4f32 (X86VBroadcast (loadf32 addr:$src2))))),
		(VPXORDZ128rmb VR128X:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR128X:$src1,
		(bc_v4i32 (v4f32 (X86VBroadcast (loadf32 addr:$src2))))),
		(VPANDNDZ128rmb VR128X:$src1, addr:$src2)>;

		def : Pat<(and VR128X:$src1,
		(bc_v2i64 (v2f64 (X86VBroadcast (loadf64 addr:$src2))))),
		(VPANDQZ128rmb VR128X:$src1, addr:$src2)>;
		def : Pat<(or VR128X:$src1,
		(bc_v2i64 (v2f64 (X86VBroadcast (loadf64 addr:$src2))))),
		(VPORQZ128rmb VR128X:$src1, addr:$src2)>;
		def : Pat<(xor VR128X:$src1,
		(bc_v2i64 (v2f64 (X86VBroadcast (loadf64 addr:$src2))))),
		(VPXORQZ128rmb VR128X:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR128X:$src1,
		(bc_v2i64 (v2f64 (X86VBroadcast (loadf64 addr:$src2))))),
		(VPANDNQZ128rmb VR128X:$src1, addr:$src2)>;

		def : Pat<(v32i8 (and VR256X:$src1, VR256X:$src2)),
		(VPANDQZ256rr VR256X:$src1, VR256X:$src2)>;
		def : Pat<(v16i16 (and VR256X:$src1, VR256X:$src2)),
		(VPANDQZ256rr VR256X:$src1, VR256X:$src2)>;

		def : Pat<(v32i8 (or VR256X:$src1, VR256X:$src2)),
		(VPORQZ256rr VR256X:$src1, VR256X:$src2)>;
		def : Pat<(v16i16 (or VR256X:$src1, VR256X:$src2)),
		(VPORQZ256rr VR256X:$src1, VR256X:$src2)>;

		def : Pat<(v32i8 (xor VR256X:$src1, VR256X:$src2)),
		(VPXORQZ256rr VR256X:$src1, VR256X:$src2)>;
		def : Pat<(v16i16 (xor VR256X:$src1, VR256X:$src2)),
		(VPXORQZ256rr VR256X:$src1, VR256X:$src2)>;

		def : Pat<(v32i8 (X86andnp VR256X:$src1, VR256X:$src2)),
		(VPANDNQZ256rr VR256X:$src1, VR256X:$src2)>;
		def : Pat<(v16i16 (X86andnp VR256X:$src1, VR256X:$src2)),
		(VPANDNQZ256rr VR256X:$src1, VR256X:$src2)>;

		def : Pat<(and VR256X:$src1, (bc_v32i8 (loadv4i64 addr:$src2))),
		(VPANDQZ256rm VR256X:$src1, addr:$src2)>;
		def : Pat<(and VR256X:$src1, (bc_v16i16 (loadv4i64 addr:$src2))),
		(VPANDQZ256rm VR256X:$src1, addr:$src2)>;
		def : Pat<(and VR256X:$src1, (bc_v8i32 (loadv8f32 addr:$src2))),
		(VPANDQZ256rm VR256X:$src1, addr:$src2)>;

		def : Pat<(or VR256X:$src1, (bc_v32i8 (loadv4i64 addr:$src2))),
		(VPORQZ256rm VR256X:$src1, addr:$src2)>;
		def : Pat<(or VR256X:$src1, (bc_v16i16 (loadv4i64 addr:$src2))),
		(VPORQZ256rm VR256X:$src1, addr:$src2)>;
		def : Pat<(or VR256X:$src1, (bc_v8i32 (loadv8f32 addr:$src2))),
		(VPORQZ256rm VR256X:$src1, addr:$src2)>;

		def : Pat<(xor VR256X:$src1, (bc_v32i8 (loadv4i64 addr:$src2))),
		(VPXORQZ256rm VR256X:$src1, addr:$src2)>;
		def : Pat<(xor VR256X:$src1, (bc_v16i16 (loadv4i64 addr:$src2))),
		(VPXORQZ256rm VR256X:$src1, addr:$src2)>;
		def : Pat<(xor VR256X:$src1, (bc_v8i32 (loadv8f32 addr:$src2))),
		(VPXORQZ256rm VR256X:$src1, addr:$src2)>;

		def : Pat<(X86andnp VR256X:$src1, (bc_v32i8 (loadv4i64 addr:$src2))),
		(VPANDNQZ256rm VR256X:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR256X:$src1, (bc_v16i16 (loadv4i64 addr:$src2))),
		(VPANDNQZ256rm VR256X:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR256X:$src1, (bc_v8i32 (loadv8f32 addr:$src2))),
		(VPANDNQZ256rm VR256X:$src1, addr:$src2)>;

		def : Pat<(and VR256X:$src1,
		(bc_v8i32 (v8f32 (X86VBroadcast (loadf32 addr:$src2))))),
		(VPANDDZ256rmb VR256X:$src1, addr:$src2)>;
		def : Pat<(or VR256X:$src1,
		(bc_v8i32 (v8f32 (X86VBroadcast (loadf32 addr:$src2))))),
		(VPORDZ256rmb VR256X:$src1, addr:$src2)>;
		def : Pat<(xor VR256X:$src1,
		(bc_v8i32 (v8f32 (X86VBroadcast (loadf32 addr:$src2))))),
		(VPXORDZ256rmb VR256X:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR256X:$src1,
		(bc_v8i32 (v8f32 (X86VBroadcast (loadf32 addr:$src2))))),
		(VPANDNDZ256rmb VR256X:$src1, addr:$src2)>;

		def : Pat<(and VR256X:$src1,
		(bc_v4i64 (v4f64 (X86VBroadcast (loadf64 addr:$src2))))),
		(VPANDQZ256rmb VR256X:$src1, addr:$src2)>;
		def : Pat<(or VR256X:$src1,
		(bc_v4i64 (v4f64 (X86VBroadcast (loadf64 addr:$src2))))),
		(VPORQZ256rmb VR256X:$src1, addr:$src2)>;
		def : Pat<(xor VR256X:$src1,
		(bc_v4i64 (v4f64 (X86VBroadcast (loadf64 addr:$src2))))),
		(VPXORQZ256rmb VR256X:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR256X:$src1,
		(bc_v4i64 (v4f64 (X86VBroadcast (loadf64 addr:$src2))))),
		(VPANDNQZ256rmb VR256X:$src1, addr:$src2)>;
		}

		let Predicates = [HasAVX512] in {
		def : Pat<(v64i8 (and VR512:$src1, VR512:$src2)),
		(VPANDQZrr VR512:$src1, VR512:$src2)>;
		def : Pat<(v32i16 (and VR512:$src1, VR512:$src2)),
		(VPANDQZrr VR512:$src1, VR512:$src2)>;

		def : Pat<(v64i8 (or VR512:$src1, VR512:$src2)),
		(VPORQZrr VR512:$src1, VR512:$src2)>;
		def : Pat<(v32i16 (or VR512:$src1, VR512:$src2)),
		(VPORQZrr VR512:$src1, VR512:$src2)>;

		def : Pat<(v64i8 (xor VR512:$src1, VR512:$src2)),
		(VPXORQZrr VR512:$src1, VR512:$src2)>;
		def : Pat<(v32i16 (xor VR512:$src1, VR512:$src2)),
		(VPXORQZrr VR512:$src1, VR512:$src2)>;

		def : Pat<(v64i8 (X86andnp VR512:$src1, VR512:$src2)),
		(VPANDNQZrr VR512:$src1, VR512:$src2)>;
		def : Pat<(v32i16 (X86andnp VR512:$src1, VR512:$src2)),
		(VPANDNQZrr VR512:$src1, VR512:$src2)>;

		def : Pat<(and VR512:$src1, (bc_v64i8 (loadv8i64 addr:$src2))),
		(VPANDQZrm VR512:$src1, addr:$src2)>;
		def : Pat<(and VR512:$src1, (bc_v32i16 (loadv8i64 addr:$src2))),
		(VPANDQZrm VR512:$src1, addr:$src2)>;
		def : Pat<(and VR512:$src1, (bc_v16i32 (loadv16f32 addr:$src2))),
		(VPANDQZrm VR512:$src1, addr:$src2)>;

		def : Pat<(or VR512:$src1, (bc_v64i8 (loadv8i64 addr:$src2))),
		(VPORQZrm VR512:$src1, addr:$src2)>;
		def : Pat<(or VR512:$src1, (bc_v32i16 (loadv8i64 addr:$src2))),
		(VPORQZrm VR512:$src1, addr:$src2)>;
		def : Pat<(or VR512:$src1, (bc_v16i32 (loadv16f32 addr:$src2))),
		(VPORQZrm VR512:$src1, addr:$src2)>;

		def : Pat<(xor VR512:$src1, (bc_v64i8 (loadv8i64 addr:$src2))),
		(VPXORQZrm VR512:$src1, addr:$src2)>;
		def : Pat<(xor VR512:$src1, (bc_v32i16 (loadv8i64 addr:$src2))),
		(VPXORQZrm VR512:$src1, addr:$src2)>;
		def : Pat<(xor VR512:$src1, (bc_v16i32 (loadv16f32 addr:$src2))),
		(VPXORQZrm VR512:$src1, addr:$src2)>;

		def : Pat<(X86andnp VR512:$src1, (bc_v64i8 (loadv8i64 addr:$src2))),
		(VPANDNQZrm VR512:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR512:$src1, (bc_v32i16 (loadv8i64 addr:$src2))),
		(VPANDNQZrm VR512:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR512:$src1, (bc_v16i32 (loadv16f32 addr:$src2))),
		(VPANDNQZrm VR512:$src1, addr:$src2)>;

		def : Pat<(and VR512:$src1,
		(bc_v16i32 (v16f32 (X86VBroadcast (loadf32 addr:$src2))))),
		(VPANDDZrmb VR512:$src1, addr:$src2)>;
		def : Pat<(or VR512:$src1,
		(bc_v16i32 (v16f32 (X86VBroadcast (loadf32 addr:$src2))))),
		(VPORDZrmb VR512:$src1, addr:$src2)>;
		def : Pat<(xor VR512:$src1,
		(bc_v16i32 (v16f32 (X86VBroadcast (loadf32 addr:$src2))))),
		(VPXORDZrmb VR512:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR512:$src1,
		(bc_v16i32 (v16f32 (X86VBroadcast (loadf32 addr:$src2))))),
		(VPANDNDZrmb VR512:$src1, addr:$src2)>;

		def : Pat<(and VR512:$src1,
		(bc_v8i64 (v8f64 (X86VBroadcast (loadf64 addr:$src2))))),
		(VPANDQZrmb VR512:$src1, addr:$src2)>;
		def : Pat<(or VR512:$src1,
		(bc_v8i64 (v8f64 (X86VBroadcast (loadf64 addr:$src2))))),
		(VPORQZrmb VR512:$src1, addr:$src2)>;
		def : Pat<(xor VR512:$src1,
		(bc_v8i64 (v8f64 (X86VBroadcast (loadf64 addr:$src2))))),
		(VPXORQZrmb VR512:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR512:$src1,
		(bc_v8i64 (v8f64 (X86VBroadcast (loadf64 addr:$src2))))),
		(VPANDNQZrmb VR512:$src1, addr:$src2)>;
}		}

defm VPAND : avx512_logic_rm_vl_dq<0xDB, 0xDB, "vpand", and,
SchedWriteVecLogic, 1>;
defm VPOR : avx512_logic_rm_vl_dq<0xEB, 0xEB, "vpor", or,
SchedWriteVecLogic, 1>;
defm VPXOR : avx512_logic_rm_vl_dq<0xEF, 0xEF, "vpxor", xor,
SchedWriteVecLogic, 1>;
defm VPANDN : avx512_logic_rm_vl_dq<0xDF, 0xDF, "vpandn", X86andnp,
SchedWriteVecLogic>;

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// AVX-512 FP arithmetic		// AVX-512 FP arithmetic
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

multiclass avx512_fp_scalar<bits<8> opc, string OpcodeStr,X86VectorVTInfo _,		multiclass avx512_fp_scalar<bits<8> opc, string OpcodeStr,X86VectorVTInfo _,
SDNode OpNode, SDNode VecNode,		SDNode OpNode, SDNode VecNode,
X86FoldableSchedWrite sched, bit IsCommutable> {		X86FoldableSchedWrite sched, bit IsCommutable> {
let ExeDomain = _.ExeDomain in {		let ExeDomain = _.ExeDomain in {
▲ Show 20 Lines • Show All 287 Lines • ▼ Show 20 Lines	defm VAND : avx512_fp_binop_p<0x54, "vand", null_frag, HasDQI,
SchedWriteFLogicSizes, 1>;		SchedWriteFLogicSizes, 1>;
defm VANDN : avx512_fp_binop_p<0x55, "vandn", null_frag, HasDQI,		defm VANDN : avx512_fp_binop_p<0x55, "vandn", null_frag, HasDQI,
SchedWriteFLogicSizes, 0>;		SchedWriteFLogicSizes, 0>;
defm VOR : avx512_fp_binop_p<0x56, "vor", null_frag, HasDQI,		defm VOR : avx512_fp_binop_p<0x56, "vor", null_frag, HasDQI,
SchedWriteFLogicSizes, 1>;		SchedWriteFLogicSizes, 1>;
defm VXOR : avx512_fp_binop_p<0x57, "vxor", null_frag, HasDQI,		defm VXOR : avx512_fp_binop_p<0x57, "vxor", null_frag, HasDQI,
SchedWriteFLogicSizes, 1>;		SchedWriteFLogicSizes, 1>;

// Patterns catch floating point selects with bitcasted integer logic ops.
multiclass avx512_fp_logical_lowering<string InstrStr, SDNode OpNode,
X86VectorVTInfo _, Predicate prd> {
let Predicates = [prd] in {
// Masked register-register logical operations.
def : Pat<(_.VT (vselect _.KRCWM:$mask,
(bitconvert (_.i64VT (OpNode _.RC:$src1, _.RC:$src2))),
_.RC:$src0)),
(!cast<Instruction>(InstrStr#rrk) _.RC:$src0, _.KRCWM:$mask,
_.RC:$src1, _.RC:$src2)>;
def : Pat<(_.VT (vselect _.KRCWM:$mask,
(bitconvert (_.i64VT (OpNode _.RC:$src1, _.RC:$src2))),
_.ImmAllZerosV)),
(!cast<Instruction>(InstrStr#rrkz) _.KRCWM:$mask, _.RC:$src1,
_.RC:$src2)>;
// Masked register-memory logical operations.
def : Pat<(_.VT (vselect _.KRCWM:$mask,
(bitconvert (_.i64VT (OpNode _.RC:$src1,
(load addr:$src2)))),
_.RC:$src0)),
(!cast<Instruction>(InstrStr#rmk) _.RC:$src0, _.KRCWM:$mask,
_.RC:$src1, addr:$src2)>;
def : Pat<(_.VT (vselect _.KRCWM:$mask,
(bitconvert (_.i64VT (OpNode _.RC:$src1, (load addr:$src2)))),
_.ImmAllZerosV)),
(!cast<Instruction>(InstrStr#rmkz) _.KRCWM:$mask, _.RC:$src1,
addr:$src2)>;
// Register-broadcast logical operations.
def : Pat<(_.i64VT (OpNode _.RC:$src1,
(bitconvert (_.VT (X86VBroadcast
(_.ScalarLdFrag addr:$src2)))))),
(!cast<Instruction>(InstrStr#rmb) _.RC:$src1, addr:$src2)>;
def : Pat<(_.VT (vselect _.KRCWM:$mask,
(bitconvert
(_.i64VT (OpNode _.RC:$src1,
(bitconvert (_.VT
(X86VBroadcast
(_.ScalarLdFrag addr:$src2))))))),
_.RC:$src0)),
(!cast<Instruction>(InstrStr#rmbk) _.RC:$src0, _.KRCWM:$mask,
_.RC:$src1, addr:$src2)>;
def : Pat<(_.VT (vselect _.KRCWM:$mask,
(bitconvert
(_.i64VT (OpNode _.RC:$src1,
(bitconvert (_.VT
(X86VBroadcast
(_.ScalarLdFrag addr:$src2))))))),
_.ImmAllZerosV)),
(!cast<Instruction>(InstrStr#rmbkz) _.KRCWM:$mask,
_.RC:$src1, addr:$src2)>;
}
}

multiclass avx512_fp_logical_lowering_sizes<string InstrStr, SDNode OpNode> {
defm : avx512_fp_logical_lowering<InstrStr#DZ128, OpNode, v4f32x_info, HasVLX>;
defm : avx512_fp_logical_lowering<InstrStr#QZ128, OpNode, v2f64x_info, HasVLX>;
defm : avx512_fp_logical_lowering<InstrStr#DZ256, OpNode, v8f32x_info, HasVLX>;
defm : avx512_fp_logical_lowering<InstrStr#QZ256, OpNode, v4f64x_info, HasVLX>;
defm : avx512_fp_logical_lowering<InstrStr#DZ, OpNode, v16f32_info, HasAVX512>;
defm : avx512_fp_logical_lowering<InstrStr#QZ, OpNode, v8f64_info, HasAVX512>;
}

defm : avx512_fp_logical_lowering_sizes<"VPAND", and>;
defm : avx512_fp_logical_lowering_sizes<"VPOR", or>;
defm : avx512_fp_logical_lowering_sizes<"VPXOR", xor>;
defm : avx512_fp_logical_lowering_sizes<"VPANDN", X86andnp>;

let Predicates = [HasVLX,HasDQI] in {		let Predicates = [HasVLX,HasDQI] in {
// Use packed logical operations for scalar ops.		// Use packed logical operations for scalar ops.
def : Pat<(f64 (X86fand FR64X:$src1, FR64X:$src2)),		def : Pat<(f64 (X86fand FR64X:$src1, FR64X:$src2)),
(COPY_TO_REGCLASS		(COPY_TO_REGCLASS
(v2f64 (VANDPDZ128rr (v2f64 (COPY_TO_REGCLASS FR64X:$src1, VR128X)),		(v2f64 (VANDPDZ128rr (v2f64 (COPY_TO_REGCLASS FR64X:$src1, VR128X)),
(v2f64 (COPY_TO_REGCLASS FR64X:$src2, VR128X)))),		(v2f64 (COPY_TO_REGCLASS FR64X:$src2, VR128X)))),
FR64X)>;		FR64X)>;
def : Pat<(f64 (X86for FR64X:$src1, FR64X:$src2)),		def : Pat<(f64 (X86for FR64X:$src1, FR64X:$src2)),
▲ Show 20 Lines • Show All 113 Lines • ▼ Show 20 Lines
multiclass avx512_vptest<bits<8> opc, string OpcodeStr, PatFrag OpNode,		multiclass avx512_vptest<bits<8> opc, string OpcodeStr, PatFrag OpNode,
X86FoldableSchedWrite sched, X86VectorVTInfo _,		X86FoldableSchedWrite sched, X86VectorVTInfo _,
string Name> {		string Name> {
let ExeDomain = _.ExeDomain in {		let ExeDomain = _.ExeDomain in {
let isCommutable = 1 in		let isCommutable = 1 in
defm rr : AVX512_maskable_cmp<opc, MRMSrcReg, _, (outs _.KRC:$dst),		defm rr : AVX512_maskable_cmp<opc, MRMSrcReg, _, (outs _.KRC:$dst),
(ins _.RC:$src1, _.RC:$src2), OpcodeStr,		(ins _.RC:$src1, _.RC:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(OpNode (bitconvert (_.i64VT (and _.RC:$src1, _.RC:$src2))),		(OpNode (and _.RC:$src1, _.RC:$src2), _.ImmAllZerosV)>,
_.ImmAllZerosV)>,
EVEX_4V, Sched<[sched]>;		EVEX_4V, Sched<[sched]>;
defm rm : AVX512_maskable_cmp<opc, MRMSrcMem, _, (outs _.KRC:$dst),		defm rm : AVX512_maskable_cmp<opc, MRMSrcMem, _, (outs _.KRC:$dst),
(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(OpNode (bitconvert		(OpNode (and _.RC:$src1,
(_.i64VT (and _.RC:$src1,		(bitconvert (_.LdFrag addr:$src2))),
(bitconvert (_.LdFrag addr:$src2))))),
_.ImmAllZerosV)>,		_.ImmAllZerosV)>,
EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,		EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

// Patterns for compare with 0 that just use the same source twice.		// Patterns for compare with 0 that just use the same source twice.
def : Pat<(_.KVT (OpNode _.RC:$src, _.ImmAllZerosV)),		def : Pat<(_.KVT (OpNode _.RC:$src, _.ImmAllZerosV)),
(_.KVT (!cast<Instruction>(Name # _.ZSuffix # "rr")		(_.KVT (!cast<Instruction>(Name # _.ZSuffix # "rr")
Show All 17 Lines	defm rmb : AVX512_maskable_cmp<opc, MRMSrcMem, _, (outs _.KRC:$dst),
_.ImmAllZerosV)>,		_.ImmAllZerosV)>,
EVEX_B, EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,		EVEX_B, EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

// Use 512bit version to implement 128/256 bit in case NoVLX.		// Use 512bit version to implement 128/256 bit in case NoVLX.
multiclass avx512_vptest_lowering<PatFrag OpNode, X86VectorVTInfo ExtendInfo,		multiclass avx512_vptest_lowering<PatFrag OpNode, X86VectorVTInfo ExtendInfo,
X86VectorVTInfo _, string Name> {		X86VectorVTInfo _, string Name> {
def : Pat<(_.KVT (OpNode (bitconvert (_.i64VT (and _.RC:$src1, _.RC:$src2))),		def : Pat<(_.KVT (OpNode (and _.RC:$src1, _.RC:$src2),
_.ImmAllZerosV)),		_.ImmAllZerosV)),
(_.KVT (COPY_TO_REGCLASS		(_.KVT (COPY_TO_REGCLASS
(!cast<Instruction>(Name # "Zrr")		(!cast<Instruction>(Name # "Zrr")
(INSERT_SUBREG (ExtendInfo.VT (IMPLICIT_DEF)),		(INSERT_SUBREG (ExtendInfo.VT (IMPLICIT_DEF)),
_.RC:$src1, _.SubRegIdx),		_.RC:$src1, _.SubRegIdx),
(INSERT_SUBREG (ExtendInfo.VT (IMPLICIT_DEF)),		(INSERT_SUBREG (ExtendInfo.VT (IMPLICIT_DEF)),
_.RC:$src2, _.SubRegIdx)),		_.RC:$src2, _.SubRegIdx)),
_.KRC))>;		_.KRC))>;

def : Pat<(_.KVT (and _.KRC:$mask,		def : Pat<(_.KVT (and _.KRC:$mask,
(OpNode (bitconvert (_.i64VT (and _.RC:$src1, _.RC:$src2))),		(OpNode (and _.RC:$src1, _.RC:$src2),
_.ImmAllZerosV))),		_.ImmAllZerosV))),
(COPY_TO_REGCLASS		(COPY_TO_REGCLASS
(!cast<Instruction>(Name # "Zrrk")		(!cast<Instruction>(Name # "Zrrk")
(COPY_TO_REGCLASS _.KRC:$mask, ExtendInfo.KRC),		(COPY_TO_REGCLASS _.KRC:$mask, ExtendInfo.KRC),
(INSERT_SUBREG (ExtendInfo.VT (IMPLICIT_DEF)),		(INSERT_SUBREG (ExtendInfo.VT (IMPLICIT_DEF)),
_.RC:$src1, _.SubRegIdx),		_.RC:$src1, _.SubRegIdx),
(INSERT_SUBREG (ExtendInfo.VT (IMPLICIT_DEF)),		(INSERT_SUBREG (ExtendInfo.VT (IMPLICIT_DEF)),
_.RC:$src2, _.SubRegIdx)),		_.RC:$src2, _.SubRegIdx)),
▲ Show 20 Lines • Show All 5,603 Lines • ▼ Show 20 Lines

// Patterns to implement vnot using vpternlog instead of creating all ones		// Patterns to implement vnot using vpternlog instead of creating all ones
// using pcmpeq or vpternlog and then xoring with that. The value 15 is chosen		// using pcmpeq or vpternlog and then xoring with that. The value 15 is chosen
// so that the result is only dependent on src0. But we use the same source		// so that the result is only dependent on src0. But we use the same source
// for all operands to prevent a false dependency.		// for all operands to prevent a false dependency.
// TODO: We should maybe have a more generalized algorithm for folding to		// TODO: We should maybe have a more generalized algorithm for folding to
// vpternlog.		// vpternlog.
let Predicates = [HasAVX512] in {		let Predicates = [HasAVX512] in {
def : Pat<(v8i64 (xor VR512:$src, (bc_v8i64 (v16i32 immAllOnesV)))),		def : Pat<(xor VR512:$src, (bc_v64i8 (v16i32 immAllOnesV))),
		(VPTERNLOGQZrri VR512:$src, VR512:$src, VR512:$src, (i8 15))>;
		def : Pat<(xor VR512:$src, (bc_v32i16 (v16i32 immAllOnesV))),
		(VPTERNLOGQZrri VR512:$src, VR512:$src, VR512:$src, (i8 15))>;
		def : Pat<(xor VR512:$src, (bc_v16i32 (v16i32 immAllOnesV))),
		(VPTERNLOGQZrri VR512:$src, VR512:$src, VR512:$src, (i8 15))>;
		def : Pat<(xor VR512:$src, (bc_v8i64 (v16i32 immAllOnesV))),
(VPTERNLOGQZrri VR512:$src, VR512:$src, VR512:$src, (i8 15))>;		(VPTERNLOGQZrri VR512:$src, VR512:$src, VR512:$src, (i8 15))>;
}		}

let Predicates = [HasAVX512, NoVLX] in {		let Predicates = [HasAVX512, NoVLX] in {
def : Pat<(v2i64 (xor VR128X:$src, (bc_v2i64 (v4i32 immAllOnesV)))),		def : Pat<(xor VR128X:$src, (bc_v16i8 (v4i32 immAllOnesV))),
		(EXTRACT_SUBREG
		(VPTERNLOGQZrri
		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR128X:$src, sub_xmm),
		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR128X:$src, sub_xmm),
		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR128X:$src, sub_xmm),
		(i8 15)), sub_xmm)>;
		def : Pat<(xor VR128X:$src, (bc_v8i16 (v4i32 immAllOnesV))),
(EXTRACT_SUBREG		(EXTRACT_SUBREG
(VPTERNLOGQZrri		(VPTERNLOGQZrri
(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR128X:$src, sub_xmm),		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR128X:$src, sub_xmm),
(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR128X:$src, sub_xmm),		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR128X:$src, sub_xmm),
(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR128X:$src, sub_xmm),		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR128X:$src, sub_xmm),
(i8 15)), sub_xmm)>;		(i8 15)), sub_xmm)>;
def : Pat<(v4i64 (xor VR256X:$src, (bc_v4i64 (v8i32 immAllOnesV)))),		def : Pat<(xor VR128X:$src, (bc_v4i32 (v4i32 immAllOnesV))),
		(EXTRACT_SUBREG
		(VPTERNLOGQZrri
		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR128X:$src, sub_xmm),
		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR128X:$src, sub_xmm),
		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR128X:$src, sub_xmm),
		(i8 15)), sub_xmm)>;
		def : Pat<(xor VR128X:$src, (bc_v2i64 (v4i32 immAllOnesV))),
		nhaehnleUnsubmitted Not Done Reply Inline Actions This and many other cases of duplication in the .td files seem amenable to using foreach. Something like: foreach bc_ty = [bc_v16i8, bc_v8i16, bc_v4i32, bc_v2i64]<PatFrag> in def : Pat<(xor VR128X:$src, (bc_ty (v4i32 immAllOnesV))), (EXTRACT_SUBREG (VPTERNLOGQZrri (INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR128X:$src, sub_xmm), (INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR128X:$src, sub_xmm), (INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR128X:$src, sub_xmm), (i8 15)), sub_xmm)>; nhaehnle: This and many other cases of duplication in the .td files seem amenable to using foreach.
		craig.topperAuthorUnsubmitted Not Done Reply Inline Actions I agree we need to reduce the repetitiveness. My immediate focus is on fixing the test regressions. Then I want to see if should do anything to do custom selection in X86ISelDAGToDAG.cpp to avoid growing the static isel table. craig.topper: I agree we need to reduce the repetitiveness. My immediate focus is on fixing the test…
		(EXTRACT_SUBREG
		(VPTERNLOGQZrri
		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR128X:$src, sub_xmm),
		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR128X:$src, sub_xmm),
		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR128X:$src, sub_xmm),
		(i8 15)), sub_xmm)>;

		def : Pat<(xor VR256X:$src, (bc_v32i8 (v8i32 immAllOnesV))),
		(EXTRACT_SUBREG
		(VPTERNLOGQZrri
		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR256X:$src, sub_ymm),
		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR256X:$src, sub_ymm),
		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR256X:$src, sub_ymm),
		(i8 15)), sub_ymm)>;
		def : Pat<(xor VR256X:$src, (bc_v16i16 (v8i32 immAllOnesV))),
		(EXTRACT_SUBREG
		(VPTERNLOGQZrri
		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR256X:$src, sub_ymm),
		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR256X:$src, sub_ymm),
		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR256X:$src, sub_ymm),
		(i8 15)), sub_ymm)>;
		def : Pat<(xor VR256X:$src, (bc_v8i32 (v8i32 immAllOnesV))),
		(EXTRACT_SUBREG
		(VPTERNLOGQZrri
		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR256X:$src, sub_ymm),
		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR256X:$src, sub_ymm),
		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR256X:$src, sub_ymm),
		(i8 15)), sub_ymm)>;
		def : Pat<(xor VR256X:$src, (bc_v4i64 (v8i32 immAllOnesV))),
(EXTRACT_SUBREG		(EXTRACT_SUBREG
(VPTERNLOGQZrri		(VPTERNLOGQZrri
(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR256X:$src, sub_ymm),		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR256X:$src, sub_ymm),
(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR256X:$src, sub_ymm),		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR256X:$src, sub_ymm),
(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR256X:$src, sub_ymm),		(INSERT_SUBREG (v8i64 (IMPLICIT_DEF)), VR256X:$src, sub_ymm),
(i8 15)), sub_ymm)>;		(i8 15)), sub_ymm)>;
}		}

let Predicates = [HasVLX] in {		let Predicates = [HasVLX] in {
def : Pat<(v2i64 (xor VR128X:$src, (bc_v2i64 (v4i32 immAllOnesV)))),		def : Pat<(xor VR128X:$src, (bc_v8i16 (v4i32 immAllOnesV))),
(VPTERNLOGQZ128rri VR128X:$src, VR128X:$src, VR128X:$src, (i8 15))>;		(VPTERNLOGQZ128rri VR128X:$src, VR128X:$src, VR128X:$src, (i8 15))>;
def : Pat<(v4i64 (xor VR256X:$src, (bc_v4i64 (v8i32 immAllOnesV)))),		def : Pat<(xor VR128X:$src, (bc_v8i16 (v4i32 immAllOnesV))),
		(VPTERNLOGQZ128rri VR128X:$src, VR128X:$src, VR128X:$src, (i8 15))>;
		def : Pat<(xor VR128X:$src, (bc_v4i32 (v4i32 immAllOnesV))),
		(VPTERNLOGQZ128rri VR128X:$src, VR128X:$src, VR128X:$src, (i8 15))>;
		def : Pat<(xor VR128X:$src, (bc_v2i64 (v4i32 immAllOnesV))),
		(VPTERNLOGQZ128rri VR128X:$src, VR128X:$src, VR128X:$src, (i8 15))>;

		def : Pat<(xor VR256X:$src, (bc_v32i8 (v8i32 immAllOnesV))),
		(VPTERNLOGQZ256rri VR256X:$src, VR256X:$src, VR256X:$src, (i8 15))>;
		def : Pat<(xor VR256X:$src, (bc_v16i16 (v8i32 immAllOnesV))),
		(VPTERNLOGQZ256rri VR256X:$src, VR256X:$src, VR256X:$src, (i8 15))>;
		def : Pat<(xor VR256X:$src, (bc_v8i32 (v8i32 immAllOnesV))),
		(VPTERNLOGQZ256rri VR256X:$src, VR256X:$src, VR256X:$src, (i8 15))>;
		def : Pat<(xor VR256X:$src, (bc_v4i64 (v8i32 immAllOnesV))),
(VPTERNLOGQZ256rri VR256X:$src, VR256X:$src, VR256X:$src, (i8 15))>;		(VPTERNLOGQZ256rri VR256X:$src, VR256X:$src, VR256X:$src, (i8 15))>;
}		}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// AVX-512 - FixupImm		// AVX-512 - FixupImm
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

multiclass avx512_fixupimm_packed<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_fixupimm_packed<bits<8> opc, string OpcodeStr, SDNode OpNode,
▲ Show 20 Lines • Show All 588 Lines • Show Last 20 Lines

lib/Target/X86/X86InstrFragmentsSIMD.td

	Show First 20 Lines • Show All 821 Lines • ▼ Show 20 Lines
	def bc_v16i16 : PatFrag<(ops node:$in), (v16i16 (bitconvert node:$in))>;			def bc_v16i16 : PatFrag<(ops node:$in), (v16i16 (bitconvert node:$in))>;
	def bc_v8i32 : PatFrag<(ops node:$in), (v8i32 (bitconvert node:$in))>;			def bc_v8i32 : PatFrag<(ops node:$in), (v8i32 (bitconvert node:$in))>;
	def bc_v4i64 : PatFrag<(ops node:$in), (v4i64 (bitconvert node:$in))>;			def bc_v4i64 : PatFrag<(ops node:$in), (v4i64 (bitconvert node:$in))>;
	def bc_v8f32 : PatFrag<(ops node:$in), (v8f32 (bitconvert node:$in))>;			def bc_v8f32 : PatFrag<(ops node:$in), (v8f32 (bitconvert node:$in))>;
	def bc_v4f64 : PatFrag<(ops node:$in), (v4f64 (bitconvert node:$in))>;			def bc_v4f64 : PatFrag<(ops node:$in), (v4f64 (bitconvert node:$in))>;

	// 512-bit bitconvert pattern fragments			// 512-bit bitconvert pattern fragments
	def bc_v64i8 : PatFrag<(ops node:$in), (v64i8 (bitconvert node:$in))>;			def bc_v64i8 : PatFrag<(ops node:$in), (v64i8 (bitconvert node:$in))>;
				def bc_v32i16 : PatFrag<(ops node:$in), (v32i16 (bitconvert node:$in))>;
	def bc_v16i32 : PatFrag<(ops node:$in), (v16i32 (bitconvert node:$in))>;			def bc_v16i32 : PatFrag<(ops node:$in), (v16i32 (bitconvert node:$in))>;
	def bc_v8i64 : PatFrag<(ops node:$in), (v8i64 (bitconvert node:$in))>;			def bc_v8i64 : PatFrag<(ops node:$in), (v8i64 (bitconvert node:$in))>;
	def bc_v8f64 : PatFrag<(ops node:$in), (v8f64 (bitconvert node:$in))>;			def bc_v8f64 : PatFrag<(ops node:$in), (v8f64 (bitconvert node:$in))>;
	def bc_v16f32 : PatFrag<(ops node:$in), (v16f32 (bitconvert node:$in))>;			def bc_v16f32 : PatFrag<(ops node:$in), (v16f32 (bitconvert node:$in))>;

	def vzmovl_v2i64 : PatFrag<(ops node:$src),			def vzmovl_v2i64 : PatFrag<(ops node:$src),
	(bitconvert (v2i64 (X86vzmovl			(bitconvert (v2i64 (X86vzmovl
	(v2i64 (scalar_to_vector (loadi64 node:$src))))))>;			(v2i64 (scalar_to_vector (loadi64 node:$src))))))>;
	▲ Show 20 Lines • Show All 237 Lines • Show Last 20 Lines

lib/Target/X86/X86InstrSSE.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 2,363 Lines • ▼ Show 20 Lines
}		}

defm AND : sse12_fp_packed_logical<0x54, "and", and, SchedWriteFLogic>;		defm AND : sse12_fp_packed_logical<0x54, "and", and, SchedWriteFLogic>;
defm OR : sse12_fp_packed_logical<0x56, "or", or, SchedWriteFLogic>;		defm OR : sse12_fp_packed_logical<0x56, "or", or, SchedWriteFLogic>;
defm XOR : sse12_fp_packed_logical<0x57, "xor", xor, SchedWriteFLogic>;		defm XOR : sse12_fp_packed_logical<0x57, "xor", xor, SchedWriteFLogic>;
let isCommutable = 0 in		let isCommutable = 0 in
defm ANDN : sse12_fp_packed_logical<0x55, "andn", X86andnp, SchedWriteFLogic>;		defm ANDN : sse12_fp_packed_logical<0x55, "andn", X86andnp, SchedWriteFLogic>;

		let Predicates = [HasAVX2, NoVLX] in {
		def : Pat<(v32i8 (and VR256:$src1, VR256:$src2)),
		(VPANDYrr VR256:$src1, VR256:$src2)>;
		def : Pat<(v16i16 (and VR256:$src1, VR256:$src2)),
		(VPANDYrr VR256:$src1, VR256:$src2)>;
		def : Pat<(v8i32 (and VR256:$src1, VR256:$src2)),
		(VPANDYrr VR256:$src1, VR256:$src2)>;

		def : Pat<(v32i8 (or VR256:$src1, VR256:$src2)),
		(VPORYrr VR256:$src1, VR256:$src2)>;
		def : Pat<(v16i16 (or VR256:$src1, VR256:$src2)),
		(VPORYrr VR256:$src1, VR256:$src2)>;
		def : Pat<(v8i32 (or VR256:$src1, VR256:$src2)),
		(VPORYrr VR256:$src1, VR256:$src2)>;

		def : Pat<(v32i8 (xor VR256:$src1, VR256:$src2)),
		(VPXORYrr VR256:$src1, VR256:$src2)>;
		def : Pat<(v16i16 (xor VR256:$src1, VR256:$src2)),
		(VPXORYrr VR256:$src1, VR256:$src2)>;
		def : Pat<(v8i32 (xor VR256:$src1, VR256:$src2)),
		(VPXORYrr VR256:$src1, VR256:$src2)>;

		def : Pat<(v32i8 (X86andnp VR256:$src1, VR256:$src2)),
		(VPANDNYrr VR256:$src1, VR256:$src2)>;
		def : Pat<(v16i16 (X86andnp VR256:$src1, VR256:$src2)),
		(VPANDNYrr VR256:$src1, VR256:$src2)>;
		def : Pat<(v8i32 (X86andnp VR256:$src1, VR256:$src2)),
		(VPANDNYrr VR256:$src1, VR256:$src2)>;

		def : Pat<(and VR256:$src1, (bc_v32i8 (loadv4i64 addr:$src2))),
		(VPANDYrm VR256:$src1, addr:$src2)>;
		def : Pat<(and VR256:$src1, (bc_v16i16 (loadv4i64 addr:$src2))),
		(VPANDYrm VR256:$src1, addr:$src2)>;
		def : Pat<(and VR256:$src1, (bc_v8i32 (loadv4i64 addr:$src2))),
		(VPANDYrm VR256:$src1, addr:$src2)>;
		def : Pat<(and VR256:$src1, (bc_v8i32 (loadv8f32 addr:$src2))),
		(VPANDYrm VR256:$src1, addr:$src2)>;

		def : Pat<(or VR256:$src1, (bc_v32i8 (loadv4i64 addr:$src2))),
		(VPORYrm VR256:$src1, addr:$src2)>;
		def : Pat<(or VR256:$src1, (bc_v16i16 (loadv4i64 addr:$src2))),
		(VPORYrm VR256:$src1, addr:$src2)>;
		def : Pat<(or VR256:$src1, (bc_v8i32 (loadv4i64 addr:$src2))),
		(VPORYrm VR256:$src1, addr:$src2)>;
		def : Pat<(or VR256:$src1, (bc_v8i32 (loadv8f32 addr:$src2))),
		(VPORYrm VR256:$src1, addr:$src2)>;

		def : Pat<(xor VR256:$src1, (bc_v32i8 (loadv4i64 addr:$src2))),
		(VPXORYrm VR256:$src1, addr:$src2)>;
		def : Pat<(xor VR256:$src1, (bc_v16i16 (loadv4i64 addr:$src2))),
		(VPXORYrm VR256:$src1, addr:$src2)>;
		def : Pat<(xor VR256:$src1, (bc_v8i32 (loadv4i64 addr:$src2))),
		(VPXORYrm VR256:$src1, addr:$src2)>;
		def : Pat<(xor VR256:$src1, (bc_v8i32 (loadv8f32 addr:$src2))),
		(VPXORYrm VR256:$src1, addr:$src2)>;

		def : Pat<(X86andnp VR256:$src1, (bc_v32i8 (loadv4i64 addr:$src2))),
		(VPANDNYrm VR256:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR256:$src1, (bc_v16i16 (loadv4i64 addr:$src2))),
		(VPANDNYrm VR256:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR256:$src1, (bc_v8i32 (loadv4i64 addr:$src2))),
		(VPANDNYrm VR256:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR256:$src1, (bc_v8i32 (loadv8f32 addr:$src2))),
		(VPANDNYrm VR256:$src1, addr:$src2)>;
		}

// If only AVX1 is supported, we need to handle integer operations with		// If only AVX1 is supported, we need to handle integer operations with
// floating point instructions since the integer versions aren't available.		// floating point instructions since the integer versions aren't available.
let Predicates = [HasAVX1Only] in {		let Predicates = [HasAVX1Only] in {
		def : Pat<(v32i8 (and VR256:$src1, VR256:$src2)),
		(VANDPSYrr VR256:$src1, VR256:$src2)>;
		def : Pat<(v16i16 (and VR256:$src1, VR256:$src2)),
		(VANDPSYrr VR256:$src1, VR256:$src2)>;
		def : Pat<(v8i32 (and VR256:$src1, VR256:$src2)),
		(VANDPSYrr VR256:$src1, VR256:$src2)>;
def : Pat<(v4i64 (and VR256:$src1, VR256:$src2)),		def : Pat<(v4i64 (and VR256:$src1, VR256:$src2)),
(VANDPSYrr VR256:$src1, VR256:$src2)>;		(VANDPSYrr VR256:$src1, VR256:$src2)>;

		def : Pat<(v32i8 (or VR256:$src1, VR256:$src2)),
		(VORPSYrr VR256:$src1, VR256:$src2)>;
		def : Pat<(v16i16 (or VR256:$src1, VR256:$src2)),
		(VORPSYrr VR256:$src1, VR256:$src2)>;
		def : Pat<(v8i32 (or VR256:$src1, VR256:$src2)),
		(VORPSYrr VR256:$src1, VR256:$src2)>;
def : Pat<(v4i64 (or VR256:$src1, VR256:$src2)),		def : Pat<(v4i64 (or VR256:$src1, VR256:$src2)),
(VORPSYrr VR256:$src1, VR256:$src2)>;		(VORPSYrr VR256:$src1, VR256:$src2)>;

		def : Pat<(v32i8 (xor VR256:$src1, VR256:$src2)),
		(VXORPSYrr VR256:$src1, VR256:$src2)>;
		def : Pat<(v16i16 (xor VR256:$src1, VR256:$src2)),
		(VXORPSYrr VR256:$src1, VR256:$src2)>;
		def : Pat<(v8i32 (xor VR256:$src1, VR256:$src2)),
		(VXORPSYrr VR256:$src1, VR256:$src2)>;
def : Pat<(v4i64 (xor VR256:$src1, VR256:$src2)),		def : Pat<(v4i64 (xor VR256:$src1, VR256:$src2)),
(VXORPSYrr VR256:$src1, VR256:$src2)>;		(VXORPSYrr VR256:$src1, VR256:$src2)>;

		def : Pat<(v32i8 (X86andnp VR256:$src1, VR256:$src2)),
		(VANDNPSYrr VR256:$src1, VR256:$src2)>;
		def : Pat<(v16i16 (X86andnp VR256:$src1, VR256:$src2)),
		(VANDNPSYrr VR256:$src1, VR256:$src2)>;
		def : Pat<(v8i32 (X86andnp VR256:$src1, VR256:$src2)),
		(VANDNPSYrr VR256:$src1, VR256:$src2)>;
def : Pat<(v4i64 (X86andnp VR256:$src1, VR256:$src2)),		def : Pat<(v4i64 (X86andnp VR256:$src1, VR256:$src2)),
(VANDNPSYrr VR256:$src1, VR256:$src2)>;		(VANDNPSYrr VR256:$src1, VR256:$src2)>;

		def : Pat<(and VR256:$src1, (bc_v32i8 (loadv4i64 addr:$src2))),
		(VANDPSYrm VR256:$src1, addr:$src2)>;
		def : Pat<(and VR256:$src1, (bc_v16i16 (loadv4i64 addr:$src2))),
		(VANDPSYrm VR256:$src1, addr:$src2)>;
		def : Pat<(and VR256:$src1, (bc_v8i32 (loadv4i64 addr:$src2))),
		(VANDPSYrm VR256:$src1, addr:$src2)>;
def : Pat<(and VR256:$src1, (loadv4i64 addr:$src2)),		def : Pat<(and VR256:$src1, (loadv4i64 addr:$src2)),
(VANDPSYrm VR256:$src1, addr:$src2)>;		(VANDPSYrm VR256:$src1, addr:$src2)>;
		def : Pat<(and VR256:$src1, (bc_v8i32 (loadv8f32 addr:$src2))),
		(VANDPSYrm VR256:$src1, addr:$src2)>;

		def : Pat<(or VR256:$src1, (bc_v32i8 (loadv4i64 addr:$src2))),
		(VORPSYrm VR256:$src1, addr:$src2)>;
		def : Pat<(or VR256:$src1, (bc_v16i16 (loadv4i64 addr:$src2))),
		(VORPSYrm VR256:$src1, addr:$src2)>;
		def : Pat<(or VR256:$src1, (bc_v8i32 (loadv4i64 addr:$src2))),
		(VORPSYrm VR256:$src1, addr:$src2)>;
def : Pat<(or VR256:$src1, (loadv4i64 addr:$src2)),		def : Pat<(or VR256:$src1, (loadv4i64 addr:$src2)),
(VORPSYrm VR256:$src1, addr:$src2)>;		(VORPSYrm VR256:$src1, addr:$src2)>;
		def : Pat<(or VR256:$src1, (bc_v8i32 (loadv8f32 addr:$src2))),
		(VORPSYrm VR256:$src1, addr:$src2)>;

		def : Pat<(xor VR256:$src1, (bc_v32i8 (loadv4i64 addr:$src2))),
		(VXORPSYrm VR256:$src1, addr:$src2)>;
		def : Pat<(xor VR256:$src1, (bc_v16i16 (loadv4i64 addr:$src2))),
		(VXORPSYrm VR256:$src1, addr:$src2)>;
		def : Pat<(xor VR256:$src1, (bc_v8i32 (loadv4i64 addr:$src2))),
		(VXORPSYrm VR256:$src1, addr:$src2)>;
def : Pat<(xor VR256:$src1, (loadv4i64 addr:$src2)),		def : Pat<(xor VR256:$src1, (loadv4i64 addr:$src2)),
(VXORPSYrm VR256:$src1, addr:$src2)>;		(VXORPSYrm VR256:$src1, addr:$src2)>;
		def : Pat<(xor VR256:$src1, (bc_v8i32 (loadv8f32 addr:$src2))),
		(VXORPSYrm VR256:$src1, addr:$src2)>;

		def : Pat<(X86andnp VR256:$src1, (bc_v32i8 (loadv4i64 addr:$src2))),
		(VANDNPSYrm VR256:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR256:$src1, (bc_v16i16 (loadv4i64 addr:$src2))),
		(VANDNPSYrm VR256:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR256:$src1, (bc_v8i32 (loadv4i64 addr:$src2))),
		(VANDNPSYrm VR256:$src1, addr:$src2)>;
def : Pat<(X86andnp VR256:$src1, (loadv4i64 addr:$src2)),		def : Pat<(X86andnp VR256:$src1, (loadv4i64 addr:$src2)),
(VANDNPSYrm VR256:$src1, addr:$src2)>;		(VANDNPSYrm VR256:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR256:$src1, (bc_v8i32 (loadv8f32 addr:$src2))),
		(VANDNPSYrm VR256:$src1, addr:$src2)>;
}		}

let Predicates = [HasAVX, NoVLX_Or_NoDQI] in {		let Predicates = [HasAVX, NoVLX_Or_NoDQI] in {
// Use packed logical operations for scalar ops.		// Use packed logical operations for scalar ops.
def : Pat<(f64 (X86fand FR64:$src1, FR64:$src2)),		def : Pat<(f64 (X86fand FR64:$src1, FR64:$src2)),
(COPY_TO_REGCLASS		(COPY_TO_REGCLASS
(v2f64 (VANDPDrr (v2f64 (COPY_TO_REGCLASS FR64:$src1, VR128)),		(v2f64 (VANDPDrr (v2f64 (COPY_TO_REGCLASS FR64:$src1, VR128)),
(v2f64 (COPY_TO_REGCLASS FR64:$src2, VR128)))),		(v2f64 (COPY_TO_REGCLASS FR64:$src2, VR128)))),
▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines	def : Pat<(f64 (X86fxor FR64:$src1, FR64:$src2)),
FR64)>;		FR64)>;
def : Pat<(f64 (X86fandn FR64:$src1, FR64:$src2)),		def : Pat<(f64 (X86fandn FR64:$src1, FR64:$src2)),
(COPY_TO_REGCLASS		(COPY_TO_REGCLASS
(v2f64 (ANDNPDrr (v2f64 (COPY_TO_REGCLASS FR64:$src1, VR128)),		(v2f64 (ANDNPDrr (v2f64 (COPY_TO_REGCLASS FR64:$src1, VR128)),
(v2f64 (COPY_TO_REGCLASS FR64:$src2, VR128)))),		(v2f64 (COPY_TO_REGCLASS FR64:$src2, VR128)))),
FR64)>;		FR64)>;
}		}

		let Predicates = [HasAVX, NoVLX] in {
		def : Pat<(v16i8 (and VR128:$src1, VR128:$src2)),
		(VPANDrr VR128:$src1, VR128:$src2)>;
		def : Pat<(v8i16 (and VR128:$src1, VR128:$src2)),
		(VPANDrr VR128:$src1, VR128:$src2)>;
		def : Pat<(v4i32 (and VR128:$src1, VR128:$src2)),
		(VPANDrr VR128:$src1, VR128:$src2)>;

		def : Pat<(v16i8 (or VR128:$src1, VR128:$src2)),
		(VPORrr VR128:$src1, VR128:$src2)>;
		def : Pat<(v8i16 (or VR128:$src1, VR128:$src2)),
		(VPORrr VR128:$src1, VR128:$src2)>;
		def : Pat<(v4i32 (or VR128:$src1, VR128:$src2)),
		(VPORrr VR128:$src1, VR128:$src2)>;

		def : Pat<(v16i8 (xor VR128:$src1, VR128:$src2)),
		(VPXORrr VR128:$src1, VR128:$src2)>;
		def : Pat<(v8i16 (xor VR128:$src1, VR128:$src2)),
		(VPXORrr VR128:$src1, VR128:$src2)>;
		def : Pat<(v4i32 (xor VR128:$src1, VR128:$src2)),
		(VPXORrr VR128:$src1, VR128:$src2)>;

		def : Pat<(v16i8 (X86andnp VR128:$src1, VR128:$src2)),
		(VPANDNrr VR128:$src1, VR128:$src2)>;
		def : Pat<(v8i16 (X86andnp VR128:$src1, VR128:$src2)),
		(VPANDNrr VR128:$src1, VR128:$src2)>;
		def : Pat<(v4i32 (X86andnp VR128:$src1, VR128:$src2)),
		(VPANDNrr VR128:$src1, VR128:$src2)>;

		def : Pat<(and VR128:$src1, (bc_v16i8 (loadv2i64 addr:$src2))),
		(VPANDrm VR128:$src1, addr:$src2)>;
		def : Pat<(and VR128:$src1, (bc_v8i16 (loadv2i64 addr:$src2))),
		(VPANDrm VR128:$src1, addr:$src2)>;
		def : Pat<(and VR128:$src1, (bc_v4i32 (loadv2i64 addr:$src2))),
		(VPANDrm VR128:$src1, addr:$src2)>;
		def : Pat<(and VR128:$src1, (bc_v4i32 (loadv4f32 addr:$src2))),
		(VPANDrm VR128:$src1, addr:$src2)>;

		def : Pat<(or VR128:$src1, (bc_v16i8 (loadv2i64 addr:$src2))),
		(VPORrm VR128:$src1, addr:$src2)>;
		def : Pat<(or VR128:$src1, (bc_v8i16 (loadv2i64 addr:$src2))),
		(VPORrm VR128:$src1, addr:$src2)>;
		def : Pat<(or VR128:$src1, (bc_v4i32 (loadv2i64 addr:$src2))),
		(VPORrm VR128:$src1, addr:$src2)>;
		def : Pat<(or VR128:$src1, (bc_v4i32 (loadv4f32 addr:$src2))),
		(VPORrm VR128:$src1, addr:$src2)>;

		def : Pat<(xor VR128:$src1, (bc_v16i8 (loadv2i64 addr:$src2))),
		(VPXORrm VR128:$src1, addr:$src2)>;
		def : Pat<(xor VR128:$src1, (bc_v8i16 (loadv2i64 addr:$src2))),
		(VPXORrm VR128:$src1, addr:$src2)>;
		def : Pat<(xor VR128:$src1, (bc_v4i32 (loadv2i64 addr:$src2))),
		(VPXORrm VR128:$src1, addr:$src2)>;
		def : Pat<(xor VR128:$src1, (bc_v4i32 (loadv4f32 addr:$src2))),
		(VPXORrm VR128:$src1, addr:$src2)>;

		def : Pat<(X86andnp VR128:$src1, (bc_v16i8 (loadv2i64 addr:$src2))),
		(VPANDNrm VR128:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR128:$src1, (bc_v8i16 (loadv2i64 addr:$src2))),
		(VPANDNrm VR128:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR128:$src1, (bc_v4i32 (loadv2i64 addr:$src2))),
		(VPANDNrm VR128:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR128:$src1, (bc_v4i32 (loadv4f32 addr:$src2))),
		(VPANDNrm VR128:$src1, addr:$src2)>;
		}

		let Predicates = [UseSSE2] in {
		def : Pat<(v16i8 (and VR128:$src1, VR128:$src2)),
		(PANDrr VR128:$src1, VR128:$src2)>;
		def : Pat<(v8i16 (and VR128:$src1, VR128:$src2)),
		(PANDrr VR128:$src1, VR128:$src2)>;
		def : Pat<(v4i32 (and VR128:$src1, VR128:$src2)),
		(PANDrr VR128:$src1, VR128:$src2)>;

		def : Pat<(v16i8 (or VR128:$src1, VR128:$src2)),
		(PORrr VR128:$src1, VR128:$src2)>;
		def : Pat<(v8i16 (or VR128:$src1, VR128:$src2)),
		(PORrr VR128:$src1, VR128:$src2)>;
		def : Pat<(v4i32 (or VR128:$src1, VR128:$src2)),
		(PORrr VR128:$src1, VR128:$src2)>;

		def : Pat<(v16i8 (xor VR128:$src1, VR128:$src2)),
		(PXORrr VR128:$src1, VR128:$src2)>;
		def : Pat<(v8i16 (xor VR128:$src1, VR128:$src2)),
		(PXORrr VR128:$src1, VR128:$src2)>;
		def : Pat<(v4i32 (xor VR128:$src1, VR128:$src2)),
		(PXORrr VR128:$src1, VR128:$src2)>;

		def : Pat<(v16i8 (X86andnp VR128:$src1, VR128:$src2)),
		(PANDNrr VR128:$src1, VR128:$src2)>;
		def : Pat<(v8i16 (X86andnp VR128:$src1, VR128:$src2)),
		(PANDNrr VR128:$src1, VR128:$src2)>;
		def : Pat<(v4i32 (X86andnp VR128:$src1, VR128:$src2)),
		(PANDNrr VR128:$src1, VR128:$src2)>;

		def : Pat<(and VR128:$src1, (bc_v16i8 (memopv2i64 addr:$src2))),
		(PANDrm VR128:$src1, addr:$src2)>;
		def : Pat<(and VR128:$src1, (bc_v8i16 (memopv2i64 addr:$src2))),
		(PANDrm VR128:$src1, addr:$src2)>;
		def : Pat<(and VR128:$src1, (bc_v4i32 (memopv2i64 addr:$src2))),
		(PANDrm VR128:$src1, addr:$src2)>;
		def : Pat<(and VR128:$src1, (bc_v4i32 (memopv4f32 addr:$src2))),
		(PANDrm VR128:$src1, addr:$src2)>;

		def : Pat<(or VR128:$src1, (bc_v16i8 (memopv2i64 addr:$src2))),
		(PORrm VR128:$src1, addr:$src2)>;
		def : Pat<(or VR128:$src1, (bc_v8i16 (memopv2i64 addr:$src2))),
		(PORrm VR128:$src1, addr:$src2)>;
		def : Pat<(or VR128:$src1, (bc_v4i32 (memopv2i64 addr:$src2))),
		(PORrm VR128:$src1, addr:$src2)>;
		def : Pat<(or VR128:$src1, (bc_v4i32 (memopv4f32 addr:$src2))),
		(PORrm VR128:$src1, addr:$src2)>;

		def : Pat<(xor VR128:$src1, (bc_v16i8 (memopv2i64 addr:$src2))),
		(PXORrm VR128:$src1, addr:$src2)>;
		def : Pat<(xor VR128:$src1, (bc_v8i16 (memopv2i64 addr:$src2))),
		(PXORrm VR128:$src1, addr:$src2)>;
		def : Pat<(xor VR128:$src1, (bc_v4i32 (memopv2i64 addr:$src2))),
		(PXORrm VR128:$src1, addr:$src2)>;
		def : Pat<(xor VR128:$src1, (bc_v4i32 (memopv4f32 addr:$src2))),
		(PXORrm VR128:$src1, addr:$src2)>;

		def : Pat<(X86andnp VR128:$src1, (bc_v16i8 (memopv2i64 addr:$src2))),
		(PANDNrm VR128:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR128:$src1, (bc_v8i16 (memopv2i64 addr:$src2))),
		(PANDNrm VR128:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR128:$src1, (bc_v4i32 (memopv2i64 addr:$src2))),
		(PANDNrm VR128:$src1, addr:$src2)>;
		def : Pat<(X86andnp VR128:$src1, (bc_v4i32 (memopv4f32 addr:$src2))),
		(PANDNrm VR128:$src1, addr:$src2)>;
		}

// Patterns for packed operations when we don't have integer type available.		// Patterns for packed operations when we don't have integer type available.
def : Pat<(v4f32 (X86fand VR128:$src1, VR128:$src2)),		def : Pat<(v4f32 (X86fand VR128:$src1, VR128:$src2)),
(ANDPSrr VR128:$src1, VR128:$src2)>;		(ANDPSrr VR128:$src1, VR128:$src2)>;
def : Pat<(v4f32 (X86for VR128:$src1, VR128:$src2)),		def : Pat<(v4f32 (X86for VR128:$src1, VR128:$src2)),
(ORPSrr VR128:$src1, VR128:$src2)>;		(ORPSrr VR128:$src1, VR128:$src2)>;
def : Pat<(v4f32 (X86fxor VR128:$src1, VR128:$src2)),		def : Pat<(v4f32 (X86fxor VR128:$src1, VR128:$src2)),
(XORPSrr VR128:$src1, VR128:$src2)>;		(XORPSrr VR128:$src1, VR128:$src2)>;
def : Pat<(v4f32 (X86fandn VR128:$src1, VR128:$src2)),		def : Pat<(v4f32 (X86fandn VR128:$src1, VR128:$src2)),
▲ Show 20 Lines • Show All 5,720 Lines • Show Last 20 Lines

lib/Target/X86/X86InstrXOP.td

Show First 20 Lines • Show All 344 Lines • ▼ Show 20 Lines	multiclass xop4op_int<bits<8> opc, string OpcodeStr, RegisterClass RC,
X86FoldableSchedWrite sched> {		X86FoldableSchedWrite sched> {
def rrr : IXOPi8Reg<opc, MRMSrcReg, (outs RC:$dst),		def rrr : IXOPi8Reg<opc, MRMSrcReg, (outs RC:$dst),
(ins RC:$src1, RC:$src2, RC:$src3),		(ins RC:$src1, RC:$src2, RC:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set RC:$dst, (VT (or (and RC:$src3, RC:$src1),		[(set RC:$dst, (VT (or (and RC:$src3, RC:$src1),
(X86andnp RC:$src3, RC:$src2))))]>, XOP_4V,		(X86andnp RC:$src3, RC:$src2))))]>, XOP_4V,
Sched<[sched]>;		Sched<[sched]>;
		// FIXME: This pattern can't match.
def rrm : IXOPi8Reg<opc, MRMSrcMemOp4, (outs RC:$dst),		def rrm : IXOPi8Reg<opc, MRMSrcMemOp4, (outs RC:$dst),
(ins RC:$src1, RC:$src2, x86memop:$src3),		(ins RC:$src1, RC:$src2, x86memop:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set RC:$dst, (VT (or (and (load addr:$src3), RC:$src1),		[(set RC:$dst, (VT (or (and (load addr:$src3), RC:$src1),
(X86andnp (load addr:$src3), RC:$src2))))]>,		(X86andnp (load addr:$src3), RC:$src2))))]>,
XOP_4V, VEX_W, Sched<[sched.Folded, sched.ReadAfterFold, sched.ReadAfterFold]>;		XOP_4V, VEX_W, Sched<[sched.Folded, sched.ReadAfterFold, sched.ReadAfterFold]>;
def rmr : IXOPi8Reg<opc, MRMSrcMem, (outs RC:$dst),		def rmr : IXOPi8Reg<opc, MRMSrcMem, (outs RC:$dst),
Show All 19 Lines

let ExeDomain = SSEPackedInt in {		let ExeDomain = SSEPackedInt in {
defm VPCMOV : xop4op_int<0xA2, "vpcmov", VR128, i128mem, v2i64,		defm VPCMOV : xop4op_int<0xA2, "vpcmov", VR128, i128mem, v2i64,
SchedWriteShuffle.XMM>;		SchedWriteShuffle.XMM>;
defm VPCMOVY : xop4op_int<0xA2, "vpcmov", VR256, i256mem, v4i64,		defm VPCMOVY : xop4op_int<0xA2, "vpcmov", VR256, i256mem, v4i64,
SchedWriteShuffle.YMM>, VEX_L;		SchedWriteShuffle.YMM>, VEX_L;
}		}

		let Predicates = [HasXOP] in {
		def : Pat<(v16i8 (or (and VR128:$src3, VR128:$src1),
		(X86andnp VR128:$src3, VR128:$src2))),
		(VPCMOVrrr VR128:$src1, VR128:$src2, VR128:$src3)>;
		def : Pat<(v8i16 (or (and VR128:$src3, VR128:$src1),
		(X86andnp VR128:$src3, VR128:$src2))),
		(VPCMOVrrr VR128:$src1, VR128:$src2, VR128:$src3)>;
		def : Pat<(v4i32 (or (and VR128:$src3, VR128:$src1),
		(X86andnp VR128:$src3, VR128:$src2))),
		(VPCMOVrrr VR128:$src1, VR128:$src2, VR128:$src3)>;

		def : Pat<(or (and VR128:$src3, VR128:$src1),
		(X86andnp VR128:$src3, (bc_v16i8 (loadv2i64 addr:$src2)))),
		(VPCMOVrmr VR128:$src1, addr:$src2, VR128:$src3)>;
		def : Pat<(or (and VR128:$src3, VR128:$src1),
		(X86andnp VR128:$src3, (bc_v8i16 (loadv2i64 addr:$src2)))),
		(VPCMOVrmr VR128:$src1, addr:$src2, VR128:$src3)>;
		def : Pat<(or (and VR128:$src3, VR128:$src1),
		(X86andnp VR128:$src3, (bc_v4i32 (loadv2i64 addr:$src2)))),
		(VPCMOVrmr VR128:$src1, addr:$src2, VR128:$src3)>;

		def : Pat<(v32i8 (or (and VR256:$src3, VR256:$src1),
		(X86andnp VR256:$src3, VR256:$src2))),
		(VPCMOVYrrr VR256:$src1, VR256:$src2, VR256:$src3)>;
		def : Pat<(v16i16 (or (and VR256:$src3, VR256:$src1),
		(X86andnp VR256:$src3, VR256:$src2))),
		(VPCMOVYrrr VR256:$src1, VR256:$src2, VR256:$src3)>;
		def : Pat<(v8i32 (or (and VR256:$src3, VR256:$src1),
		(X86andnp VR256:$src3, VR256:$src2))),
		(VPCMOVYrrr VR256:$src1, VR256:$src2, VR256:$src3)>;

		def : Pat<(or (and VR256:$src3, VR256:$src1),
		(X86andnp VR256:$src3, (bc_v32i8 (loadv4i64 addr:$src2)))),
		(VPCMOVYrmr VR256:$src1, addr:$src2, VR256:$src3)>;
		def : Pat<(or (and VR256:$src3, VR256:$src1),
		(X86andnp VR256:$src3, (bc_v16i16 (loadv4i64 addr:$src2)))),
		(VPCMOVYrmr VR256:$src1, addr:$src2, VR256:$src3)>;
		def : Pat<(or (and VR256:$src3, VR256:$src1),
		(X86andnp VR256:$src3, (bc_v8i32 (loadv4i64 addr:$src2)))),
		(VPCMOVYrmr VR256:$src1, addr:$src2, VR256:$src3)>;
		}

multiclass xop_vpermil2<bits<8> Opc, string OpcodeStr, RegisterClass RC,		multiclass xop_vpermil2<bits<8> Opc, string OpcodeStr, RegisterClass RC,
X86MemOperand intmemop, X86MemOperand fpmemop,		X86MemOperand intmemop, X86MemOperand fpmemop,
ValueType VT, PatFrag FPLdFrag, PatFrag IntLdFrag,		ValueType VT, PatFrag FPLdFrag, PatFrag IntLdFrag,
X86FoldableSchedWrite sched> {		X86FoldableSchedWrite sched> {
def rr : IXOP5<Opc, MRMSrcReg, (outs RC:$dst),		def rr : IXOP5<Opc, MRMSrcReg, (outs RC:$dst),
(ins RC:$src1, RC:$src2, RC:$src3, u8imm:$src4),		(ins RC:$src1, RC:$src2, RC:$src3, u8imm:$src4),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src4, $src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3, $src4}"),		"\t{$src4, $src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3, $src4}"),
▲ Show 20 Lines • Show All 51 Lines • Show Last 20 Lines

test/CodeGen/X86/avx-intrinsics-fast-isel.ll

Show First 20 Lines • Show All 79 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret{{[l\|q]}}
%res = and <4 x i64> %3, %2		%res = and <4 x i64> %3, %2
%bc = bitcast <4 x i64> %res to <4 x double>		%bc = bitcast <4 x i64> %res to <4 x double>
ret <4 x double> %bc		ret <4 x double> %bc
}		}

define <8 x float> @test_mm256_andnot_ps(<8 x float> %a0, <8 x float> %a1) nounwind {		define <8 x float> @test_mm256_andnot_ps(<8 x float> %a0, <8 x float> %a1) nounwind {
; CHECK-LABEL: test_mm256_andnot_ps:		; CHECK-LABEL: test_mm256_andnot_ps:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vandnps %ymm1, %ymm0, %ymm0		; CHECK-NEXT: vxorps %xmm2, %xmm2, %xmm2
		; CHECK-NEXT: vcmptrueps %ymm2, %ymm2, %ymm2
		; CHECK-NEXT: vxorps %ymm2, %ymm0, %ymm0
		; CHECK-NEXT: vandps %ymm1, %ymm0, %ymm0
; CHECK-NEXT: ret{{[l\|q]}}		; CHECK-NEXT: ret{{[l\|q]}}
%1 = bitcast <8 x float> %a0 to <8 x i32>		%1 = bitcast <8 x float> %a0 to <8 x i32>
%2 = bitcast <8 x float> %a1 to <8 x i32>		%2 = bitcast <8 x float> %a1 to <8 x i32>
%3 = xor <8 x i32> %1, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>		%3 = xor <8 x i32> %1, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>
%res = and <8 x i32> %3, %2		%res = and <8 x i32> %3, %2
%bc = bitcast <8 x i32> %res to <8 x float>		%bc = bitcast <8 x i32> %res to <8 x float>
ret <8 x float> %bc		ret <8 x float> %bc
}		}
▲ Show 20 Lines • Show All 3,007 Lines • Show Last 20 Lines

test/CodeGen/X86/avx-logic.ll

	Show First 20 Lines • Show All 345 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpandn %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpandn %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpandn %xmm1, %xmm3, %xmm1			; AVX1-NEXT: vpandn %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm3
	; AVX1-NEXT: vpaddd %xmm3, %xmm1, %xmm1			; AVX1-NEXT: vpaddd %xmm3, %xmm1, %xmm1
	; AVX1-NEXT: vpaddd %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpaddd %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; INT256-LABEL: andn_disguised_i8_elts:			; AVX2-LABEL: andn_disguised_i8_elts:
	; INT256: # %bb.0:			; AVX2: # %bb.0:
	; INT256-NEXT: vpaddd %ymm0, %ymm1, %ymm0			; AVX2-NEXT: vpaddd %ymm0, %ymm1, %ymm0
	; INT256-NEXT: vpandn {{.*}}(%rip), %ymm0, %ymm0			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; INT256-NEXT: vpaddd %ymm2, %ymm0, %ymm0			; AVX2-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; INT256-NEXT: retq			; AVX2-NEXT: vpand {{.*}}(%rip), %ymm0, %ymm0
				; AVX2-NEXT: vpaddd %ymm2, %ymm0, %ymm0
				; AVX2-NEXT: retq
				;
				; AVX512-LABEL: andn_disguised_i8_elts:
				; AVX512: # %bb.0:
				; AVX512-NEXT: vpaddd %ymm0, %ymm1, %ymm0
				; AVX512-NEXT: vpternlogq $15, %zmm0, %zmm0, %zmm0
				; AVX512-NEXT: vpand {{.*}}(%rip), %ymm0, %ymm0
				; AVX512-NEXT: vpaddd %ymm2, %ymm0, %ymm0
				; AVX512-NEXT: retq
	%add = add <8 x i32> %y, %x			%add = add <8 x i32> %y, %x
	%neg = and <8 x i32> %add, <i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255>			%neg = and <8 x i32> %add, <i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255>
	%and = xor <8 x i32> %neg, <i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255>			%and = xor <8 x i32> %neg, <i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255>
	%add1 = add <8 x i32> %and, %z			%add1 = add <8 x i32> %and, %z
	ret <8 x i32> %add1			ret <8 x i32> %add1
	}			}

	; Negative test - if we don't have a leading concat_vectors, the transform won't be profitable.			; Negative test - if we don't have a leading concat_vectors, the transform won't be profitable.
	Show All 28 Lines
	; AVX1-NEXT: vandnps {{.*}}(%rip), %ymm0, %ymm0			; AVX1-NEXT: vandnps {{.*}}(%rip), %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpaddd %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpaddd %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpaddd %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpaddd %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; INT256-LABEL: andn_constant_mask_operand_no_concat:			; AVX2-LABEL: andn_constant_mask_operand_no_concat:
	; INT256: # %bb.0:			; AVX2: # %bb.0:
	; INT256-NEXT: vpandn {{.*}}(%rip), %ymm0, %ymm0			; AVX2-NEXT: vpcmpeqd %ymm2, %ymm2, %ymm2
	; INT256-NEXT: vpaddd %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; INT256-NEXT: retq			; AVX2-NEXT: vpand {{.*}}(%rip), %ymm0, %ymm0
				; AVX2-NEXT: vpaddd %ymm1, %ymm0, %ymm0
				; AVX2-NEXT: retq
				;
				; AVX512-LABEL: andn_constant_mask_operand_no_concat:
				; AVX512: # %bb.0:
				; AVX512-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0
				; AVX512-NEXT: vpternlogq $15, %zmm0, %zmm0, %zmm0
				; AVX512-NEXT: vpand {{.*}}(%rip), %ymm0, %ymm0
				; AVX512-NEXT: vpaddd %ymm1, %ymm0, %ymm0
				; AVX512-NEXT: retq
	%xor = xor <8 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>			%xor = xor <8 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>
	%and = and <8 x i32> %xor, <i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255>			%and = and <8 x i32> %xor, <i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255>
	%r = add <8 x i32> %and, %y			%r = add <8 x i32> %and, %y
	ret <8 x i32> %r			ret <8 x i32> %r
	}			}

	; This is a close call, but we split the 'andn' to reduce the insert/extract.			; This is a close call, but we split the 'andn' to reduce the insert/extract.

	▲ Show 20 Lines • Show All 174 Lines • Show Last 20 Lines

test/CodeGen/X86/avx512-arith.ll

	Show First 20 Lines • Show All 595 Lines • ▼ Show 20 Lines
	; SKX-NEXT: retq			; SKX-NEXT: retq
	%b = or <8 x i64> %a, <i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2>			%b = or <8 x i64> %a, <i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2>
	ret <8 x i64> %b			ret <8 x i64> %b
	}			}

	define <16 x i32> @andd512fold(<16 x i32> %y, <16 x i32>* %x) {			define <16 x i32> @andd512fold(<16 x i32> %y, <16 x i32>* %x) {
	; AVX512F-LABEL: andd512fold:			; AVX512F-LABEL: andd512fold:
	; AVX512F: # %bb.0: # %entry			; AVX512F: # %bb.0: # %entry
	; AVX512F-NEXT: vpandq (%rdi), %zmm0, %zmm0			; AVX512F-NEXT: vpandd (%rdi), %zmm0, %zmm0
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: andd512fold:			; AVX512VL-LABEL: andd512fold:
	; AVX512VL: # %bb.0: # %entry			; AVX512VL: # %bb.0: # %entry
	; AVX512VL-NEXT: vpandq (%rdi), %zmm0, %zmm0			; AVX512VL-NEXT: vpandd (%rdi), %zmm0, %zmm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512BW-LABEL: andd512fold:			; AVX512BW-LABEL: andd512fold:
	; AVX512BW: # %bb.0: # %entry			; AVX512BW: # %bb.0: # %entry
	; AVX512BW-NEXT: vpandq (%rdi), %zmm0, %zmm0			; AVX512BW-NEXT: vpandd (%rdi), %zmm0, %zmm0
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512DQ-LABEL: andd512fold:			; AVX512DQ-LABEL: andd512fold:
	; AVX512DQ: # %bb.0: # %entry			; AVX512DQ: # %bb.0: # %entry
	; AVX512DQ-NEXT: vandps (%rdi), %zmm0, %zmm0			; AVX512DQ-NEXT: vandps (%rdi), %zmm0, %zmm0
	; AVX512DQ-NEXT: retq			; AVX512DQ-NEXT: retq
	;			;
	; SKX-LABEL: andd512fold:			; SKX-LABEL: andd512fold:
	▲ Show 20 Lines • Show All 439 Lines • Show Last 20 Lines

test/CodeGen/X86/avx512-intrinsics-fast-isel.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 355 Lines • ▼ Show 20 Lines	entry:
%1 = select <8 x i1> %0, <8 x i64> %shuffle, <8 x i64> zeroinitializer		%1 = select <8 x i1> %0, <8 x i64> %shuffle, <8 x i64> zeroinitializer
ret <8 x i64> %1		ret <8 x i64> %1
}		}


define zeroext i16 @test_mm512_testn_epi32_mask(<8 x i64> %__A, <8 x i64> %__B) {		define zeroext i16 @test_mm512_testn_epi32_mask(<8 x i64> %__A, <8 x i64> %__B) {
; CHECK-LABEL: test_mm512_testn_epi32_mask:		; CHECK-LABEL: test_mm512_testn_epi32_mask:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vptestnmd %zmm0, %zmm1, %k0		; CHECK-NEXT: vpandq %zmm0, %zmm1, %zmm0
		; CHECK-NEXT: vptestnmd %zmm0, %zmm0, %k0
; CHECK-NEXT: kmovw %k0, %eax		; CHECK-NEXT: kmovw %k0, %eax
; CHECK-NEXT: movzwl %ax, %eax		; CHECK-NEXT: movzwl %ax, %eax
; CHECK-NEXT: vzeroupper		; CHECK-NEXT: vzeroupper
; CHECK-NEXT: ret{{[l\|q]}}		; CHECK-NEXT: ret{{[l\|q]}}
entry:		entry:
%and1.i.i = and <8 x i64> %__B, %__A		%and1.i.i = and <8 x i64> %__B, %__A
%0 = bitcast <8 x i64> %and1.i.i to <16 x i32>		%0 = bitcast <8 x i64> %and1.i.i to <16 x i32>
%1 = icmp eq <16 x i32> %0, zeroinitializer		%1 = icmp eq <16 x i32> %0, zeroinitializer
%2 = bitcast <16 x i1> %1 to i16		%2 = bitcast <16 x i1> %1 to i16
ret i16 %2		ret i16 %2
}		}

define zeroext i16 @test_mm512_mask_testn_epi32_mask(i16 zeroext %__U, <8 x i64> %__A, <8 x i64> %__B) {		define zeroext i16 @test_mm512_mask_testn_epi32_mask(i16 zeroext %__U, <8 x i64> %__A, <8 x i64> %__B) {
; X86-LABEL: test_mm512_mask_testn_epi32_mask:		; X86-LABEL: test_mm512_mask_testn_epi32_mask:
; X86: # %bb.0: # %entry		; X86: # %bb.0: # %entry
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1
; X86-NEXT: vptestnmd %zmm0, %zmm1, %k0 {%k1}		; X86-NEXT: vpandq %zmm0, %zmm1, %zmm0
		; X86-NEXT: vptestnmd %zmm0, %zmm0, %k0 {%k1}
; X86-NEXT: kmovw %k0, %eax		; X86-NEXT: kmovw %k0, %eax
; X86-NEXT: movzwl %ax, %eax		; X86-NEXT: movzwl %ax, %eax
; X86-NEXT: vzeroupper		; X86-NEXT: vzeroupper
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: test_mm512_mask_testn_epi32_mask:		; X64-LABEL: test_mm512_mask_testn_epi32_mask:
; X64: # %bb.0: # %entry		; X64: # %bb.0: # %entry
		; X64-NEXT: vpandq %zmm0, %zmm1, %zmm0
; X64-NEXT: kmovw %edi, %k1		; X64-NEXT: kmovw %edi, %k1
; X64-NEXT: vptestnmd %zmm0, %zmm1, %k0 {%k1}		; X64-NEXT: vptestnmd %zmm0, %zmm0, %k0 {%k1}
; X64-NEXT: kmovw %k0, %eax		; X64-NEXT: kmovw %k0, %eax
; X64-NEXT: movzwl %ax, %eax		; X64-NEXT: movzwl %ax, %eax
; X64-NEXT: vzeroupper		; X64-NEXT: vzeroupper
; X64-NEXT: retq		; X64-NEXT: retq
entry:		entry:
%and1.i.i = and <8 x i64> %__B, %__A		%and1.i.i = and <8 x i64> %__B, %__A
%0 = bitcast <8 x i64> %and1.i.i to <16 x i32>		%0 = bitcast <8 x i64> %and1.i.i to <16 x i32>
%1 = icmp eq <16 x i32> %0, zeroinitializer		%1 = icmp eq <16 x i32> %0, zeroinitializer
▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines	entry:
%3 = bitcast <8 x i1> %2 to i8		%3 = bitcast <8 x i1> %2 to i8
ret i8 %3		ret i8 %3
}		}

define zeroext i16 @test_mm512_mask_test_epi32_mask(i16 zeroext %__U, <8 x i64> %__A, <8 x i64> %__B) {		define zeroext i16 @test_mm512_mask_test_epi32_mask(i16 zeroext %__U, <8 x i64> %__A, <8 x i64> %__B) {
; X86-LABEL: test_mm512_mask_test_epi32_mask:		; X86-LABEL: test_mm512_mask_test_epi32_mask:
; X86: # %bb.0: # %entry		; X86: # %bb.0: # %entry
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1
; X86-NEXT: vptestmd %zmm0, %zmm1, %k0 {%k1}		; X86-NEXT: vpandq %zmm0, %zmm1, %zmm0
		; X86-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
; X86-NEXT: kmovw %k0, %eax		; X86-NEXT: kmovw %k0, %eax
; X86-NEXT: movzwl %ax, %eax		; X86-NEXT: movzwl %ax, %eax
; X86-NEXT: vzeroupper		; X86-NEXT: vzeroupper
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: test_mm512_mask_test_epi32_mask:		; X64-LABEL: test_mm512_mask_test_epi32_mask:
; X64: # %bb.0: # %entry		; X64: # %bb.0: # %entry
		; X64-NEXT: vpandq %zmm0, %zmm1, %zmm0
; X64-NEXT: kmovw %edi, %k1		; X64-NEXT: kmovw %edi, %k1
; X64-NEXT: vptestmd %zmm0, %zmm1, %k0 {%k1}		; X64-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
; X64-NEXT: kmovw %k0, %eax		; X64-NEXT: kmovw %k0, %eax
; X64-NEXT: movzwl %ax, %eax		; X64-NEXT: movzwl %ax, %eax
; X64-NEXT: vzeroupper		; X64-NEXT: vzeroupper
; X64-NEXT: retq		; X64-NEXT: retq
entry:		entry:
%and1.i.i = and <8 x i64> %__B, %__A		%and1.i.i = and <8 x i64> %__B, %__A
%0 = bitcast <8 x i64> %and1.i.i to <16 x i32>		%0 = bitcast <8 x i64> %and1.i.i to <16 x i32>
%1 = icmp ne <16 x i32> %0, zeroinitializer		%1 = icmp ne <16 x i32> %0, zeroinitializer
▲ Show 20 Lines • Show All 3,139 Lines • ▼ Show 20 Lines	entry:
%2 = select <16 x i1> %1, <16 x float> %0, <16 x float> zeroinitializer		%2 = select <16 x i1> %1, <16 x float> %0, <16 x float> zeroinitializer
ret <16 x float> %2		ret <16 x float> %2
}		}

define <16 x float> @test_mm512_fnmsub_round_ps(<16 x float> %__A, <16 x float> %__B, <16 x float> %__C) {		define <16 x float> @test_mm512_fnmsub_round_ps(<16 x float> %__A, <16 x float> %__B, <16 x float> %__C) {
; CHECK-LABEL: test_mm512_fnmsub_round_ps:		; CHECK-LABEL: test_mm512_fnmsub_round_ps:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vpbroadcastd {{.*#+}} zmm3 = [-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0]		; CHECK-NEXT: vpbroadcastd {{.*#+}} zmm3 = [-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0]
; CHECK-NEXT: vpxorq %zmm3, %zmm0, %zmm4		; CHECK-NEXT: vpxord %zmm3, %zmm0, %zmm4
; CHECK-NEXT: vpxorq %zmm3, %zmm2, %zmm0		; CHECK-NEXT: vpxord %zmm3, %zmm2, %zmm0
; CHECK-NEXT: vfmadd231ps {rn-sae}, %zmm4, %zmm1, %zmm0		; CHECK-NEXT: vfmadd231ps {rn-sae}, %zmm4, %zmm1, %zmm0
; CHECK-NEXT: ret{{[l\|q]}}		; CHECK-NEXT: ret{{[l\|q]}}
entry:		entry:
%sub = fsub <16 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %__A		%sub = fsub <16 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %__A
%sub1 = fsub <16 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %__C		%sub1 = fsub <16 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %__C
%0 = tail call <16 x float> @llvm.x86.avx512.vfmadd.ps.512(<16 x float> %sub, <16 x float> %__B, <16 x float> %sub1, i32 8)		%0 = tail call <16 x float> @llvm.x86.avx512.vfmadd.ps.512(<16 x float> %sub, <16 x float> %__B, <16 x float> %sub1, i32 8)
ret <16 x float> %0		ret <16 x float> %0
}		}
▲ Show 20 Lines • Show All 205 Lines • ▼ Show 20 Lines	entry:
%2 = select <16 x i1> %1, <16 x float> %0, <16 x float> zeroinitializer		%2 = select <16 x i1> %1, <16 x float> %0, <16 x float> zeroinitializer
ret <16 x float> %2		ret <16 x float> %2
}		}

define <16 x float> @test_mm512_fnmsub_ps(<16 x float> %__A, <16 x float> %__B, <16 x float> %__C) {		define <16 x float> @test_mm512_fnmsub_ps(<16 x float> %__A, <16 x float> %__B, <16 x float> %__C) {
; CHECK-LABEL: test_mm512_fnmsub_ps:		; CHECK-LABEL: test_mm512_fnmsub_ps:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vpbroadcastd {{.*#+}} zmm3 = [-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0]		; CHECK-NEXT: vpbroadcastd {{.*#+}} zmm3 = [-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0,-0]
; CHECK-NEXT: vpxorq %zmm3, %zmm0, %zmm4		; CHECK-NEXT: vpxord %zmm3, %zmm0, %zmm4
; CHECK-NEXT: vpxorq %zmm3, %zmm2, %zmm0		; CHECK-NEXT: vpxord %zmm3, %zmm2, %zmm0
; CHECK-NEXT: vfmadd231ps {{.#+}} zmm0 = (zmm1 zmm4) + zmm0		; CHECK-NEXT: vfmadd231ps {{.#+}} zmm0 = (zmm1 zmm4) + zmm0
; CHECK-NEXT: ret{{[l\|q]}}		; CHECK-NEXT: ret{{[l\|q]}}
entry:		entry:
%sub.i = fsub <16 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %__A		%sub.i = fsub <16 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %__A
%sub1.i = fsub <16 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %__C		%sub1.i = fsub <16 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %__C
%0 = tail call <16 x float> @llvm.fma.v16f32(<16 x float> %sub.i, <16 x float> %__B, <16 x float> %sub1.i) #10		%0 = tail call <16 x float> @llvm.fma.v16f32(<16 x float> %sub.i, <16 x float> %__B, <16 x float> %sub1.i) #10
ret <16 x float> %0		ret <16 x float> %0
}		}
▲ Show 20 Lines • Show All 5,959 Lines • Show Last 20 Lines

test/CodeGen/X86/avx512-intrinsics-upgrade.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 1,652 Lines • ▼ Show 20 Lines
; X64-NEXT: retq ## encoding: [0xc3]		; X64-NEXT: retq ## encoding: [0xc3]
call void @llvm.x86.avx512.storent.ps.512(i8* %ptr, <16 x float> %data)		call void @llvm.x86.avx512.storent.ps.512(i8* %ptr, <16 x float> %data)
ret void		ret void
}		}

define <16 x i32> @test_xor_epi32(<16 x i32> %a, <16 x i32> %b) {		define <16 x i32> @test_xor_epi32(<16 x i32> %a, <16 x i32> %b) {
; CHECK-LABEL: test_xor_epi32:		; CHECK-LABEL: test_xor_epi32:
; CHECK: ## %bb.0:		; CHECK: ## %bb.0:
; CHECK-NEXT: vpxorq %zmm1, %zmm0, %zmm0 ## encoding: [0x62,0xf1,0xfd,0x48,0xef,0xc1]		; CHECK-NEXT: vpxord %zmm1, %zmm0, %zmm0 ## encoding: [0x62,0xf1,0x7d,0x48,0xef,0xc1]
; CHECK-NEXT: ret{{[l\|q]}} ## encoding: [0xc3]		; CHECK-NEXT: ret{{[l\|q]}} ## encoding: [0xc3]
%res = call <16 x i32> @llvm.x86.avx512.mask.pxor.d.512(<16 x i32> %a,<16 x i32> %b, <16 x i32>zeroinitializer, i16 -1)		%res = call <16 x i32> @llvm.x86.avx512.mask.pxor.d.512(<16 x i32> %a,<16 x i32> %b, <16 x i32>zeroinitializer, i16 -1)
ret < 16 x i32> %res		ret < 16 x i32> %res
}		}

define <16 x i32> @test_mask_xor_epi32(<16 x i32> %a,<16 x i32> %b, <16 x i32> %passThru, i16 %mask) {		define <16 x i32> @test_mask_xor_epi32(<16 x i32> %a,<16 x i32> %b, <16 x i32> %passThru, i16 %mask) {
; X86-LABEL: test_mask_xor_epi32:		; X86-LABEL: test_mask_xor_epi32:
; X86: ## %bb.0:		; X86: ## %bb.0:
Show All 12 Lines	; X64-NEXT: retq ## encoding: [0xc3]
ret < 16 x i32> %res		ret < 16 x i32> %res
}		}

declare <16 x i32> @llvm.x86.avx512.mask.pxor.d.512(<16 x i32>, <16 x i32>, <16 x i32>, i16)		declare <16 x i32> @llvm.x86.avx512.mask.pxor.d.512(<16 x i32>, <16 x i32>, <16 x i32>, i16)

define <16 x i32> @test_or_epi32(<16 x i32> %a, <16 x i32> %b) {		define <16 x i32> @test_or_epi32(<16 x i32> %a, <16 x i32> %b) {
; CHECK-LABEL: test_or_epi32:		; CHECK-LABEL: test_or_epi32:
; CHECK: ## %bb.0:		; CHECK: ## %bb.0:
; CHECK-NEXT: vporq %zmm1, %zmm0, %zmm0 ## encoding: [0x62,0xf1,0xfd,0x48,0xeb,0xc1]		; CHECK-NEXT: vpord %zmm1, %zmm0, %zmm0 ## encoding: [0x62,0xf1,0x7d,0x48,0xeb,0xc1]
; CHECK-NEXT: ret{{[l\|q]}} ## encoding: [0xc3]		; CHECK-NEXT: ret{{[l\|q]}} ## encoding: [0xc3]
%res = call <16 x i32> @llvm.x86.avx512.mask.por.d.512(<16 x i32> %a,<16 x i32> %b, <16 x i32>zeroinitializer, i16 -1)		%res = call <16 x i32> @llvm.x86.avx512.mask.por.d.512(<16 x i32> %a,<16 x i32> %b, <16 x i32>zeroinitializer, i16 -1)
ret < 16 x i32> %res		ret < 16 x i32> %res
}		}

define <16 x i32> @test_mask_or_epi32(<16 x i32> %a,<16 x i32> %b, <16 x i32> %passThru, i16 %mask) {		define <16 x i32> @test_mask_or_epi32(<16 x i32> %a,<16 x i32> %b, <16 x i32> %passThru, i16 %mask) {
; X86-LABEL: test_mask_or_epi32:		; X86-LABEL: test_mask_or_epi32:
; X86: ## %bb.0:		; X86: ## %bb.0:
Show All 12 Lines	; X64-NEXT: retq ## encoding: [0xc3]
ret < 16 x i32> %res		ret < 16 x i32> %res
}		}

declare <16 x i32> @llvm.x86.avx512.mask.por.d.512(<16 x i32>, <16 x i32>, <16 x i32>, i16)		declare <16 x i32> @llvm.x86.avx512.mask.por.d.512(<16 x i32>, <16 x i32>, <16 x i32>, i16)

define <16 x i32> @test_and_epi32(<16 x i32> %a, <16 x i32> %b) {		define <16 x i32> @test_and_epi32(<16 x i32> %a, <16 x i32> %b) {
; CHECK-LABEL: test_and_epi32:		; CHECK-LABEL: test_and_epi32:
; CHECK: ## %bb.0:		; CHECK: ## %bb.0:
; CHECK-NEXT: vpandq %zmm1, %zmm0, %zmm0 ## encoding: [0x62,0xf1,0xfd,0x48,0xdb,0xc1]		; CHECK-NEXT: vpandd %zmm1, %zmm0, %zmm0 ## encoding: [0x62,0xf1,0x7d,0x48,0xdb,0xc1]
; CHECK-NEXT: ret{{[l\|q]}} ## encoding: [0xc3]		; CHECK-NEXT: ret{{[l\|q]}} ## encoding: [0xc3]
%res = call <16 x i32> @llvm.x86.avx512.mask.pand.d.512(<16 x i32> %a,<16 x i32> %b, <16 x i32>zeroinitializer, i16 -1)		%res = call <16 x i32> @llvm.x86.avx512.mask.pand.d.512(<16 x i32> %a,<16 x i32> %b, <16 x i32>zeroinitializer, i16 -1)
ret < 16 x i32> %res		ret < 16 x i32> %res
}		}

define <16 x i32> @test_mask_and_epi32(<16 x i32> %a,<16 x i32> %b, <16 x i32> %passThru, i16 %mask) {		define <16 x i32> @test_mask_and_epi32(<16 x i32> %a,<16 x i32> %b, <16 x i32> %passThru, i16 %mask) {
; X86-LABEL: test_mask_and_epi32:		; X86-LABEL: test_mask_and_epi32:
; X86: ## %bb.0:		; X86: ## %bb.0:
▲ Show 20 Lines • Show All 7,704 Lines • Show Last 20 Lines

test/CodeGen/X86/avx512-logic.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc < %s -mtriple=x86_64-apple-darwin -mcpu=knl \| FileCheck %s --check-prefix=ALL --check-prefix=KNL		; RUN: llc < %s -mtriple=x86_64-apple-darwin -mcpu=knl \| FileCheck %s --check-prefix=ALL --check-prefix=KNL
; RUN: llc < %s -mtriple=x86_64-apple-darwin -mcpu=skx \| FileCheck %s --check-prefix=ALL --check-prefix=SKX		; RUN: llc < %s -mtriple=x86_64-apple-darwin -mcpu=skx \| FileCheck %s --check-prefix=ALL --check-prefix=SKX


define <16 x i32> @vpandd(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {		define <16 x i32> @vpandd(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {
; ALL-LABEL: vpandd:		; ALL-LABEL: vpandd:
; ALL: ## %bb.0: ## %entry		; ALL: ## %bb.0: ## %entry
; ALL-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0		; ALL-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0
; ALL-NEXT: vpandq %zmm1, %zmm0, %zmm0		; ALL-NEXT: vpandd %zmm1, %zmm0, %zmm0
; ALL-NEXT: retq		; ALL-NEXT: retq
entry:		entry:
; Force the execution domain with an add.		; Force the execution domain with an add.
%a2 = add <16 x i32> %a, <i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2,		%a2 = add <16 x i32> %a, <i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2,
i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2>		i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2>
%x = and <16 x i32> %a2, %b		%x = and <16 x i32> %a2, %b
ret <16 x i32> %x		ret <16 x i32> %x
}		}

define <16 x i32> @vpandnd(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {		define <16 x i32> @vpandnd(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {
; ALL-LABEL: vpandnd:		; ALL-LABEL: vpandnd:
; ALL: ## %bb.0: ## %entry		; ALL: ## %bb.0: ## %entry
; ALL-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0		; ALL-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0
; ALL-NEXT: vpandnq %zmm0, %zmm1, %zmm0		; ALL-NEXT: vpandnd %zmm0, %zmm1, %zmm0
; ALL-NEXT: retq		; ALL-NEXT: retq
entry:		entry:
; Force the execution domain with an add.		; Force the execution domain with an add.
%a2 = add <16 x i32> %a, <i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3,		%a2 = add <16 x i32> %a, <i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3,
i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3>		i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3>
%b2 = xor <16 x i32> %b, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1,		%b2 = xor <16 x i32> %b, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1,
i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>		i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>
%x = and <16 x i32> %a2, %b2		%x = and <16 x i32> %a2, %b2
ret <16 x i32> %x		ret <16 x i32> %x
}		}

define <16 x i32> @vpord(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {		define <16 x i32> @vpord(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {
; ALL-LABEL: vpord:		; ALL-LABEL: vpord:
; ALL: ## %bb.0: ## %entry		; ALL: ## %bb.0: ## %entry
; ALL-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0		; ALL-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0
; ALL-NEXT: vporq %zmm1, %zmm0, %zmm0		; ALL-NEXT: vpord %zmm1, %zmm0, %zmm0
; ALL-NEXT: retq		; ALL-NEXT: retq
entry:		entry:
; Force the execution domain with an add.		; Force the execution domain with an add.
%a2 = add <16 x i32> %a, <i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4,		%a2 = add <16 x i32> %a, <i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4,
i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>		i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>
%x = or <16 x i32> %a2, %b		%x = or <16 x i32> %a2, %b
ret <16 x i32> %x		ret <16 x i32> %x
}		}

define <16 x i32> @vpxord(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {		define <16 x i32> @vpxord(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {
; ALL-LABEL: vpxord:		; ALL-LABEL: vpxord:
; ALL: ## %bb.0: ## %entry		; ALL: ## %bb.0: ## %entry
; ALL-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0		; ALL-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0
; ALL-NEXT: vpxorq %zmm1, %zmm0, %zmm0		; ALL-NEXT: vpxord %zmm1, %zmm0, %zmm0
; ALL-NEXT: retq		; ALL-NEXT: retq
entry:		entry:
; Force the execution domain with an add.		; Force the execution domain with an add.
%a2 = add <16 x i32> %a, <i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5,		%a2 = add <16 x i32> %a, <i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5,
i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5>		i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5>
%x = xor <16 x i32> %a2, %b		%x = xor <16 x i32> %a2, %b
ret <16 x i32> %x		ret <16 x i32> %x
}		}
▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
; SKX-NEXT: retq		; SKX-NEXT: retq
%b = or <8 x i64> %a, <i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2>		%b = or <8 x i64> %a, <i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2>
ret <8 x i64> %b		ret <8 x i64> %b
}		}

define <16 x i32> @andd512fold(<16 x i32> %y, <16 x i32>* %x) {		define <16 x i32> @andd512fold(<16 x i32> %y, <16 x i32>* %x) {
; KNL-LABEL: andd512fold:		; KNL-LABEL: andd512fold:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
; KNL-NEXT: vpandq (%rdi), %zmm0, %zmm0		; KNL-NEXT: vpandd (%rdi), %zmm0, %zmm0
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: andd512fold:		; SKX-LABEL: andd512fold:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
; SKX-NEXT: vandps (%rdi), %zmm0, %zmm0		; SKX-NEXT: vandps (%rdi), %zmm0, %zmm0
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%a = load <16 x i32>, <16 x i32>* %x, align 4		%a = load <16 x i32>, <16 x i32>* %x, align 4
▲ Show 20 Lines • Show All 293 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq
%cast = bitcast <8 x i64> %select to <8 x double>		%cast = bitcast <8 x i64> %select to <8 x double>
%add = fadd <8 x double> %c, %cast		%add = fadd <8 x double> %c, %cast
ret <8 x double> %add		ret <8 x double> %add
}		}

define <8 x i64> @test_mm512_mask_and_epi32(<8 x i64> %__src, i16 zeroext %__k, <8 x i64> %__a, <8 x i64> %__b) {		define <8 x i64> @test_mm512_mask_and_epi32(<8 x i64> %__src, i16 zeroext %__k, <8 x i64> %__a, <8 x i64> %__b) {
; KNL-LABEL: test_mm512_mask_and_epi32:		; KNL-LABEL: test_mm512_mask_and_epi32:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vpandq %zmm2, %zmm1, %zmm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandd %zmm2, %zmm1, %zmm0 {%k1}		; KNL-NEXT: vmovdqa32 %zmm1, %zmm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm512_mask_and_epi32:		; SKX-LABEL: test_mm512_mask_and_epi32:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vpandq %zmm2, %zmm1, %zmm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandps %zmm2, %zmm1, %zmm0 {%k1}		; SKX-NEXT: vmovdqa32 %zmm1, %zmm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%and1.i.i = and <8 x i64> %__a, %__b		%and1.i.i = and <8 x i64> %__a, %__b
%0 = bitcast <8 x i64> %and1.i.i to <16 x i32>		%0 = bitcast <8 x i64> %and1.i.i to <16 x i32>
%1 = bitcast <8 x i64> %__src to <16 x i32>		%1 = bitcast <8 x i64> %__src to <16 x i32>
%2 = bitcast i16 %__k to <16 x i1>		%2 = bitcast i16 %__k to <16 x i1>
%3 = select <16 x i1> %2, <16 x i32> %0, <16 x i32> %1		%3 = select <16 x i1> %2, <16 x i32> %0, <16 x i32> %1
%4 = bitcast <16 x i32> %3 to <8 x i64>		%4 = bitcast <16 x i32> %3 to <8 x i64>
ret <8 x i64> %4		ret <8 x i64> %4
}		}

define <8 x i64> @test_mm512_mask_or_epi32(<8 x i64> %__src, i16 zeroext %__k, <8 x i64> %__a, <8 x i64> %__b) {		define <8 x i64> @test_mm512_mask_or_epi32(<8 x i64> %__src, i16 zeroext %__k, <8 x i64> %__a, <8 x i64> %__b) {
; KNL-LABEL: test_mm512_mask_or_epi32:		; KNL-LABEL: test_mm512_mask_or_epi32:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vporq %zmm2, %zmm1, %zmm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpord %zmm2, %zmm1, %zmm0 {%k1}		; KNL-NEXT: vmovdqa32 %zmm1, %zmm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm512_mask_or_epi32:		; SKX-LABEL: test_mm512_mask_or_epi32:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vporq %zmm2, %zmm1, %zmm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vorps %zmm2, %zmm1, %zmm0 {%k1}		; SKX-NEXT: vmovdqa32 %zmm1, %zmm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%or1.i.i = or <8 x i64> %__a, %__b		%or1.i.i = or <8 x i64> %__a, %__b
%0 = bitcast <8 x i64> %or1.i.i to <16 x i32>		%0 = bitcast <8 x i64> %or1.i.i to <16 x i32>
%1 = bitcast <8 x i64> %__src to <16 x i32>		%1 = bitcast <8 x i64> %__src to <16 x i32>
%2 = bitcast i16 %__k to <16 x i1>		%2 = bitcast i16 %__k to <16 x i1>
%3 = select <16 x i1> %2, <16 x i32> %0, <16 x i32> %1		%3 = select <16 x i1> %2, <16 x i32> %0, <16 x i32> %1
%4 = bitcast <16 x i32> %3 to <8 x i64>		%4 = bitcast <16 x i32> %3 to <8 x i64>
ret <8 x i64> %4		ret <8 x i64> %4
}		}

define <8 x i64> @test_mm512_mask_xor_epi32(<8 x i64> %__src, i16 zeroext %__k, <8 x i64> %__a, <8 x i64> %__b) {		define <8 x i64> @test_mm512_mask_xor_epi32(<8 x i64> %__src, i16 zeroext %__k, <8 x i64> %__a, <8 x i64> %__b) {
; KNL-LABEL: test_mm512_mask_xor_epi32:		; KNL-LABEL: test_mm512_mask_xor_epi32:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vpxorq %zmm2, %zmm1, %zmm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpxord %zmm2, %zmm1, %zmm0 {%k1}		; KNL-NEXT: vmovdqa32 %zmm1, %zmm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm512_mask_xor_epi32:		; SKX-LABEL: test_mm512_mask_xor_epi32:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vpxorq %zmm2, %zmm1, %zmm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vxorps %zmm2, %zmm1, %zmm0 {%k1}		; SKX-NEXT: vmovdqa32 %zmm1, %zmm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%xor1.i.i = xor <8 x i64> %__a, %__b		%xor1.i.i = xor <8 x i64> %__a, %__b
%0 = bitcast <8 x i64> %xor1.i.i to <16 x i32>		%0 = bitcast <8 x i64> %xor1.i.i to <16 x i32>
%1 = bitcast <8 x i64> %__src to <16 x i32>		%1 = bitcast <8 x i64> %__src to <16 x i32>
%2 = bitcast i16 %__k to <16 x i1>		%2 = bitcast i16 %__k to <16 x i1>
%3 = select <16 x i1> %2, <16 x i32> %0, <16 x i32> %1		%3 = select <16 x i1> %2, <16 x i32> %0, <16 x i32> %1
%4 = bitcast <16 x i32> %3 to <8 x i64>		%4 = bitcast <16 x i32> %3 to <8 x i64>
ret <8 x i64> %4		ret <8 x i64> %4
}		}

define <8 x double> @test_mm512_mask_xor_pd(<8 x double> %__W, i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {		define <8 x double> @test_mm512_mask_xor_pd(<8 x double> %__W, i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {
; KNL-LABEL: test_mm512_mask_xor_pd:		; KNL-LABEL: test_mm512_mask_xor_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vpxorq %zmm2, %zmm1, %zmm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpxorq %zmm2, %zmm1, %zmm0 {%k1}		; KNL-NEXT: vmovapd %zmm1, %zmm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm512_mask_xor_pd:		; SKX-LABEL: test_mm512_mask_xor_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vxorpd %zmm2, %zmm1, %zmm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vxorpd %zmm2, %zmm1, %zmm0 {%k1}		; SKX-NEXT: vmovapd %zmm1, %zmm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <8 x double> %__A to <8 x i64>		%0 = bitcast <8 x double> %__A to <8 x i64>
%1 = bitcast <8 x double> %__B to <8 x i64>		%1 = bitcast <8 x double> %__B to <8 x i64>
%xor.i.i = xor <8 x i64> %0, %1		%xor.i.i = xor <8 x i64> %0, %1
%2 = bitcast <8 x i64> %xor.i.i to <8 x double>		%2 = bitcast <8 x i64> %xor.i.i to <8 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> %__W		%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> %__W
ret <8 x double> %4		ret <8 x double> %4
}		}

define <8 x double> @test_mm512_maskz_xor_pd(i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {		define <8 x double> @test_mm512_maskz_xor_pd(i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {
; KNL-LABEL: test_mm512_maskz_xor_pd:		; KNL-LABEL: test_mm512_maskz_xor_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vpxorq %zmm1, %zmm0, %zmm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpxorq %zmm1, %zmm0, %zmm0 {%k1} {z}		; KNL-NEXT: vmovapd %zmm0, %zmm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm512_maskz_xor_pd:		; SKX-LABEL: test_mm512_maskz_xor_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vxorpd %zmm1, %zmm0, %zmm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vxorpd %zmm1, %zmm0, %zmm0 {%k1} {z}		; SKX-NEXT: vmovapd %zmm0, %zmm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <8 x double> %__A to <8 x i64>		%0 = bitcast <8 x double> %__A to <8 x i64>
%1 = bitcast <8 x double> %__B to <8 x i64>		%1 = bitcast <8 x double> %__B to <8 x i64>
%xor.i.i = xor <8 x i64> %0, %1		%xor.i.i = xor <8 x i64> %0, %1
%2 = bitcast <8 x i64> %xor.i.i to <8 x double>		%2 = bitcast <8 x i64> %xor.i.i to <8 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> zeroinitializer		%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> zeroinitializer
ret <8 x double> %4		ret <8 x double> %4
}		}

define <16 x float> @test_mm512_mask_xor_ps(<16 x float> %__W, i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {		define <16 x float> @test_mm512_mask_xor_ps(<16 x float> %__W, i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {
; KNL-LABEL: test_mm512_mask_xor_ps:		; KNL-LABEL: test_mm512_mask_xor_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vpxord %zmm2, %zmm1, %zmm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpxord %zmm2, %zmm1, %zmm0 {%k1}		; KNL-NEXT: vmovaps %zmm1, %zmm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm512_mask_xor_ps:		; SKX-LABEL: test_mm512_mask_xor_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vxorps %zmm2, %zmm1, %zmm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vxorps %zmm2, %zmm1, %zmm0 {%k1}		; SKX-NEXT: vmovaps %zmm1, %zmm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <16 x float> %__A to <16 x i32>		%0 = bitcast <16 x float> %__A to <16 x i32>
%1 = bitcast <16 x float> %__B to <16 x i32>		%1 = bitcast <16 x float> %__B to <16 x i32>
%xor.i.i = xor <16 x i32> %0, %1		%xor.i.i = xor <16 x i32> %0, %1
%2 = bitcast <16 x i32> %xor.i.i to <16 x float>		%2 = bitcast <16 x i32> %xor.i.i to <16 x float>
%3 = bitcast i16 %__U to <16 x i1>		%3 = bitcast i16 %__U to <16 x i1>
%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> %__W		%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> %__W
ret <16 x float> %4		ret <16 x float> %4
}		}

define <16 x float> @test_mm512_maskz_xor_ps(i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {		define <16 x float> @test_mm512_maskz_xor_ps(i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {
; KNL-LABEL: test_mm512_maskz_xor_ps:		; KNL-LABEL: test_mm512_maskz_xor_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vpxord %zmm1, %zmm0, %zmm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpxord %zmm1, %zmm0, %zmm0 {%k1} {z}		; KNL-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm512_maskz_xor_ps:		; SKX-LABEL: test_mm512_maskz_xor_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vxorps %zmm1, %zmm0, %zmm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vxorps %zmm1, %zmm0, %zmm0 {%k1} {z}		; SKX-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <16 x float> %__A to <16 x i32>		%0 = bitcast <16 x float> %__A to <16 x i32>
%1 = bitcast <16 x float> %__B to <16 x i32>		%1 = bitcast <16 x float> %__B to <16 x i32>
%xor.i.i = xor <16 x i32> %0, %1		%xor.i.i = xor <16 x i32> %0, %1
%2 = bitcast <16 x i32> %xor.i.i to <16 x float>		%2 = bitcast <16 x i32> %xor.i.i to <16 x float>
%3 = bitcast i16 %__U to <16 x i1>		%3 = bitcast i16 %__U to <16 x i1>
%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> zeroinitializer		%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> zeroinitializer
ret <16 x float> %4		ret <16 x float> %4
}		}

define <8 x double> @test_mm512_mask_or_pd(<8 x double> %__W, i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {		define <8 x double> @test_mm512_mask_or_pd(<8 x double> %__W, i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {
; KNL-LABEL: test_mm512_mask_or_pd:		; KNL-LABEL: test_mm512_mask_or_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vporq %zmm1, %zmm2, %zmm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vporq %zmm1, %zmm2, %zmm0 {%k1}		; KNL-NEXT: vmovapd %zmm1, %zmm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm512_mask_or_pd:		; SKX-LABEL: test_mm512_mask_or_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vorpd %zmm1, %zmm2, %zmm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vorpd %zmm1, %zmm2, %zmm0 {%k1}		; SKX-NEXT: vmovapd %zmm1, %zmm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <8 x double> %__A to <8 x i64>		%0 = bitcast <8 x double> %__A to <8 x i64>
%1 = bitcast <8 x double> %__B to <8 x i64>		%1 = bitcast <8 x double> %__B to <8 x i64>
%or.i.i = or <8 x i64> %1, %0		%or.i.i = or <8 x i64> %1, %0
%2 = bitcast <8 x i64> %or.i.i to <8 x double>		%2 = bitcast <8 x i64> %or.i.i to <8 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> %__W		%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> %__W
ret <8 x double> %4		ret <8 x double> %4
}		}

define <8 x double> @test_mm512_maskz_or_pd(i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {		define <8 x double> @test_mm512_maskz_or_pd(i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {
; KNL-LABEL: test_mm512_maskz_or_pd:		; KNL-LABEL: test_mm512_maskz_or_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vporq %zmm0, %zmm1, %zmm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vporq %zmm0, %zmm1, %zmm0 {%k1} {z}		; KNL-NEXT: vmovapd %zmm0, %zmm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm512_maskz_or_pd:		; SKX-LABEL: test_mm512_maskz_or_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vorpd %zmm0, %zmm1, %zmm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vorpd %zmm0, %zmm1, %zmm0 {%k1} {z}		; SKX-NEXT: vmovapd %zmm0, %zmm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <8 x double> %__A to <8 x i64>		%0 = bitcast <8 x double> %__A to <8 x i64>
%1 = bitcast <8 x double> %__B to <8 x i64>		%1 = bitcast <8 x double> %__B to <8 x i64>
%or.i.i = or <8 x i64> %1, %0		%or.i.i = or <8 x i64> %1, %0
%2 = bitcast <8 x i64> %or.i.i to <8 x double>		%2 = bitcast <8 x i64> %or.i.i to <8 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> zeroinitializer		%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> zeroinitializer
ret <8 x double> %4		ret <8 x double> %4
}		}

define <16 x float> @test_mm512_mask_or_ps(<16 x float> %__W, i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {		define <16 x float> @test_mm512_mask_or_ps(<16 x float> %__W, i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {
; KNL-LABEL: test_mm512_mask_or_ps:		; KNL-LABEL: test_mm512_mask_or_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vpord %zmm1, %zmm2, %zmm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpord %zmm1, %zmm2, %zmm0 {%k1}		; KNL-NEXT: vmovaps %zmm1, %zmm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm512_mask_or_ps:		; SKX-LABEL: test_mm512_mask_or_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vorps %zmm1, %zmm2, %zmm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vorps %zmm1, %zmm2, %zmm0 {%k1}		; SKX-NEXT: vmovaps %zmm1, %zmm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <16 x float> %__A to <16 x i32>		%0 = bitcast <16 x float> %__A to <16 x i32>
%1 = bitcast <16 x float> %__B to <16 x i32>		%1 = bitcast <16 x float> %__B to <16 x i32>
%or.i.i = or <16 x i32> %1, %0		%or.i.i = or <16 x i32> %1, %0
%2 = bitcast <16 x i32> %or.i.i to <16 x float>		%2 = bitcast <16 x i32> %or.i.i to <16 x float>
%3 = bitcast i16 %__U to <16 x i1>		%3 = bitcast i16 %__U to <16 x i1>
%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> %__W		%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> %__W
ret <16 x float> %4		ret <16 x float> %4
}		}

define <16 x float> @test_mm512_maskz_or_ps(i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {		define <16 x float> @test_mm512_maskz_or_ps(i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {
; KNL-LABEL: test_mm512_maskz_or_ps:		; KNL-LABEL: test_mm512_maskz_or_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vpord %zmm0, %zmm1, %zmm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpord %zmm0, %zmm1, %zmm0 {%k1} {z}		; KNL-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm512_maskz_or_ps:		; SKX-LABEL: test_mm512_maskz_or_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vorps %zmm0, %zmm1, %zmm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vorps %zmm0, %zmm1, %zmm0 {%k1} {z}		; SKX-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <16 x float> %__A to <16 x i32>		%0 = bitcast <16 x float> %__A to <16 x i32>
%1 = bitcast <16 x float> %__B to <16 x i32>		%1 = bitcast <16 x float> %__B to <16 x i32>
%or.i.i = or <16 x i32> %1, %0		%or.i.i = or <16 x i32> %1, %0
%2 = bitcast <16 x i32> %or.i.i to <16 x float>		%2 = bitcast <16 x i32> %or.i.i to <16 x float>
%3 = bitcast i16 %__U to <16 x i1>		%3 = bitcast i16 %__U to <16 x i1>
%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> zeroinitializer		%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> zeroinitializer
ret <16 x float> %4		ret <16 x float> %4
}		}

define <8 x double> @test_mm512_mask_and_pd(<8 x double> %__W, i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {		define <8 x double> @test_mm512_mask_and_pd(<8 x double> %__W, i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {
; KNL-LABEL: test_mm512_mask_and_pd:		; KNL-LABEL: test_mm512_mask_and_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vpandq %zmm1, %zmm2, %zmm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandq %zmm1, %zmm2, %zmm0 {%k1}		; KNL-NEXT: vmovapd %zmm1, %zmm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm512_mask_and_pd:		; SKX-LABEL: test_mm512_mask_and_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandpd %zmm1, %zmm2, %zmm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandpd %zmm1, %zmm2, %zmm0 {%k1}		; SKX-NEXT: vmovapd %zmm1, %zmm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <8 x double> %__A to <8 x i64>		%0 = bitcast <8 x double> %__A to <8 x i64>
%1 = bitcast <8 x double> %__B to <8 x i64>		%1 = bitcast <8 x double> %__B to <8 x i64>
%and.i.i = and <8 x i64> %1, %0		%and.i.i = and <8 x i64> %1, %0
%2 = bitcast <8 x i64> %and.i.i to <8 x double>		%2 = bitcast <8 x i64> %and.i.i to <8 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> %__W		%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> %__W
ret <8 x double> %4		ret <8 x double> %4
}		}

define <8 x double> @test_mm512_maskz_and_pd(i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {		define <8 x double> @test_mm512_maskz_and_pd(i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {
; KNL-LABEL: test_mm512_maskz_and_pd:		; KNL-LABEL: test_mm512_maskz_and_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vpandq %zmm0, %zmm1, %zmm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandq %zmm0, %zmm1, %zmm0 {%k1} {z}		; KNL-NEXT: vmovapd %zmm0, %zmm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm512_maskz_and_pd:		; SKX-LABEL: test_mm512_maskz_and_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandpd %zmm0, %zmm1, %zmm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandpd %zmm0, %zmm1, %zmm0 {%k1} {z}		; SKX-NEXT: vmovapd %zmm0, %zmm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <8 x double> %__A to <8 x i64>		%0 = bitcast <8 x double> %__A to <8 x i64>
%1 = bitcast <8 x double> %__B to <8 x i64>		%1 = bitcast <8 x double> %__B to <8 x i64>
%and.i.i = and <8 x i64> %1, %0		%and.i.i = and <8 x i64> %1, %0
%2 = bitcast <8 x i64> %and.i.i to <8 x double>		%2 = bitcast <8 x i64> %and.i.i to <8 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> zeroinitializer		%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> zeroinitializer
ret <8 x double> %4		ret <8 x double> %4
}		}

define <16 x float> @test_mm512_mask_and_ps(<16 x float> %__W, i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {		define <16 x float> @test_mm512_mask_and_ps(<16 x float> %__W, i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {
; KNL-LABEL: test_mm512_mask_and_ps:		; KNL-LABEL: test_mm512_mask_and_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vpandd %zmm1, %zmm2, %zmm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandd %zmm1, %zmm2, %zmm0 {%k1}		; KNL-NEXT: vmovaps %zmm1, %zmm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm512_mask_and_ps:		; SKX-LABEL: test_mm512_mask_and_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandps %zmm1, %zmm2, %zmm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandps %zmm1, %zmm2, %zmm0 {%k1}		; SKX-NEXT: vmovaps %zmm1, %zmm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <16 x float> %__A to <16 x i32>		%0 = bitcast <16 x float> %__A to <16 x i32>
%1 = bitcast <16 x float> %__B to <16 x i32>		%1 = bitcast <16 x float> %__B to <16 x i32>
%and.i.i = and <16 x i32> %1, %0		%and.i.i = and <16 x i32> %1, %0
%2 = bitcast <16 x i32> %and.i.i to <16 x float>		%2 = bitcast <16 x i32> %and.i.i to <16 x float>
%3 = bitcast i16 %__U to <16 x i1>		%3 = bitcast i16 %__U to <16 x i1>
%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> %__W		%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> %__W
ret <16 x float> %4		ret <16 x float> %4
}		}

define <16 x float> @test_mm512_maskz_and_ps(i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {		define <16 x float> @test_mm512_maskz_and_ps(i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {
; KNL-LABEL: test_mm512_maskz_and_ps:		; KNL-LABEL: test_mm512_maskz_and_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vpandd %zmm0, %zmm1, %zmm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandd %zmm0, %zmm1, %zmm0 {%k1} {z}		; KNL-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm512_maskz_and_ps:		; SKX-LABEL: test_mm512_maskz_and_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandps %zmm0, %zmm1, %zmm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandps %zmm0, %zmm1, %zmm0 {%k1} {z}		; SKX-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <16 x float> %__A to <16 x i32>		%0 = bitcast <16 x float> %__A to <16 x i32>
%1 = bitcast <16 x float> %__B to <16 x i32>		%1 = bitcast <16 x float> %__B to <16 x i32>
%and.i.i = and <16 x i32> %1, %0		%and.i.i = and <16 x i32> %1, %0
%2 = bitcast <16 x i32> %and.i.i to <16 x float>		%2 = bitcast <16 x i32> %and.i.i to <16 x float>
%3 = bitcast i16 %__U to <16 x i1>		%3 = bitcast i16 %__U to <16 x i1>
%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> zeroinitializer		%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> zeroinitializer
ret <16 x float> %4		ret <16 x float> %4
}		}

define <8 x double> @test_mm512_mask_andnot_pd(<8 x double> %__W, i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {		define <8 x double> @test_mm512_mask_andnot_pd(<8 x double> %__W, i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {
; KNL-LABEL: test_mm512_mask_andnot_pd:		; KNL-LABEL: test_mm512_mask_andnot_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vpandnq %zmm2, %zmm1, %zmm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandnq %zmm2, %zmm1, %zmm0 {%k1}		; KNL-NEXT: vmovapd %zmm1, %zmm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm512_mask_andnot_pd:		; SKX-LABEL: test_mm512_mask_andnot_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandnpd %zmm2, %zmm1, %zmm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandnpd %zmm2, %zmm1, %zmm0 {%k1}		; SKX-NEXT: vmovapd %zmm1, %zmm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <8 x double> %__A to <8 x i64>		%0 = bitcast <8 x double> %__A to <8 x i64>
%neg.i.i = xor <8 x i64> %0, <i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1>		%neg.i.i = xor <8 x i64> %0, <i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1>
%1 = bitcast <8 x double> %__B to <8 x i64>		%1 = bitcast <8 x double> %__B to <8 x i64>
%and.i.i = and <8 x i64> %1, %neg.i.i		%and.i.i = and <8 x i64> %1, %neg.i.i
%2 = bitcast <8 x i64> %and.i.i to <8 x double>		%2 = bitcast <8 x i64> %and.i.i to <8 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> %__W		%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> %__W
ret <8 x double> %4		ret <8 x double> %4
}		}

define <8 x double> @test_mm512_maskz_andnot_pd(i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {		define <8 x double> @test_mm512_maskz_andnot_pd(i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {
; KNL-LABEL: test_mm512_maskz_andnot_pd:		; KNL-LABEL: test_mm512_maskz_andnot_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vpandnq %zmm1, %zmm0, %zmm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandnq %zmm1, %zmm0, %zmm0 {%k1} {z}		; KNL-NEXT: vmovapd %zmm0, %zmm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm512_maskz_andnot_pd:		; SKX-LABEL: test_mm512_maskz_andnot_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandnpd %zmm1, %zmm0, %zmm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandnpd %zmm1, %zmm0, %zmm0 {%k1} {z}		; SKX-NEXT: vmovapd %zmm0, %zmm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <8 x double> %__A to <8 x i64>		%0 = bitcast <8 x double> %__A to <8 x i64>
%neg.i.i = xor <8 x i64> %0, <i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1>		%neg.i.i = xor <8 x i64> %0, <i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1>
%1 = bitcast <8 x double> %__B to <8 x i64>		%1 = bitcast <8 x double> %__B to <8 x i64>
%and.i.i = and <8 x i64> %1, %neg.i.i		%and.i.i = and <8 x i64> %1, %neg.i.i
%2 = bitcast <8 x i64> %and.i.i to <8 x double>		%2 = bitcast <8 x i64> %and.i.i to <8 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> zeroinitializer		%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> zeroinitializer
ret <8 x double> %4		ret <8 x double> %4
}		}

define <16 x float> @test_mm512_mask_andnot_ps(<16 x float> %__W, i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {		define <16 x float> @test_mm512_mask_andnot_ps(<16 x float> %__W, i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {
; KNL-LABEL: test_mm512_mask_andnot_ps:		; KNL-LABEL: test_mm512_mask_andnot_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vpandnd %zmm2, %zmm1, %zmm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandnd %zmm2, %zmm1, %zmm0 {%k1}		; KNL-NEXT: vmovaps %zmm1, %zmm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm512_mask_andnot_ps:		; SKX-LABEL: test_mm512_mask_andnot_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandnps %zmm2, %zmm1, %zmm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandnps %zmm2, %zmm1, %zmm0 {%k1}		; SKX-NEXT: vmovaps %zmm1, %zmm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <16 x float> %__A to <16 x i32>		%0 = bitcast <16 x float> %__A to <16 x i32>
%neg.i.i = xor <16 x i32> %0, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>		%neg.i.i = xor <16 x i32> %0, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>
%1 = bitcast <16 x float> %__B to <16 x i32>		%1 = bitcast <16 x float> %__B to <16 x i32>
%and.i.i = and <16 x i32> %1, %neg.i.i		%and.i.i = and <16 x i32> %1, %neg.i.i
%2 = bitcast <16 x i32> %and.i.i to <16 x float>		%2 = bitcast <16 x i32> %and.i.i to <16 x float>
%3 = bitcast i16 %__U to <16 x i1>		%3 = bitcast i16 %__U to <16 x i1>
%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> %__W		%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> %__W
ret <16 x float> %4		ret <16 x float> %4
}		}

define <16 x float> @test_mm512_maskz_andnot_ps(i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {		define <16 x float> @test_mm512_maskz_andnot_ps(i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {
; KNL-LABEL: test_mm512_maskz_andnot_ps:		; KNL-LABEL: test_mm512_maskz_andnot_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vpandnd %zmm1, %zmm0, %zmm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandnd %zmm1, %zmm0, %zmm0 {%k1} {z}		; KNL-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm512_maskz_andnot_ps:		; SKX-LABEL: test_mm512_maskz_andnot_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandnps %zmm1, %zmm0, %zmm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandnps %zmm1, %zmm0, %zmm0 {%k1} {z}		; SKX-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <16 x float> %__A to <16 x i32>		%0 = bitcast <16 x float> %__A to <16 x i32>
%neg.i.i = xor <16 x i32> %0, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>		%neg.i.i = xor <16 x i32> %0, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>
%1 = bitcast <16 x float> %__B to <16 x i32>		%1 = bitcast <16 x float> %__B to <16 x i32>
%and.i.i = and <16 x i32> %1, %neg.i.i		%and.i.i = and <16 x i32> %1, %neg.i.i
%2 = bitcast <16 x i32> %and.i.i to <16 x float>		%2 = bitcast <16 x i32> %and.i.i to <16 x float>
%3 = bitcast i16 %__U to <16 x i1>		%3 = bitcast i16 %__U to <16 x i1>
%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> zeroinitializer		%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> zeroinitializer
ret <16 x float> %4		ret <16 x float> %4
}		}

test/CodeGen/X86/avx512-mask-op.ll

Show First 20 Lines • Show All 3,171 Lines • ▼ Show 20 Lines
}		}

; Make sure we don't emit a ktest for signed comparisons.		; Make sure we don't emit a ktest for signed comparisons.
define void @ktest_signed(<16 x i32> %x, <16 x i32> %y) {		define void @ktest_signed(<16 x i32> %x, <16 x i32> %y) {
; KNL-LABEL: ktest_signed:		; KNL-LABEL: ktest_signed:
; KNL: ## %bb.0:		; KNL: ## %bb.0:
; KNL-NEXT: pushq %rax		; KNL-NEXT: pushq %rax
; KNL-NEXT: .cfi_def_cfa_offset 16		; KNL-NEXT: .cfi_def_cfa_offset 16
; KNL-NEXT: vporq %zmm1, %zmm0, %zmm0		; KNL-NEXT: vpord %zmm1, %zmm0, %zmm0
; KNL-NEXT: vptestnmd %zmm0, %zmm0, %k0		; KNL-NEXT: vptestnmd %zmm0, %zmm0, %k0
; KNL-NEXT: kmovw %k0, %eax		; KNL-NEXT: kmovw %k0, %eax
; KNL-NEXT: testw %ax, %ax		; KNL-NEXT: testw %ax, %ax
; KNL-NEXT: jle LBB64_1		; KNL-NEXT: jle LBB64_1
; KNL-NEXT: ## %bb.2: ## %bb.2		; KNL-NEXT: ## %bb.2: ## %bb.2
; KNL-NEXT: popq %rax		; KNL-NEXT: popq %rax
; KNL-NEXT: vzeroupper		; KNL-NEXT: vzeroupper
; KNL-NEXT: retq		; KNL-NEXT: retq
; KNL-NEXT: LBB64_1: ## %bb.1		; KNL-NEXT: LBB64_1: ## %bb.1
; KNL-NEXT: vzeroupper		; KNL-NEXT: vzeroupper
; KNL-NEXT: callq _foo		; KNL-NEXT: callq _foo
; KNL-NEXT: popq %rax		; KNL-NEXT: popq %rax
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: ktest_signed:		; SKX-LABEL: ktest_signed:
; SKX: ## %bb.0:		; SKX: ## %bb.0:
; SKX-NEXT: pushq %rax		; SKX-NEXT: pushq %rax
; SKX-NEXT: .cfi_def_cfa_offset 16		; SKX-NEXT: .cfi_def_cfa_offset 16
; SKX-NEXT: vporq %zmm1, %zmm0, %zmm0		; SKX-NEXT: vpord %zmm1, %zmm0, %zmm0
; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k0		; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k0
; SKX-NEXT: kmovd %k0, %eax		; SKX-NEXT: kmovd %k0, %eax
; SKX-NEXT: testw %ax, %ax		; SKX-NEXT: testw %ax, %ax
; SKX-NEXT: jle LBB64_1		; SKX-NEXT: jle LBB64_1
; SKX-NEXT: ## %bb.2: ## %bb.2		; SKX-NEXT: ## %bb.2: ## %bb.2
; SKX-NEXT: popq %rax		; SKX-NEXT: popq %rax
; SKX-NEXT: vzeroupper		; SKX-NEXT: vzeroupper
; SKX-NEXT: retq		; SKX-NEXT: retq
; SKX-NEXT: LBB64_1: ## %bb.1		; SKX-NEXT: LBB64_1: ## %bb.1
; SKX-NEXT: vzeroupper		; SKX-NEXT: vzeroupper
; SKX-NEXT: callq _foo		; SKX-NEXT: callq _foo
; SKX-NEXT: popq %rax		; SKX-NEXT: popq %rax
; SKX-NEXT: retq		; SKX-NEXT: retq
;		;
; AVX512BW-LABEL: ktest_signed:		; AVX512BW-LABEL: ktest_signed:
; AVX512BW: ## %bb.0:		; AVX512BW: ## %bb.0:
; AVX512BW-NEXT: pushq %rax		; AVX512BW-NEXT: pushq %rax
; AVX512BW-NEXT: .cfi_def_cfa_offset 16		; AVX512BW-NEXT: .cfi_def_cfa_offset 16
; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0		; AVX512BW-NEXT: vpord %zmm1, %zmm0, %zmm0
; AVX512BW-NEXT: vptestnmd %zmm0, %zmm0, %k0		; AVX512BW-NEXT: vptestnmd %zmm0, %zmm0, %k0
; AVX512BW-NEXT: kmovd %k0, %eax		; AVX512BW-NEXT: kmovd %k0, %eax
; AVX512BW-NEXT: testw %ax, %ax		; AVX512BW-NEXT: testw %ax, %ax
; AVX512BW-NEXT: jle LBB64_1		; AVX512BW-NEXT: jle LBB64_1
; AVX512BW-NEXT: ## %bb.2: ## %bb.2		; AVX512BW-NEXT: ## %bb.2: ## %bb.2
; AVX512BW-NEXT: popq %rax		; AVX512BW-NEXT: popq %rax
; AVX512BW-NEXT: vzeroupper		; AVX512BW-NEXT: vzeroupper
; AVX512BW-NEXT: retq		; AVX512BW-NEXT: retq
; AVX512BW-NEXT: LBB64_1: ## %bb.1		; AVX512BW-NEXT: LBB64_1: ## %bb.1
; AVX512BW-NEXT: vzeroupper		; AVX512BW-NEXT: vzeroupper
; AVX512BW-NEXT: callq _foo		; AVX512BW-NEXT: callq _foo
; AVX512BW-NEXT: popq %rax		; AVX512BW-NEXT: popq %rax
; AVX512BW-NEXT: retq		; AVX512BW-NEXT: retq
;		;
; AVX512DQ-LABEL: ktest_signed:		; AVX512DQ-LABEL: ktest_signed:
; AVX512DQ: ## %bb.0:		; AVX512DQ: ## %bb.0:
; AVX512DQ-NEXT: pushq %rax		; AVX512DQ-NEXT: pushq %rax
; AVX512DQ-NEXT: .cfi_def_cfa_offset 16		; AVX512DQ-NEXT: .cfi_def_cfa_offset 16
; AVX512DQ-NEXT: vporq %zmm1, %zmm0, %zmm0		; AVX512DQ-NEXT: vpord %zmm1, %zmm0, %zmm0
; AVX512DQ-NEXT: vptestnmd %zmm0, %zmm0, %k0		; AVX512DQ-NEXT: vptestnmd %zmm0, %zmm0, %k0
; AVX512DQ-NEXT: kmovw %k0, %eax		; AVX512DQ-NEXT: kmovw %k0, %eax
; AVX512DQ-NEXT: testw %ax, %ax		; AVX512DQ-NEXT: testw %ax, %ax
; AVX512DQ-NEXT: jle LBB64_1		; AVX512DQ-NEXT: jle LBB64_1
; AVX512DQ-NEXT: ## %bb.2: ## %bb.2		; AVX512DQ-NEXT: ## %bb.2: ## %bb.2
; AVX512DQ-NEXT: popq %rax		; AVX512DQ-NEXT: popq %rax
; AVX512DQ-NEXT: vzeroupper		; AVX512DQ-NEXT: vzeroupper
; AVX512DQ-NEXT: retq		; AVX512DQ-NEXT: retq
; AVX512DQ-NEXT: LBB64_1: ## %bb.1		; AVX512DQ-NEXT: LBB64_1: ## %bb.1
; AVX512DQ-NEXT: vzeroupper		; AVX512DQ-NEXT: vzeroupper
; AVX512DQ-NEXT: callq _foo		; AVX512DQ-NEXT: callq _foo
; AVX512DQ-NEXT: popq %rax		; AVX512DQ-NEXT: popq %rax
; AVX512DQ-NEXT: retq		; AVX512DQ-NEXT: retq
;		;
; X86-LABEL: ktest_signed:		; X86-LABEL: ktest_signed:
; X86: ## %bb.0:		; X86: ## %bb.0:
; X86-NEXT: subl $12, %esp		; X86-NEXT: subl $12, %esp
; X86-NEXT: .cfi_def_cfa_offset 16		; X86-NEXT: .cfi_def_cfa_offset 16
; X86-NEXT: vporq %zmm1, %zmm0, %zmm0		; X86-NEXT: vpord %zmm1, %zmm0, %zmm0
; X86-NEXT: vptestnmd %zmm0, %zmm0, %k0		; X86-NEXT: vptestnmd %zmm0, %zmm0, %k0
; X86-NEXT: kmovd %k0, %eax		; X86-NEXT: kmovd %k0, %eax
; X86-NEXT: testw %ax, %ax		; X86-NEXT: testw %ax, %ax
; X86-NEXT: jle LBB64_1		; X86-NEXT: jle LBB64_1
; X86-NEXT: ## %bb.2: ## %bb.2		; X86-NEXT: ## %bb.2: ## %bb.2
; X86-NEXT: addl $12, %esp		; X86-NEXT: addl $12, %esp
; X86-NEXT: vzeroupper		; X86-NEXT: vzeroupper
; X86-NEXT: retl		; X86-NEXT: retl
Show All 17 Lines
declare void @foo()		declare void @foo()

; Make sure we can use the C flag from kortest to check for all ones.		; Make sure we can use the C flag from kortest to check for all ones.
define void @ktest_allones(<16 x i32> %x, <16 x i32> %y) {		define void @ktest_allones(<16 x i32> %x, <16 x i32> %y) {
; CHECK-LABEL: ktest_allones:		; CHECK-LABEL: ktest_allones:
; CHECK: ## %bb.0:		; CHECK: ## %bb.0:
; CHECK-NEXT: pushq %rax		; CHECK-NEXT: pushq %rax
; CHECK-NEXT: .cfi_def_cfa_offset 16		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: vporq %zmm1, %zmm0, %zmm0		; CHECK-NEXT: vpord %zmm1, %zmm0, %zmm0
; CHECK-NEXT: vptestnmd %zmm0, %zmm0, %k0		; CHECK-NEXT: vptestnmd %zmm0, %zmm0, %k0
; CHECK-NEXT: kortestw %k0, %k0		; CHECK-NEXT: kortestw %k0, %k0
; CHECK-NEXT: jb LBB65_2		; CHECK-NEXT: jb LBB65_2
; CHECK-NEXT: ## %bb.1: ## %bb.1		; CHECK-NEXT: ## %bb.1: ## %bb.1
; CHECK-NEXT: vzeroupper		; CHECK-NEXT: vzeroupper
; CHECK-NEXT: callq _foo		; CHECK-NEXT: callq _foo
; CHECK-NEXT: LBB65_2: ## %bb.2		; CHECK-NEXT: LBB65_2: ## %bb.2
; CHECK-NEXT: popq %rax		; CHECK-NEXT: popq %rax
; CHECK-NEXT: vzeroupper		; CHECK-NEXT: vzeroupper
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; X86-LABEL: ktest_allones:		; X86-LABEL: ktest_allones:
; X86: ## %bb.0:		; X86: ## %bb.0:
; X86-NEXT: subl $12, %esp		; X86-NEXT: subl $12, %esp
; X86-NEXT: .cfi_def_cfa_offset 16		; X86-NEXT: .cfi_def_cfa_offset 16
; X86-NEXT: vporq %zmm1, %zmm0, %zmm0		; X86-NEXT: vpord %zmm1, %zmm0, %zmm0
; X86-NEXT: vptestnmd %zmm0, %zmm0, %k0		; X86-NEXT: vptestnmd %zmm0, %zmm0, %k0
; X86-NEXT: kortestw %k0, %k0		; X86-NEXT: kortestw %k0, %k0
; X86-NEXT: jb LBB65_2		; X86-NEXT: jb LBB65_2
; X86-NEXT: ## %bb.1: ## %bb.1		; X86-NEXT: ## %bb.1: ## %bb.1
; X86-NEXT: vzeroupper		; X86-NEXT: vzeroupper
; X86-NEXT: calll _foo		; X86-NEXT: calll _foo
; X86-NEXT: LBB65_2: ## %bb.2		; X86-NEXT: LBB65_2: ## %bb.2
; X86-NEXT: addl $12, %esp		; X86-NEXT: addl $12, %esp
▲ Show 20 Lines • Show All 128 Lines • ▼ Show 20 Lines	entry:
store <4 x i1> <i1 1, i1 0, i1 1, i1 0>, <4 x i1>* %R		store <4 x i1> <i1 1, i1 0, i1 1, i1 0>, <4 x i1>* %R
ret void		ret void
}		}

; Make sure we bring the -1 constant into the mask domain.		; Make sure we bring the -1 constant into the mask domain.
define void @mask_not_cast(i8*, <8 x i64>, <8 x i64>, <8 x i64>, <8 x i64>) {		define void @mask_not_cast(i8*, <8 x i64>, <8 x i64>, <8 x i64>, <8 x i64>) {
; CHECK-LABEL: mask_not_cast:		; CHECK-LABEL: mask_not_cast:
; CHECK: ## %bb.0:		; CHECK: ## %bb.0:
		; CHECK-NEXT: vpandq %zmm0, %zmm1, %zmm1
; CHECK-NEXT: vpcmpnleud %zmm3, %zmm2, %k1		; CHECK-NEXT: vpcmpnleud %zmm3, %zmm2, %k1
; CHECK-NEXT: vptestmd %zmm0, %zmm1, %k1 {%k1}		; CHECK-NEXT: vptestmd %zmm1, %zmm1, %k1 {%k1}
; CHECK-NEXT: vmovdqu32 %zmm0, (%rdi) {%k1}		; CHECK-NEXT: vmovdqu32 %zmm0, (%rdi) {%k1}
; CHECK-NEXT: vzeroupper		; CHECK-NEXT: vzeroupper
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; X86-LABEL: mask_not_cast:		; X86-LABEL: mask_not_cast:
; X86: ## %bb.0:		; X86: ## %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
		; X86-NEXT: vpandq %zmm0, %zmm1, %zmm1
; X86-NEXT: vpcmpnleud %zmm3, %zmm2, %k1		; X86-NEXT: vpcmpnleud %zmm3, %zmm2, %k1
; X86-NEXT: vptestmd %zmm0, %zmm1, %k1 {%k1}		; X86-NEXT: vptestmd %zmm1, %zmm1, %k1 {%k1}
; X86-NEXT: vmovdqu32 %zmm0, (%eax) {%k1}		; X86-NEXT: vmovdqu32 %zmm0, (%eax) {%k1}
; X86-NEXT: vzeroupper		; X86-NEXT: vzeroupper
; X86-NEXT: retl		; X86-NEXT: retl
%6 = and <8 x i64> %2, %1		%6 = and <8 x i64> %2, %1
%7 = bitcast <8 x i64> %6 to <16 x i32>		%7 = bitcast <8 x i64> %6 to <16 x i32>
%8 = icmp ne <16 x i32> %7, zeroinitializer		%8 = icmp ne <16 x i32> %7, zeroinitializer
%9 = bitcast <16 x i1> %8 to i16		%9 = bitcast <16 x i1> %8 to i16
%10 = bitcast <8 x i64> %3 to <16 x i32>		%10 = bitcast <8 x i64> %3 to <16 x i32>
Show All 12 Lines

test/CodeGen/X86/avx512-schedule.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 5,023 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%res = select <16 x i1> %mask, <16 x float> %y, <16 x float> %a1		%res = select <16 x i1> %mask, <16 x float> %y, <16 x float> %a1
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x i32> @vpandd(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {		define <16 x i32> @vpandd(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {
; GENERIC-LABEL: vpandd:		; GENERIC-LABEL: vpandd:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]		; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]
; GENERIC-NEXT: vpandq %zmm1, %zmm0, %zmm0 # sched: [1:0.33]		; GENERIC-NEXT: vpandd %zmm1, %zmm0, %zmm0 # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vpandd:		; SKX-LABEL: vpandd:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: vpandq %zmm1, %zmm0, %zmm0 # sched: [1:0.50]		; SKX-NEXT: vpandd %zmm1, %zmm0, %zmm0 # sched: [1:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
; Force the execution domain with an add.		; Force the execution domain with an add.
%a2 = add <16 x i32> %a, <i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2,		%a2 = add <16 x i32> %a, <i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2,
i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2>		i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2>
%x = and <16 x i32> %a2, %b		%x = and <16 x i32> %a2, %b
ret <16 x i32> %x		ret <16 x i32> %x
}		}

define <16 x i32> @vpandnd(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {		define <16 x i32> @vpandnd(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {
; GENERIC-LABEL: vpandnd:		; GENERIC-LABEL: vpandnd:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]		; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]
; GENERIC-NEXT: vpandnq %zmm0, %zmm1, %zmm0 # sched: [1:0.33]		; GENERIC-NEXT: vpandnd %zmm0, %zmm1, %zmm0 # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vpandnd:		; SKX-LABEL: vpandnd:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: vpandnq %zmm0, %zmm1, %zmm0 # sched: [1:0.50]		; SKX-NEXT: vpandnd %zmm0, %zmm1, %zmm0 # sched: [1:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
; Force the execution domain with an add.		; Force the execution domain with an add.
%a2 = add <16 x i32> %a, <i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3,		%a2 = add <16 x i32> %a, <i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3,
i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3>		i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3>
%b2 = xor <16 x i32> %b, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1,		%b2 = xor <16 x i32> %b, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1,
i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>		i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>
%x = and <16 x i32> %a2, %b2		%x = and <16 x i32> %a2, %b2
ret <16 x i32> %x		ret <16 x i32> %x
}		}

define <16 x i32> @vpord(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {		define <16 x i32> @vpord(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {
; GENERIC-LABEL: vpord:		; GENERIC-LABEL: vpord:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]		; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]
; GENERIC-NEXT: vporq %zmm1, %zmm0, %zmm0 # sched: [1:0.33]		; GENERIC-NEXT: vpord %zmm1, %zmm0, %zmm0 # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vpord:		; SKX-LABEL: vpord:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: vporq %zmm1, %zmm0, %zmm0 # sched: [1:0.50]		; SKX-NEXT: vpord %zmm1, %zmm0, %zmm0 # sched: [1:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
; Force the execution domain with an add.		; Force the execution domain with an add.
%a2 = add <16 x i32> %a, <i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4,		%a2 = add <16 x i32> %a, <i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4,
i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>		i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>
%x = or <16 x i32> %a2, %b		%x = or <16 x i32> %a2, %b
ret <16 x i32> %x		ret <16 x i32> %x
}		}

define <16 x i32> @vpxord(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {		define <16 x i32> @vpxord(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {
; GENERIC-LABEL: vpxord:		; GENERIC-LABEL: vpxord:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]		; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]
; GENERIC-NEXT: vpxorq %zmm1, %zmm0, %zmm0 # sched: [1:0.33]		; GENERIC-NEXT: vpxord %zmm1, %zmm0, %zmm0 # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vpxord:		; SKX-LABEL: vpxord:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: vpxorq %zmm1, %zmm0, %zmm0 # sched: [1:0.50]		; SKX-NEXT: vpxord %zmm1, %zmm0, %zmm0 # sched: [1:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
; Force the execution domain with an add.		; Force the execution domain with an add.
%a2 = add <16 x i32> %a, <i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5,		%a2 = add <16 x i32> %a, <i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5,
i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5>		i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5>
%x = xor <16 x i32> %a2, %b		%x = xor <16 x i32> %a2, %b
ret <16 x i32> %x		ret <16 x i32> %x
}		}
▲ Show 20 Lines • Show All 341 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%cast = bitcast <8 x i64> %select to <8 x double>		%cast = bitcast <8 x i64> %select to <8 x double>
%add = fadd <8 x double> %c, %cast		%add = fadd <8 x double> %c, %cast
ret <8 x double> %add		ret <8 x double> %add
}		}

define <8 x i64> @test_mm512_mask_and_epi32(<8 x i64> %__src, i16 zeroext %__k, <8 x i64> %__a, <8 x i64> %__b) {		define <8 x i64> @test_mm512_mask_and_epi32(<8 x i64> %__src, i16 zeroext %__k, <8 x i64> %__a, <8 x i64> %__b) {
; GENERIC-LABEL: test_mm512_mask_and_epi32:		; GENERIC-LABEL: test_mm512_mask_and_epi32:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
		; GENERIC-NEXT: vpandq %zmm2, %zmm1, %zmm1 # sched: [1:0.33]
; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]		; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vandps %zmm2, %zmm1, %zmm0 {%k1} # sched: [1:1.00]		; GENERIC-NEXT: vmovdqa32 %zmm1, %zmm0 {%k1} # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mm512_mask_and_epi32:		; SKX-LABEL: test_mm512_mask_and_epi32:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
		; SKX-NEXT: vpandq %zmm2, %zmm1, %zmm1 # sched: [1:0.50]
; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]		; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]
; SKX-NEXT: vandps %zmm2, %zmm1, %zmm0 {%k1} # sched: [1:0.50]		; SKX-NEXT: vmovdqa32 %zmm1, %zmm0 {%k1} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%and1.i.i = and <8 x i64> %__a, %__b		%and1.i.i = and <8 x i64> %__a, %__b
%0 = bitcast <8 x i64> %and1.i.i to <16 x i32>		%0 = bitcast <8 x i64> %and1.i.i to <16 x i32>
%1 = bitcast <8 x i64> %__src to <16 x i32>		%1 = bitcast <8 x i64> %__src to <16 x i32>
%2 = bitcast i16 %__k to <16 x i1>		%2 = bitcast i16 %__k to <16 x i1>
%3 = select <16 x i1> %2, <16 x i32> %0, <16 x i32> %1		%3 = select <16 x i1> %2, <16 x i32> %0, <16 x i32> %1
%4 = bitcast <16 x i32> %3 to <8 x i64>		%4 = bitcast <16 x i32> %3 to <8 x i64>
ret <8 x i64> %4		ret <8 x i64> %4
}		}

define <8 x i64> @test_mm512_mask_or_epi32(<8 x i64> %__src, i16 zeroext %__k, <8 x i64> %__a, <8 x i64> %__b) {		define <8 x i64> @test_mm512_mask_or_epi32(<8 x i64> %__src, i16 zeroext %__k, <8 x i64> %__a, <8 x i64> %__b) {
; GENERIC-LABEL: test_mm512_mask_or_epi32:		; GENERIC-LABEL: test_mm512_mask_or_epi32:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
		; GENERIC-NEXT: vporq %zmm2, %zmm1, %zmm1 # sched: [1:0.33]
; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]		; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vorps %zmm2, %zmm1, %zmm0 {%k1} # sched: [1:1.00]		; GENERIC-NEXT: vmovdqa32 %zmm1, %zmm0 {%k1} # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mm512_mask_or_epi32:		; SKX-LABEL: test_mm512_mask_or_epi32:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
		; SKX-NEXT: vporq %zmm2, %zmm1, %zmm1 # sched: [1:0.50]
; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]		; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]
; SKX-NEXT: vorps %zmm2, %zmm1, %zmm0 {%k1} # sched: [1:0.50]		; SKX-NEXT: vmovdqa32 %zmm1, %zmm0 {%k1} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%or1.i.i = or <8 x i64> %__a, %__b		%or1.i.i = or <8 x i64> %__a, %__b
%0 = bitcast <8 x i64> %or1.i.i to <16 x i32>		%0 = bitcast <8 x i64> %or1.i.i to <16 x i32>
%1 = bitcast <8 x i64> %__src to <16 x i32>		%1 = bitcast <8 x i64> %__src to <16 x i32>
%2 = bitcast i16 %__k to <16 x i1>		%2 = bitcast i16 %__k to <16 x i1>
%3 = select <16 x i1> %2, <16 x i32> %0, <16 x i32> %1		%3 = select <16 x i1> %2, <16 x i32> %0, <16 x i32> %1
%4 = bitcast <16 x i32> %3 to <8 x i64>		%4 = bitcast <16 x i32> %3 to <8 x i64>
ret <8 x i64> %4		ret <8 x i64> %4
}		}

define <8 x i64> @test_mm512_mask_xor_epi32(<8 x i64> %__src, i16 zeroext %__k, <8 x i64> %__a, <8 x i64> %__b) {		define <8 x i64> @test_mm512_mask_xor_epi32(<8 x i64> %__src, i16 zeroext %__k, <8 x i64> %__a, <8 x i64> %__b) {
; GENERIC-LABEL: test_mm512_mask_xor_epi32:		; GENERIC-LABEL: test_mm512_mask_xor_epi32:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
		; GENERIC-NEXT: vpxorq %zmm2, %zmm1, %zmm1 # sched: [1:0.33]
; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]		; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vxorps %zmm2, %zmm1, %zmm0 {%k1} # sched: [1:1.00]		; GENERIC-NEXT: vmovdqa32 %zmm1, %zmm0 {%k1} # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mm512_mask_xor_epi32:		; SKX-LABEL: test_mm512_mask_xor_epi32:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
		; SKX-NEXT: vpxorq %zmm2, %zmm1, %zmm1 # sched: [1:0.50]
; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]		; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]
; SKX-NEXT: vxorps %zmm2, %zmm1, %zmm0 {%k1} # sched: [1:0.50]		; SKX-NEXT: vmovdqa32 %zmm1, %zmm0 {%k1} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%xor1.i.i = xor <8 x i64> %__a, %__b		%xor1.i.i = xor <8 x i64> %__a, %__b
%0 = bitcast <8 x i64> %xor1.i.i to <16 x i32>		%0 = bitcast <8 x i64> %xor1.i.i to <16 x i32>
%1 = bitcast <8 x i64> %__src to <16 x i32>		%1 = bitcast <8 x i64> %__src to <16 x i32>
%2 = bitcast i16 %__k to <16 x i1>		%2 = bitcast i16 %__k to <16 x i1>
%3 = select <16 x i1> %2, <16 x i32> %0, <16 x i32> %1		%3 = select <16 x i1> %2, <16 x i32> %0, <16 x i32> %1
%4 = bitcast <16 x i32> %3 to <8 x i64>		%4 = bitcast <16 x i32> %3 to <8 x i64>
ret <8 x i64> %4		ret <8 x i64> %4
}		}

define <8 x double> @test_mm512_mask_xor_pd(<8 x double> %__W, i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {		define <8 x double> @test_mm512_mask_xor_pd(<8 x double> %__W, i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {
; GENERIC-LABEL: test_mm512_mask_xor_pd:		; GENERIC-LABEL: test_mm512_mask_xor_pd:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
		; GENERIC-NEXT: vxorpd %zmm2, %zmm1, %zmm1 # sched: [1:1.00]
; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]		; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vxorpd %zmm2, %zmm1, %zmm0 {%k1} # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm1, %zmm0 {%k1} # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mm512_mask_xor_pd:		; SKX-LABEL: test_mm512_mask_xor_pd:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
		; SKX-NEXT: vxorpd %zmm2, %zmm1, %zmm1 # sched: [1:0.50]
; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]		; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]
; SKX-NEXT: vxorpd %zmm2, %zmm1, %zmm0 {%k1} # sched: [1:0.50]		; SKX-NEXT: vmovapd %zmm1, %zmm0 {%k1} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%0 = bitcast <8 x double> %__A to <8 x i64>		%0 = bitcast <8 x double> %__A to <8 x i64>
%1 = bitcast <8 x double> %__B to <8 x i64>		%1 = bitcast <8 x double> %__B to <8 x i64>
%xor.i.i = xor <8 x i64> %0, %1		%xor.i.i = xor <8 x i64> %0, %1
%2 = bitcast <8 x i64> %xor.i.i to <8 x double>		%2 = bitcast <8 x i64> %xor.i.i to <8 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> %__W		%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> %__W
ret <8 x double> %4		ret <8 x double> %4
}		}

define <8 x double> @test_mm512_maskz_xor_pd(i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {		define <8 x double> @test_mm512_maskz_xor_pd(i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {
; GENERIC-LABEL: test_mm512_maskz_xor_pd:		; GENERIC-LABEL: test_mm512_maskz_xor_pd:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
		; GENERIC-NEXT: vxorpd %zmm1, %zmm0, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]		; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vxorpd %zmm1, %zmm0, %zmm0 {%k1} {z} # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm0, %zmm0 {%k1} {z} # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mm512_maskz_xor_pd:		; SKX-LABEL: test_mm512_maskz_xor_pd:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
		; SKX-NEXT: vxorpd %zmm1, %zmm0, %zmm0 # sched: [1:0.50]
; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]		; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]
; SKX-NEXT: vxorpd %zmm1, %zmm0, %zmm0 {%k1} {z} # sched: [1:0.50]		; SKX-NEXT: vmovapd %zmm0, %zmm0 {%k1} {z} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%0 = bitcast <8 x double> %__A to <8 x i64>		%0 = bitcast <8 x double> %__A to <8 x i64>
%1 = bitcast <8 x double> %__B to <8 x i64>		%1 = bitcast <8 x double> %__B to <8 x i64>
%xor.i.i = xor <8 x i64> %0, %1		%xor.i.i = xor <8 x i64> %0, %1
%2 = bitcast <8 x i64> %xor.i.i to <8 x double>		%2 = bitcast <8 x i64> %xor.i.i to <8 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> zeroinitializer		%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> zeroinitializer
ret <8 x double> %4		ret <8 x double> %4
}		}

define <16 x float> @test_mm512_mask_xor_ps(<16 x float> %__W, i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {		define <16 x float> @test_mm512_mask_xor_ps(<16 x float> %__W, i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {
; GENERIC-LABEL: test_mm512_mask_xor_ps:		; GENERIC-LABEL: test_mm512_mask_xor_ps:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
		; GENERIC-NEXT: vxorps %zmm2, %zmm1, %zmm1 # sched: [1:1.00]
; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]		; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vxorps %zmm2, %zmm1, %zmm0 {%k1} # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm1, %zmm0 {%k1} # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mm512_mask_xor_ps:		; SKX-LABEL: test_mm512_mask_xor_ps:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
		; SKX-NEXT: vxorps %zmm2, %zmm1, %zmm1 # sched: [1:0.50]
; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]		; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]
; SKX-NEXT: vxorps %zmm2, %zmm1, %zmm0 {%k1} # sched: [1:0.50]		; SKX-NEXT: vmovaps %zmm1, %zmm0 {%k1} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%0 = bitcast <16 x float> %__A to <16 x i32>		%0 = bitcast <16 x float> %__A to <16 x i32>
%1 = bitcast <16 x float> %__B to <16 x i32>		%1 = bitcast <16 x float> %__B to <16 x i32>
%xor.i.i = xor <16 x i32> %0, %1		%xor.i.i = xor <16 x i32> %0, %1
%2 = bitcast <16 x i32> %xor.i.i to <16 x float>		%2 = bitcast <16 x i32> %xor.i.i to <16 x float>
%3 = bitcast i16 %__U to <16 x i1>		%3 = bitcast i16 %__U to <16 x i1>
%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> %__W		%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> %__W
ret <16 x float> %4		ret <16 x float> %4
}		}

define <16 x float> @test_mm512_maskz_xor_ps(i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {		define <16 x float> @test_mm512_maskz_xor_ps(i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {
; GENERIC-LABEL: test_mm512_maskz_xor_ps:		; GENERIC-LABEL: test_mm512_maskz_xor_ps:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
		; GENERIC-NEXT: vxorps %zmm1, %zmm0, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]		; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vxorps %zmm1, %zmm0, %zmm0 {%k1} {z} # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mm512_maskz_xor_ps:		; SKX-LABEL: test_mm512_maskz_xor_ps:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
		; SKX-NEXT: vxorps %zmm1, %zmm0, %zmm0 # sched: [1:0.50]
; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]		; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]
; SKX-NEXT: vxorps %zmm1, %zmm0, %zmm0 {%k1} {z} # sched: [1:0.50]		; SKX-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%0 = bitcast <16 x float> %__A to <16 x i32>		%0 = bitcast <16 x float> %__A to <16 x i32>
%1 = bitcast <16 x float> %__B to <16 x i32>		%1 = bitcast <16 x float> %__B to <16 x i32>
%xor.i.i = xor <16 x i32> %0, %1		%xor.i.i = xor <16 x i32> %0, %1
%2 = bitcast <16 x i32> %xor.i.i to <16 x float>		%2 = bitcast <16 x i32> %xor.i.i to <16 x float>
%3 = bitcast i16 %__U to <16 x i1>		%3 = bitcast i16 %__U to <16 x i1>
%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> zeroinitializer		%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> zeroinitializer
ret <16 x float> %4		ret <16 x float> %4
}		}

define <8 x double> @test_mm512_mask_or_pd(<8 x double> %__W, i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {		define <8 x double> @test_mm512_mask_or_pd(<8 x double> %__W, i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {
; GENERIC-LABEL: test_mm512_mask_or_pd:		; GENERIC-LABEL: test_mm512_mask_or_pd:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
		; GENERIC-NEXT: vorpd %zmm1, %zmm2, %zmm1 # sched: [1:1.00]
; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]		; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vorpd %zmm1, %zmm2, %zmm0 {%k1} # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm1, %zmm0 {%k1} # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mm512_mask_or_pd:		; SKX-LABEL: test_mm512_mask_or_pd:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
		; SKX-NEXT: vorpd %zmm1, %zmm2, %zmm1 # sched: [1:0.50]
; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]		; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]
; SKX-NEXT: vorpd %zmm1, %zmm2, %zmm0 {%k1} # sched: [1:0.50]		; SKX-NEXT: vmovapd %zmm1, %zmm0 {%k1} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%0 = bitcast <8 x double> %__A to <8 x i64>		%0 = bitcast <8 x double> %__A to <8 x i64>
%1 = bitcast <8 x double> %__B to <8 x i64>		%1 = bitcast <8 x double> %__B to <8 x i64>
%or.i.i = or <8 x i64> %1, %0		%or.i.i = or <8 x i64> %1, %0
%2 = bitcast <8 x i64> %or.i.i to <8 x double>		%2 = bitcast <8 x i64> %or.i.i to <8 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> %__W		%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> %__W
ret <8 x double> %4		ret <8 x double> %4
}		}

define <8 x double> @test_mm512_maskz_or_pd(i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {		define <8 x double> @test_mm512_maskz_or_pd(i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {
; GENERIC-LABEL: test_mm512_maskz_or_pd:		; GENERIC-LABEL: test_mm512_maskz_or_pd:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
		; GENERIC-NEXT: vorpd %zmm0, %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]		; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vorpd %zmm0, %zmm1, %zmm0 {%k1} {z} # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm0, %zmm0 {%k1} {z} # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mm512_maskz_or_pd:		; SKX-LABEL: test_mm512_maskz_or_pd:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
		; SKX-NEXT: vorpd %zmm0, %zmm1, %zmm0 # sched: [1:0.50]
; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]		; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]
; SKX-NEXT: vorpd %zmm0, %zmm1, %zmm0 {%k1} {z} # sched: [1:0.50]		; SKX-NEXT: vmovapd %zmm0, %zmm0 {%k1} {z} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%0 = bitcast <8 x double> %__A to <8 x i64>		%0 = bitcast <8 x double> %__A to <8 x i64>
%1 = bitcast <8 x double> %__B to <8 x i64>		%1 = bitcast <8 x double> %__B to <8 x i64>
%or.i.i = or <8 x i64> %1, %0		%or.i.i = or <8 x i64> %1, %0
%2 = bitcast <8 x i64> %or.i.i to <8 x double>		%2 = bitcast <8 x i64> %or.i.i to <8 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> zeroinitializer		%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> zeroinitializer
ret <8 x double> %4		ret <8 x double> %4
}		}

define <16 x float> @test_mm512_mask_or_ps(<16 x float> %__W, i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {		define <16 x float> @test_mm512_mask_or_ps(<16 x float> %__W, i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {
; GENERIC-LABEL: test_mm512_mask_or_ps:		; GENERIC-LABEL: test_mm512_mask_or_ps:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
		; GENERIC-NEXT: vorps %zmm1, %zmm2, %zmm1 # sched: [1:1.00]
; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]		; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vorps %zmm1, %zmm2, %zmm0 {%k1} # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm1, %zmm0 {%k1} # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mm512_mask_or_ps:		; SKX-LABEL: test_mm512_mask_or_ps:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
		; SKX-NEXT: vorps %zmm1, %zmm2, %zmm1 # sched: [1:0.50]
; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]		; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]
; SKX-NEXT: vorps %zmm1, %zmm2, %zmm0 {%k1} # sched: [1:0.50]		; SKX-NEXT: vmovaps %zmm1, %zmm0 {%k1} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%0 = bitcast <16 x float> %__A to <16 x i32>		%0 = bitcast <16 x float> %__A to <16 x i32>
%1 = bitcast <16 x float> %__B to <16 x i32>		%1 = bitcast <16 x float> %__B to <16 x i32>
%or.i.i = or <16 x i32> %1, %0		%or.i.i = or <16 x i32> %1, %0
%2 = bitcast <16 x i32> %or.i.i to <16 x float>		%2 = bitcast <16 x i32> %or.i.i to <16 x float>
%3 = bitcast i16 %__U to <16 x i1>		%3 = bitcast i16 %__U to <16 x i1>
%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> %__W		%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> %__W
ret <16 x float> %4		ret <16 x float> %4
}		}

define <16 x float> @test_mm512_maskz_or_ps(i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {		define <16 x float> @test_mm512_maskz_or_ps(i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {
; GENERIC-LABEL: test_mm512_maskz_or_ps:		; GENERIC-LABEL: test_mm512_maskz_or_ps:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
		; GENERIC-NEXT: vorps %zmm0, %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]		; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vorps %zmm0, %zmm1, %zmm0 {%k1} {z} # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mm512_maskz_or_ps:		; SKX-LABEL: test_mm512_maskz_or_ps:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
		; SKX-NEXT: vorps %zmm0, %zmm1, %zmm0 # sched: [1:0.50]
; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]		; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]
; SKX-NEXT: vorps %zmm0, %zmm1, %zmm0 {%k1} {z} # sched: [1:0.50]		; SKX-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%0 = bitcast <16 x float> %__A to <16 x i32>		%0 = bitcast <16 x float> %__A to <16 x i32>
%1 = bitcast <16 x float> %__B to <16 x i32>		%1 = bitcast <16 x float> %__B to <16 x i32>
%or.i.i = or <16 x i32> %1, %0		%or.i.i = or <16 x i32> %1, %0
%2 = bitcast <16 x i32> %or.i.i to <16 x float>		%2 = bitcast <16 x i32> %or.i.i to <16 x float>
%3 = bitcast i16 %__U to <16 x i1>		%3 = bitcast i16 %__U to <16 x i1>
%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> zeroinitializer		%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> zeroinitializer
ret <16 x float> %4		ret <16 x float> %4
}		}

define <8 x double> @test_mm512_mask_and_pd(<8 x double> %__W, i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {		define <8 x double> @test_mm512_mask_and_pd(<8 x double> %__W, i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {
; GENERIC-LABEL: test_mm512_mask_and_pd:		; GENERIC-LABEL: test_mm512_mask_and_pd:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
		; GENERIC-NEXT: vandpd %zmm1, %zmm2, %zmm1 # sched: [1:1.00]
; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]		; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vandpd %zmm1, %zmm2, %zmm0 {%k1} # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm1, %zmm0 {%k1} # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mm512_mask_and_pd:		; SKX-LABEL: test_mm512_mask_and_pd:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
		; SKX-NEXT: vandpd %zmm1, %zmm2, %zmm1 # sched: [1:0.50]
; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]		; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]
; SKX-NEXT: vandpd %zmm1, %zmm2, %zmm0 {%k1} # sched: [1:0.50]		; SKX-NEXT: vmovapd %zmm1, %zmm0 {%k1} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%0 = bitcast <8 x double> %__A to <8 x i64>		%0 = bitcast <8 x double> %__A to <8 x i64>
%1 = bitcast <8 x double> %__B to <8 x i64>		%1 = bitcast <8 x double> %__B to <8 x i64>
%and.i.i = and <8 x i64> %1, %0		%and.i.i = and <8 x i64> %1, %0
%2 = bitcast <8 x i64> %and.i.i to <8 x double>		%2 = bitcast <8 x i64> %and.i.i to <8 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> %__W		%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> %__W
ret <8 x double> %4		ret <8 x double> %4
}		}

define <8 x double> @test_mm512_maskz_and_pd(i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {		define <8 x double> @test_mm512_maskz_and_pd(i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {
; GENERIC-LABEL: test_mm512_maskz_and_pd:		; GENERIC-LABEL: test_mm512_maskz_and_pd:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
		; GENERIC-NEXT: vandpd %zmm0, %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]		; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vandpd %zmm0, %zmm1, %zmm0 {%k1} {z} # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm0, %zmm0 {%k1} {z} # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mm512_maskz_and_pd:		; SKX-LABEL: test_mm512_maskz_and_pd:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
		; SKX-NEXT: vandpd %zmm0, %zmm1, %zmm0 # sched: [1:0.50]
; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]		; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]
; SKX-NEXT: vandpd %zmm0, %zmm1, %zmm0 {%k1} {z} # sched: [1:0.50]		; SKX-NEXT: vmovapd %zmm0, %zmm0 {%k1} {z} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%0 = bitcast <8 x double> %__A to <8 x i64>		%0 = bitcast <8 x double> %__A to <8 x i64>
%1 = bitcast <8 x double> %__B to <8 x i64>		%1 = bitcast <8 x double> %__B to <8 x i64>
%and.i.i = and <8 x i64> %1, %0		%and.i.i = and <8 x i64> %1, %0
%2 = bitcast <8 x i64> %and.i.i to <8 x double>		%2 = bitcast <8 x i64> %and.i.i to <8 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> zeroinitializer		%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> zeroinitializer
ret <8 x double> %4		ret <8 x double> %4
}		}

define <16 x float> @test_mm512_mask_and_ps(<16 x float> %__W, i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {		define <16 x float> @test_mm512_mask_and_ps(<16 x float> %__W, i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {
; GENERIC-LABEL: test_mm512_mask_and_ps:		; GENERIC-LABEL: test_mm512_mask_and_ps:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
		; GENERIC-NEXT: vandps %zmm1, %zmm2, %zmm1 # sched: [1:1.00]
; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]		; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vandps %zmm1, %zmm2, %zmm0 {%k1} # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm1, %zmm0 {%k1} # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mm512_mask_and_ps:		; SKX-LABEL: test_mm512_mask_and_ps:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
		; SKX-NEXT: vandps %zmm1, %zmm2, %zmm1 # sched: [1:0.50]
; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]		; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]
; SKX-NEXT: vandps %zmm1, %zmm2, %zmm0 {%k1} # sched: [1:0.50]		; SKX-NEXT: vmovaps %zmm1, %zmm0 {%k1} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%0 = bitcast <16 x float> %__A to <16 x i32>		%0 = bitcast <16 x float> %__A to <16 x i32>
%1 = bitcast <16 x float> %__B to <16 x i32>		%1 = bitcast <16 x float> %__B to <16 x i32>
%and.i.i = and <16 x i32> %1, %0		%and.i.i = and <16 x i32> %1, %0
%2 = bitcast <16 x i32> %and.i.i to <16 x float>		%2 = bitcast <16 x i32> %and.i.i to <16 x float>
%3 = bitcast i16 %__U to <16 x i1>		%3 = bitcast i16 %__U to <16 x i1>
%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> %__W		%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> %__W
ret <16 x float> %4		ret <16 x float> %4
}		}

define <16 x float> @test_mm512_maskz_and_ps(i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {		define <16 x float> @test_mm512_maskz_and_ps(i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {
; GENERIC-LABEL: test_mm512_maskz_and_ps:		; GENERIC-LABEL: test_mm512_maskz_and_ps:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
		; GENERIC-NEXT: vandps %zmm0, %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]		; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vandps %zmm0, %zmm1, %zmm0 {%k1} {z} # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mm512_maskz_and_ps:		; SKX-LABEL: test_mm512_maskz_and_ps:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
		; SKX-NEXT: vandps %zmm0, %zmm1, %zmm0 # sched: [1:0.50]
; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]		; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]
; SKX-NEXT: vandps %zmm0, %zmm1, %zmm0 {%k1} {z} # sched: [1:0.50]		; SKX-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%0 = bitcast <16 x float> %__A to <16 x i32>		%0 = bitcast <16 x float> %__A to <16 x i32>
%1 = bitcast <16 x float> %__B to <16 x i32>		%1 = bitcast <16 x float> %__B to <16 x i32>
%and.i.i = and <16 x i32> %1, %0		%and.i.i = and <16 x i32> %1, %0
%2 = bitcast <16 x i32> %and.i.i to <16 x float>		%2 = bitcast <16 x i32> %and.i.i to <16 x float>
%3 = bitcast i16 %__U to <16 x i1>		%3 = bitcast i16 %__U to <16 x i1>
%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> zeroinitializer		%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> zeroinitializer
ret <16 x float> %4		ret <16 x float> %4
}		}

define <8 x double> @test_mm512_mask_andnot_pd(<8 x double> %__W, i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {		define <8 x double> @test_mm512_mask_andnot_pd(<8 x double> %__W, i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {
; GENERIC-LABEL: test_mm512_mask_andnot_pd:		; GENERIC-LABEL: test_mm512_mask_andnot_pd:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
		; GENERIC-NEXT: vandnpd %zmm2, %zmm1, %zmm1 # sched: [1:1.00]
; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]		; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vandnpd %zmm2, %zmm1, %zmm0 {%k1} # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm1, %zmm0 {%k1} # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mm512_mask_andnot_pd:		; SKX-LABEL: test_mm512_mask_andnot_pd:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
		; SKX-NEXT: vandnpd %zmm2, %zmm1, %zmm1 # sched: [1:0.50]
; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]		; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]
; SKX-NEXT: vandnpd %zmm2, %zmm1, %zmm0 {%k1} # sched: [1:0.50]		; SKX-NEXT: vmovapd %zmm1, %zmm0 {%k1} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%0 = bitcast <8 x double> %__A to <8 x i64>		%0 = bitcast <8 x double> %__A to <8 x i64>
%neg.i.i = xor <8 x i64> %0, <i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1>		%neg.i.i = xor <8 x i64> %0, <i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1>
%1 = bitcast <8 x double> %__B to <8 x i64>		%1 = bitcast <8 x double> %__B to <8 x i64>
%and.i.i = and <8 x i64> %1, %neg.i.i		%and.i.i = and <8 x i64> %1, %neg.i.i
%2 = bitcast <8 x i64> %and.i.i to <8 x double>		%2 = bitcast <8 x i64> %and.i.i to <8 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> %__W		%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> %__W
ret <8 x double> %4		ret <8 x double> %4
}		}

define <8 x double> @test_mm512_maskz_andnot_pd(i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {		define <8 x double> @test_mm512_maskz_andnot_pd(i8 zeroext %__U, <8 x double> %__A, <8 x double> %__B) {
; GENERIC-LABEL: test_mm512_maskz_andnot_pd:		; GENERIC-LABEL: test_mm512_maskz_andnot_pd:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
		; GENERIC-NEXT: vandnpd %zmm1, %zmm0, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]		; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vandnpd %zmm1, %zmm0, %zmm0 {%k1} {z} # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm0, %zmm0 {%k1} {z} # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mm512_maskz_andnot_pd:		; SKX-LABEL: test_mm512_maskz_andnot_pd:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
		; SKX-NEXT: vandnpd %zmm1, %zmm0, %zmm0 # sched: [1:0.50]
; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]		; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]
; SKX-NEXT: vandnpd %zmm1, %zmm0, %zmm0 {%k1} {z} # sched: [1:0.50]		; SKX-NEXT: vmovapd %zmm0, %zmm0 {%k1} {z} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%0 = bitcast <8 x double> %__A to <8 x i64>		%0 = bitcast <8 x double> %__A to <8 x i64>
%neg.i.i = xor <8 x i64> %0, <i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1>		%neg.i.i = xor <8 x i64> %0, <i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1>
%1 = bitcast <8 x double> %__B to <8 x i64>		%1 = bitcast <8 x double> %__B to <8 x i64>
%and.i.i = and <8 x i64> %1, %neg.i.i		%and.i.i = and <8 x i64> %1, %neg.i.i
%2 = bitcast <8 x i64> %and.i.i to <8 x double>		%2 = bitcast <8 x i64> %and.i.i to <8 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> zeroinitializer		%4 = select <8 x i1> %3, <8 x double> %2, <8 x double> zeroinitializer
ret <8 x double> %4		ret <8 x double> %4
}		}

define <16 x float> @test_mm512_mask_andnot_ps(<16 x float> %__W, i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {		define <16 x float> @test_mm512_mask_andnot_ps(<16 x float> %__W, i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {
; GENERIC-LABEL: test_mm512_mask_andnot_ps:		; GENERIC-LABEL: test_mm512_mask_andnot_ps:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
		; GENERIC-NEXT: vandnps %zmm2, %zmm1, %zmm1 # sched: [1:1.00]
; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]		; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vandnps %zmm2, %zmm1, %zmm0 {%k1} # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm1, %zmm0 {%k1} # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mm512_mask_andnot_ps:		; SKX-LABEL: test_mm512_mask_andnot_ps:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
		; SKX-NEXT: vandnps %zmm2, %zmm1, %zmm1 # sched: [1:0.50]
; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]		; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]
; SKX-NEXT: vandnps %zmm2, %zmm1, %zmm0 {%k1} # sched: [1:0.50]		; SKX-NEXT: vmovaps %zmm1, %zmm0 {%k1} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%0 = bitcast <16 x float> %__A to <16 x i32>		%0 = bitcast <16 x float> %__A to <16 x i32>
%neg.i.i = xor <16 x i32> %0, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>		%neg.i.i = xor <16 x i32> %0, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>
%1 = bitcast <16 x float> %__B to <16 x i32>		%1 = bitcast <16 x float> %__B to <16 x i32>
%and.i.i = and <16 x i32> %1, %neg.i.i		%and.i.i = and <16 x i32> %1, %neg.i.i
%2 = bitcast <16 x i32> %and.i.i to <16 x float>		%2 = bitcast <16 x i32> %and.i.i to <16 x float>
%3 = bitcast i16 %__U to <16 x i1>		%3 = bitcast i16 %__U to <16 x i1>
%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> %__W		%4 = select <16 x i1> %3, <16 x float> %2, <16 x float> %__W
ret <16 x float> %4		ret <16 x float> %4
}		}

define <16 x float> @test_mm512_maskz_andnot_ps(i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {		define <16 x float> @test_mm512_maskz_andnot_ps(i16 zeroext %__U, <16 x float> %__A, <16 x float> %__B) {
; GENERIC-LABEL: test_mm512_maskz_andnot_ps:		; GENERIC-LABEL: test_mm512_maskz_andnot_ps:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
		; GENERIC-NEXT: vandnps %zmm1, %zmm0, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]		; GENERIC-NEXT: kmovd %edi, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vandnps %zmm1, %zmm0, %zmm0 {%k1} {z} # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mm512_maskz_andnot_ps:		; SKX-LABEL: test_mm512_maskz_andnot_ps:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
		; SKX-NEXT: vandnps %zmm1, %zmm0, %zmm0 # sched: [1:0.50]
; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]		; SKX-NEXT: kmovd %edi, %k1 # sched: [1:1.00]
; SKX-NEXT: vandnps %zmm1, %zmm0, %zmm0 {%k1} {z} # sched: [1:0.50]		; SKX-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%0 = bitcast <16 x float> %__A to <16 x i32>		%0 = bitcast <16 x float> %__A to <16 x i32>
%neg.i.i = xor <16 x i32> %0, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>		%neg.i.i = xor <16 x i32> %0, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>
%1 = bitcast <16 x float> %__B to <16 x i32>		%1 = bitcast <16 x float> %__B to <16 x i32>
%and.i.i = and <16 x i32> %1, %neg.i.i		%and.i.i = and <16 x i32> %1, %neg.i.i
%2 = bitcast <16 x i32> %and.i.i to <16 x float>		%2 = bitcast <16 x i32> %and.i.i to <16 x float>
%3 = bitcast i16 %__U to <16 x i1>		%3 = bitcast i16 %__U to <16 x i1>
▲ Show 20 Lines • Show All 2,890 Lines • Show Last 20 Lines

test/CodeGen/X86/avx512-select.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=i686-unknown-unknown -mcpu=knl \| FileCheck %s --check-prefix=X86			; RUN: llc < %s -mtriple=i686-unknown-unknown -mcpu=knl \| FileCheck %s --check-prefix=X86
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mcpu=knl \| FileCheck %s --check-prefix=X64			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mcpu=knl \| FileCheck %s --check-prefix=X64

	define <16 x i32> @select00(i32 %a, <16 x i32> %b) nounwind {			define <16 x i32> @select00(i32 %a, <16 x i32> %b) nounwind {
	; X86-LABEL: select00:			; X86-LABEL: select00:
	; X86: # %bb.0:			; X86: # %bb.0:
	; X86-NEXT: cmpl $255, {{[0-9]+}}(%esp)			; X86-NEXT: cmpl $255, {{[0-9]+}}(%esp)
	; X86-NEXT: vpxor %xmm1, %xmm1, %xmm1			; X86-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; X86-NEXT: je .LBB0_2			; X86-NEXT: je .LBB0_2
	; X86-NEXT: # %bb.1:			; X86-NEXT: # %bb.1:
	; X86-NEXT: vmovdqa64 %zmm0, %zmm1			; X86-NEXT: vmovdqa64 %zmm0, %zmm1
	; X86-NEXT: .LBB0_2:			; X86-NEXT: .LBB0_2:
	; X86-NEXT: vpxorq %zmm1, %zmm0, %zmm0			; X86-NEXT: vpxord %zmm1, %zmm0, %zmm0
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: select00:			; X64-LABEL: select00:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: vpxor %xmm1, %xmm1, %xmm1			; X64-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; X64-NEXT: cmpl $255, %edi			; X64-NEXT: cmpl $255, %edi
	; X64-NEXT: je .LBB0_2			; X64-NEXT: je .LBB0_2
	; X64-NEXT: # %bb.1:			; X64-NEXT: # %bb.1:
	; X64-NEXT: vmovdqa64 %zmm0, %zmm1			; X64-NEXT: vmovdqa64 %zmm0, %zmm1
	; X64-NEXT: .LBB0_2:			; X64-NEXT: .LBB0_2:
	; X64-NEXT: vpxorq %zmm1, %zmm0, %zmm0			; X64-NEXT: vpxord %zmm1, %zmm0, %zmm0
	; X64-NEXT: retq			; X64-NEXT: retq
	%cmpres = icmp eq i32 %a, 255			%cmpres = icmp eq i32 %a, 255
	%selres = select i1 %cmpres, <16 x i32> zeroinitializer, <16 x i32> %b			%selres = select i1 %cmpres, <16 x i32> zeroinitializer, <16 x i32> %b
	%res = xor <16 x i32> %b, %selres			%res = xor <16 x i32> %b, %selres
	ret <16 x i32> %res			ret <16 x i32> %res
	}			}

	define <8 x i64> @select01(i32 %a, <8 x i64> %b) nounwind {			define <8 x i64> @select01(i32 %a, <8 x i64> %b) nounwind {
	▲ Show 20 Lines • Show All 315 Lines • Show Last 20 Lines

test/CodeGen/X86/avx512bw-intrinsics-fast-isel.ll

Show First 20 Lines • Show All 556 Lines • ▼ Show 20 Lines	; X64-NEXT: retq
%res1 = select <32 x i1> %arg0, <32 x i16> %res0, <32 x i16> zeroinitializer		%res1 = select <32 x i1> %arg0, <32 x i16> %res0, <32 x i16> zeroinitializer
%res2 = bitcast <32 x i16> %res1 to <8 x i64>		%res2 = bitcast <32 x i16> %res1 to <8 x i64>
ret <8 x i64> %res2		ret <8 x i64> %res2
}		}

define i64 @test_mm512_test_epi8_mask(<8 x i64> %__A, <8 x i64> %__B) {		define i64 @test_mm512_test_epi8_mask(<8 x i64> %__A, <8 x i64> %__B) {
; X86-LABEL: test_mm512_test_epi8_mask:		; X86-LABEL: test_mm512_test_epi8_mask:
; X86: # %bb.0: # %entry		; X86: # %bb.0: # %entry
; X86-NEXT: vptestmb %zmm0, %zmm1, %k0		; X86-NEXT: vpandq %zmm0, %zmm1, %zmm0
		; X86-NEXT: vptestmb %zmm0, %zmm0, %k0
; X86-NEXT: kshiftrq $32, %k0, %k1		; X86-NEXT: kshiftrq $32, %k0, %k1
; X86-NEXT: kmovd %k0, %eax		; X86-NEXT: kmovd %k0, %eax
; X86-NEXT: kmovd %k1, %edx		; X86-NEXT: kmovd %k1, %edx
; X86-NEXT: vzeroupper		; X86-NEXT: vzeroupper
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: test_mm512_test_epi8_mask:		; X64-LABEL: test_mm512_test_epi8_mask:
; X64: # %bb.0: # %entry		; X64: # %bb.0: # %entry
; X64-NEXT: vptestmb %zmm0, %zmm1, %k0		; X64-NEXT: vpandq %zmm0, %zmm1, %zmm0
		; X64-NEXT: vptestmb %zmm0, %zmm0, %k0
; X64-NEXT: kmovq %k0, %rax		; X64-NEXT: kmovq %k0, %rax
; X64-NEXT: vzeroupper		; X64-NEXT: vzeroupper
; X64-NEXT: retq		; X64-NEXT: retq
entry:		entry:
%and1.i.i = and <8 x i64> %__B, %__A		%and1.i.i = and <8 x i64> %__B, %__A
%0 = bitcast <8 x i64> %and1.i.i to <64 x i8>		%0 = bitcast <8 x i64> %and1.i.i to <64 x i8>
%1 = icmp ne <64 x i8> %0, zeroinitializer		%1 = icmp ne <64 x i8> %0, zeroinitializer
%2 = bitcast <64 x i1> %1 to i64		%2 = bitcast <64 x i1> %1 to i64
ret i64 %2		ret i64 %2
}		}

define i64 @test_mm512_mask_test_epi8_mask(i64 %__U, <8 x i64> %__A, <8 x i64> %__B) {		define i64 @test_mm512_mask_test_epi8_mask(i64 %__U, <8 x i64> %__A, <8 x i64> %__B) {
; X86-LABEL: test_mm512_mask_test_epi8_mask:		; X86-LABEL: test_mm512_mask_test_epi8_mask:
; X86: # %bb.0: # %entry		; X86: # %bb.0: # %entry
; X86-NEXT: vptestmb %zmm0, %zmm1, %k0		; X86-NEXT: vpandq %zmm0, %zmm1, %zmm0
		; X86-NEXT: vptestmb %zmm0, %zmm0, %k0
; X86-NEXT: kshiftrq $32, %k0, %k1		; X86-NEXT: kshiftrq $32, %k0, %k1
; X86-NEXT: kmovd %k1, %edx		; X86-NEXT: kmovd %k1, %edx
; X86-NEXT: kmovd %k0, %eax		; X86-NEXT: kmovd %k0, %eax
; X86-NEXT: andl {{[0-9]+}}(%esp), %eax		; X86-NEXT: andl {{[0-9]+}}(%esp), %eax
; X86-NEXT: andl {{[0-9]+}}(%esp), %edx		; X86-NEXT: andl {{[0-9]+}}(%esp), %edx
; X86-NEXT: vzeroupper		; X86-NEXT: vzeroupper
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: test_mm512_mask_test_epi8_mask:		; X64-LABEL: test_mm512_mask_test_epi8_mask:
; X64: # %bb.0: # %entry		; X64: # %bb.0: # %entry
		; X64-NEXT: vpandq %zmm0, %zmm1, %zmm0
; X64-NEXT: kmovq %rdi, %k1		; X64-NEXT: kmovq %rdi, %k1
; X64-NEXT: vptestmb %zmm0, %zmm1, %k0 {%k1}		; X64-NEXT: vptestmb %zmm0, %zmm0, %k0 {%k1}
; X64-NEXT: kmovq %k0, %rax		; X64-NEXT: kmovq %k0, %rax
; X64-NEXT: vzeroupper		; X64-NEXT: vzeroupper
; X64-NEXT: retq		; X64-NEXT: retq
entry:		entry:
%and1.i.i = and <8 x i64> %__B, %__A		%and1.i.i = and <8 x i64> %__B, %__A
%0 = bitcast <8 x i64> %and1.i.i to <64 x i8>		%0 = bitcast <8 x i64> %and1.i.i to <64 x i8>
%1 = icmp ne <64 x i8> %0, zeroinitializer		%1 = icmp ne <64 x i8> %0, zeroinitializer
%2 = bitcast i64 %__U to <64 x i1>		%2 = bitcast i64 %__U to <64 x i1>
%3 = and <64 x i1> %1, %2		%3 = and <64 x i1> %1, %2
%4 = bitcast <64 x i1> %3 to i64		%4 = bitcast <64 x i1> %3 to i64
ret i64 %4		ret i64 %4
}		}

define i32 @test_mm512_test_epi16_mask(<8 x i64> %__A, <8 x i64> %__B) {		define i32 @test_mm512_test_epi16_mask(<8 x i64> %__A, <8 x i64> %__B) {
; CHECK-LABEL: test_mm512_test_epi16_mask:		; CHECK-LABEL: test_mm512_test_epi16_mask:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vptestmw %zmm0, %zmm1, %k0		; CHECK-NEXT: vpandq %zmm0, %zmm1, %zmm0
		; CHECK-NEXT: vptestmw %zmm0, %zmm0, %k0
; CHECK-NEXT: kmovd %k0, %eax		; CHECK-NEXT: kmovd %k0, %eax
; CHECK-NEXT: vzeroupper		; CHECK-NEXT: vzeroupper
; CHECK-NEXT: ret{{[l\|q]}}		; CHECK-NEXT: ret{{[l\|q]}}
entry:		entry:
%and1.i.i = and <8 x i64> %__B, %__A		%and1.i.i = and <8 x i64> %__B, %__A
%0 = bitcast <8 x i64> %and1.i.i to <32 x i16>		%0 = bitcast <8 x i64> %and1.i.i to <32 x i16>
%1 = icmp ne <32 x i16> %0, zeroinitializer		%1 = icmp ne <32 x i16> %0, zeroinitializer
%2 = bitcast <32 x i1> %1 to i32		%2 = bitcast <32 x i1> %1 to i32
ret i32 %2		ret i32 %2
}		}

define i32 @test_mm512_mask_test_epi16_mask(i32 %__U, <8 x i64> %__A, <8 x i64> %__B) {		define i32 @test_mm512_mask_test_epi16_mask(i32 %__U, <8 x i64> %__A, <8 x i64> %__B) {
; X86-LABEL: test_mm512_mask_test_epi16_mask:		; X86-LABEL: test_mm512_mask_test_epi16_mask:
; X86: # %bb.0: # %entry		; X86: # %bb.0: # %entry
; X86-NEXT: kmovd {{[0-9]+}}(%esp), %k1		; X86-NEXT: kmovd {{[0-9]+}}(%esp), %k1
; X86-NEXT: vptestmw %zmm0, %zmm1, %k0 {%k1}		; X86-NEXT: vpandq %zmm0, %zmm1, %zmm0
		; X86-NEXT: vptestmw %zmm0, %zmm0, %k0 {%k1}
; X86-NEXT: kmovd %k0, %eax		; X86-NEXT: kmovd %k0, %eax
; X86-NEXT: vzeroupper		; X86-NEXT: vzeroupper
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: test_mm512_mask_test_epi16_mask:		; X64-LABEL: test_mm512_mask_test_epi16_mask:
; X64: # %bb.0: # %entry		; X64: # %bb.0: # %entry
		; X64-NEXT: vpandq %zmm0, %zmm1, %zmm0
; X64-NEXT: kmovd %edi, %k1		; X64-NEXT: kmovd %edi, %k1
; X64-NEXT: vptestmw %zmm0, %zmm1, %k0 {%k1}		; X64-NEXT: vptestmw %zmm0, %zmm0, %k0 {%k1}
; X64-NEXT: kmovd %k0, %eax		; X64-NEXT: kmovd %k0, %eax
; X64-NEXT: vzeroupper		; X64-NEXT: vzeroupper
; X64-NEXT: retq		; X64-NEXT: retq
entry:		entry:
%and1.i.i = and <8 x i64> %__B, %__A		%and1.i.i = and <8 x i64> %__B, %__A
%0 = bitcast <8 x i64> %and1.i.i to <32 x i16>		%0 = bitcast <8 x i64> %and1.i.i to <32 x i16>
%1 = icmp ne <32 x i16> %0, zeroinitializer		%1 = icmp ne <32 x i16> %0, zeroinitializer
%2 = bitcast i32 %__U to <32 x i1>		%2 = bitcast i32 %__U to <32 x i1>
%3 = and <32 x i1> %1, %2		%3 = and <32 x i1> %1, %2
%4 = bitcast <32 x i1> %3 to i32		%4 = bitcast <32 x i1> %3 to i32
ret i32 %4		ret i32 %4
}		}

define i64 @test_mm512_testn_epi8_mask(<8 x i64> %__A, <8 x i64> %__B) {		define i64 @test_mm512_testn_epi8_mask(<8 x i64> %__A, <8 x i64> %__B) {
; X86-LABEL: test_mm512_testn_epi8_mask:		; X86-LABEL: test_mm512_testn_epi8_mask:
; X86: # %bb.0: # %entry		; X86: # %bb.0: # %entry
; X86-NEXT: vptestnmb %zmm0, %zmm1, %k0		; X86-NEXT: vpandq %zmm0, %zmm1, %zmm0
		; X86-NEXT: vptestnmb %zmm0, %zmm0, %k0
; X86-NEXT: kshiftrq $32, %k0, %k1		; X86-NEXT: kshiftrq $32, %k0, %k1
; X86-NEXT: kmovd %k0, %eax		; X86-NEXT: kmovd %k0, %eax
; X86-NEXT: kmovd %k1, %edx		; X86-NEXT: kmovd %k1, %edx
; X86-NEXT: vzeroupper		; X86-NEXT: vzeroupper
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: test_mm512_testn_epi8_mask:		; X64-LABEL: test_mm512_testn_epi8_mask:
; X64: # %bb.0: # %entry		; X64: # %bb.0: # %entry
; X64-NEXT: vptestnmb %zmm0, %zmm1, %k0		; X64-NEXT: vpandq %zmm0, %zmm1, %zmm0
		; X64-NEXT: vptestnmb %zmm0, %zmm0, %k0
; X64-NEXT: kmovq %k0, %rax		; X64-NEXT: kmovq %k0, %rax
; X64-NEXT: vzeroupper		; X64-NEXT: vzeroupper
; X64-NEXT: retq		; X64-NEXT: retq
entry:		entry:
%and1.i.i = and <8 x i64> %__B, %__A		%and1.i.i = and <8 x i64> %__B, %__A
%0 = bitcast <8 x i64> %and1.i.i to <64 x i8>		%0 = bitcast <8 x i64> %and1.i.i to <64 x i8>
%1 = icmp eq <64 x i8> %0, zeroinitializer		%1 = icmp eq <64 x i8> %0, zeroinitializer
%2 = bitcast <64 x i1> %1 to i64		%2 = bitcast <64 x i1> %1 to i64
ret i64 %2		ret i64 %2
}		}

define i64 @test_mm512_mask_testn_epi8_mask(i64 %__U, <8 x i64> %__A, <8 x i64> %__B) {		define i64 @test_mm512_mask_testn_epi8_mask(i64 %__U, <8 x i64> %__A, <8 x i64> %__B) {
; X86-LABEL: test_mm512_mask_testn_epi8_mask:		; X86-LABEL: test_mm512_mask_testn_epi8_mask:
; X86: # %bb.0: # %entry		; X86: # %bb.0: # %entry
; X86-NEXT: vptestnmb %zmm0, %zmm1, %k0		; X86-NEXT: vpandq %zmm0, %zmm1, %zmm0
		; X86-NEXT: vptestnmb %zmm0, %zmm0, %k0
; X86-NEXT: kshiftrq $32, %k0, %k1		; X86-NEXT: kshiftrq $32, %k0, %k1
; X86-NEXT: kmovd %k1, %edx		; X86-NEXT: kmovd %k1, %edx
; X86-NEXT: kmovd %k0, %eax		; X86-NEXT: kmovd %k0, %eax
; X86-NEXT: andl {{[0-9]+}}(%esp), %eax		; X86-NEXT: andl {{[0-9]+}}(%esp), %eax
; X86-NEXT: andl {{[0-9]+}}(%esp), %edx		; X86-NEXT: andl {{[0-9]+}}(%esp), %edx
; X86-NEXT: vzeroupper		; X86-NEXT: vzeroupper
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: test_mm512_mask_testn_epi8_mask:		; X64-LABEL: test_mm512_mask_testn_epi8_mask:
; X64: # %bb.0: # %entry		; X64: # %bb.0: # %entry
		; X64-NEXT: vpandq %zmm0, %zmm1, %zmm0
; X64-NEXT: kmovq %rdi, %k1		; X64-NEXT: kmovq %rdi, %k1
; X64-NEXT: vptestnmb %zmm0, %zmm1, %k0 {%k1}		; X64-NEXT: vptestnmb %zmm0, %zmm0, %k0 {%k1}
; X64-NEXT: kmovq %k0, %rax		; X64-NEXT: kmovq %k0, %rax
; X64-NEXT: vzeroupper		; X64-NEXT: vzeroupper
; X64-NEXT: retq		; X64-NEXT: retq
entry:		entry:
%and1.i.i = and <8 x i64> %__B, %__A		%and1.i.i = and <8 x i64> %__B, %__A
%0 = bitcast <8 x i64> %and1.i.i to <64 x i8>		%0 = bitcast <8 x i64> %and1.i.i to <64 x i8>
%1 = icmp eq <64 x i8> %0, zeroinitializer		%1 = icmp eq <64 x i8> %0, zeroinitializer
%2 = bitcast i64 %__U to <64 x i1>		%2 = bitcast i64 %__U to <64 x i1>
%3 = and <64 x i1> %1, %2		%3 = and <64 x i1> %1, %2
%4 = bitcast <64 x i1> %3 to i64		%4 = bitcast <64 x i1> %3 to i64
ret i64 %4		ret i64 %4
}		}

define i32 @test_mm512_testn_epi16_mask(<8 x i64> %__A, <8 x i64> %__B) {		define i32 @test_mm512_testn_epi16_mask(<8 x i64> %__A, <8 x i64> %__B) {
; CHECK-LABEL: test_mm512_testn_epi16_mask:		; CHECK-LABEL: test_mm512_testn_epi16_mask:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vptestnmw %zmm0, %zmm1, %k0		; CHECK-NEXT: vpandq %zmm0, %zmm1, %zmm0
		; CHECK-NEXT: vptestnmw %zmm0, %zmm0, %k0
; CHECK-NEXT: kmovd %k0, %eax		; CHECK-NEXT: kmovd %k0, %eax
; CHECK-NEXT: vzeroupper		; CHECK-NEXT: vzeroupper
; CHECK-NEXT: ret{{[l\|q]}}		; CHECK-NEXT: ret{{[l\|q]}}
entry:		entry:
%and1.i.i = and <8 x i64> %__B, %__A		%and1.i.i = and <8 x i64> %__B, %__A
%0 = bitcast <8 x i64> %and1.i.i to <32 x i16>		%0 = bitcast <8 x i64> %and1.i.i to <32 x i16>
%1 = icmp eq <32 x i16> %0, zeroinitializer		%1 = icmp eq <32 x i16> %0, zeroinitializer
%2 = bitcast <32 x i1> %1 to i32		%2 = bitcast <32 x i1> %1 to i32
ret i32 %2		ret i32 %2
}		}

define i32 @test_mm512_mask_testn_epi16_mask(i32 %__U, <8 x i64> %__A, <8 x i64> %__B) {		define i32 @test_mm512_mask_testn_epi16_mask(i32 %__U, <8 x i64> %__A, <8 x i64> %__B) {
; X86-LABEL: test_mm512_mask_testn_epi16_mask:		; X86-LABEL: test_mm512_mask_testn_epi16_mask:
; X86: # %bb.0: # %entry		; X86: # %bb.0: # %entry
; X86-NEXT: kmovd {{[0-9]+}}(%esp), %k1		; X86-NEXT: kmovd {{[0-9]+}}(%esp), %k1
; X86-NEXT: vptestnmw %zmm0, %zmm1, %k0 {%k1}		; X86-NEXT: vpandq %zmm0, %zmm1, %zmm0
		; X86-NEXT: vptestnmw %zmm0, %zmm0, %k0 {%k1}
; X86-NEXT: kmovd %k0, %eax		; X86-NEXT: kmovd %k0, %eax
; X86-NEXT: vzeroupper		; X86-NEXT: vzeroupper
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: test_mm512_mask_testn_epi16_mask:		; X64-LABEL: test_mm512_mask_testn_epi16_mask:
; X64: # %bb.0: # %entry		; X64: # %bb.0: # %entry
		; X64-NEXT: vpandq %zmm0, %zmm1, %zmm0
; X64-NEXT: kmovd %edi, %k1		; X64-NEXT: kmovd %edi, %k1
; X64-NEXT: vptestnmw %zmm0, %zmm1, %k0 {%k1}		; X64-NEXT: vptestnmw %zmm0, %zmm0, %k0 {%k1}
; X64-NEXT: kmovd %k0, %eax		; X64-NEXT: kmovd %k0, %eax
; X64-NEXT: vzeroupper		; X64-NEXT: vzeroupper
; X64-NEXT: retq		; X64-NEXT: retq
entry:		entry:
%and1.i.i = and <8 x i64> %__B, %__A		%and1.i.i = and <8 x i64> %__B, %__A
%0 = bitcast <8 x i64> %and1.i.i to <32 x i16>		%0 = bitcast <8 x i64> %and1.i.i to <32 x i16>
%1 = icmp eq <32 x i16> %0, zeroinitializer		%1 = icmp eq <32 x i16> %0, zeroinitializer
%2 = bitcast i32 %__U to <32 x i1>		%2 = bitcast i32 %__U to <32 x i1>
▲ Show 20 Lines • Show All 149 Lines • Show Last 20 Lines

test/CodeGen/X86/avx512bw-vec-test-testn.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw \| FileCheck %s			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw \| FileCheck %s

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define zeroext i32 @TEST_mm512_test_epi16_mask(<8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {			define zeroext i32 @TEST_mm512_test_epi16_mask(<8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm512_test_epi16_mask:			; CHECK-LABEL: TEST_mm512_test_epi16_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestmw %zmm0, %zmm1, %k0			; CHECK-NEXT: vpandq %zmm0, %zmm1, %zmm0
				; CHECK-NEXT: vptestmw %zmm0, %zmm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: vzeroupper			; CHECK-NEXT: vzeroupper
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <8 x i64> %__B, %__A			%and.i.i = and <8 x i64> %__B, %__A
	%0 = bitcast <8 x i64> %and.i.i to <32 x i16>			%0 = bitcast <8 x i64> %and.i.i to <32 x i16>
	%1 = icmp ne <32 x i16> %0, zeroinitializer			%1 = icmp ne <32 x i16> %0, zeroinitializer
	%2 = bitcast <32 x i1> %1 to i32			%2 = bitcast <32 x i1> %1 to i32
	ret i32 %2			ret i32 %2
	}			}


	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define zeroext i64 @TEST_mm512_test_epi8_mask(<8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {			define zeroext i64 @TEST_mm512_test_epi8_mask(<8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm512_test_epi8_mask:			; CHECK-LABEL: TEST_mm512_test_epi8_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestmb %zmm0, %zmm1, %k0			; CHECK-NEXT: vpandq %zmm0, %zmm1, %zmm0
				; CHECK-NEXT: vptestmb %zmm0, %zmm0, %k0
	; CHECK-NEXT: kmovq %k0, %rax			; CHECK-NEXT: kmovq %k0, %rax
	; CHECK-NEXT: vzeroupper			; CHECK-NEXT: vzeroupper
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <8 x i64> %__B, %__A			%and.i.i = and <8 x i64> %__B, %__A
	%0 = bitcast <8 x i64> %and.i.i to <64 x i8>			%0 = bitcast <8 x i64> %and.i.i to <64 x i8>
	%1 = icmp ne <64 x i8> %0, zeroinitializer			%1 = icmp ne <64 x i8> %0, zeroinitializer
	%2 = bitcast <64 x i1> %1 to i64			%2 = bitcast <64 x i1> %1 to i64
	ret i64 %2			ret i64 %2
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define zeroext i32 @TEST_mm512_mask_test_epi16_mask(i32 %__U, <8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {			define zeroext i32 @TEST_mm512_mask_test_epi16_mask(i32 %__U, <8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm512_mask_test_epi16_mask:			; CHECK-LABEL: TEST_mm512_mask_test_epi16_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestmw %zmm0, %zmm1, %k0			; CHECK-NEXT: vpandq %zmm0, %zmm1, %zmm0
				; CHECK-NEXT: vptestmw %zmm0, %zmm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: andl %edi, %eax			; CHECK-NEXT: andl %edi, %eax
	; CHECK-NEXT: vzeroupper			; CHECK-NEXT: vzeroupper
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <8 x i64> %__B, %__A			%and.i.i = and <8 x i64> %__B, %__A
	%0 = bitcast <8 x i64> %and.i.i to <32 x i16>			%0 = bitcast <8 x i64> %and.i.i to <32 x i16>
	%1 = icmp ne <32 x i16> %0, zeroinitializer			%1 = icmp ne <32 x i16> %0, zeroinitializer
	%2 = bitcast i32 %__U to <32 x i1>			%2 = bitcast i32 %__U to <32 x i1>
	%3 = and <32 x i1> %1, %2			%3 = and <32 x i1> %1, %2
	%4 = bitcast <32 x i1> %3 to i32			%4 = bitcast <32 x i1> %3 to i32
	ret i32 %4			ret i32 %4
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define zeroext i64 @TEST_mm512_mask_test_epi8_mask(i64 %__U, <8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {			define zeroext i64 @TEST_mm512_mask_test_epi8_mask(i64 %__U, <8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm512_mask_test_epi8_mask:			; CHECK-LABEL: TEST_mm512_mask_test_epi8_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestmb %zmm0, %zmm1, %k0			; CHECK-NEXT: vpandq %zmm0, %zmm1, %zmm0
				; CHECK-NEXT: vptestmb %zmm0, %zmm0, %k0
	; CHECK-NEXT: kmovq %k0, %rax			; CHECK-NEXT: kmovq %k0, %rax
	; CHECK-NEXT: andq %rdi, %rax			; CHECK-NEXT: andq %rdi, %rax
	; CHECK-NEXT: vzeroupper			; CHECK-NEXT: vzeroupper
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <8 x i64> %__B, %__A			%and.i.i = and <8 x i64> %__B, %__A
	%0 = bitcast <8 x i64> %and.i.i to <64 x i8>			%0 = bitcast <8 x i64> %and.i.i to <64 x i8>
	%1 = icmp ne <64 x i8> %0, zeroinitializer			%1 = icmp ne <64 x i8> %0, zeroinitializer
	%2 = bitcast i64 %__U to <64 x i1>			%2 = bitcast i64 %__U to <64 x i1>
	%3 = and <64 x i1> %1, %2			%3 = and <64 x i1> %1, %2
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define zeroext i32 @TEST_mm512_testn_epi16_mask(<8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {			define zeroext i32 @TEST_mm512_testn_epi16_mask(<8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm512_testn_epi16_mask:			; CHECK-LABEL: TEST_mm512_testn_epi16_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestnmw %zmm0, %zmm1, %k0			; CHECK-NEXT: vpandq %zmm0, %zmm1, %zmm0
				; CHECK-NEXT: vptestnmw %zmm0, %zmm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: vzeroupper			; CHECK-NEXT: vzeroupper
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <8 x i64> %__B, %__A			%and.i.i = and <8 x i64> %__B, %__A
	%0 = bitcast <8 x i64> %and.i.i to <32 x i16>			%0 = bitcast <8 x i64> %and.i.i to <32 x i16>
	%1 = icmp eq <32 x i16> %0, zeroinitializer			%1 = icmp eq <32 x i16> %0, zeroinitializer
	%2 = bitcast <32 x i1> %1 to i32			%2 = bitcast <32 x i1> %1 to i32
	ret i32 %2			ret i32 %2
	}			}


	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define zeroext i64 @TEST_mm512_testn_epi8_mask(<8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {			define zeroext i64 @TEST_mm512_testn_epi8_mask(<8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm512_testn_epi8_mask:			; CHECK-LABEL: TEST_mm512_testn_epi8_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestnmb %zmm0, %zmm1, %k0			; CHECK-NEXT: vpandq %zmm0, %zmm1, %zmm0
				; CHECK-NEXT: vptestnmb %zmm0, %zmm0, %k0
	; CHECK-NEXT: kmovq %k0, %rax			; CHECK-NEXT: kmovq %k0, %rax
	; CHECK-NEXT: vzeroupper			; CHECK-NEXT: vzeroupper
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <8 x i64> %__B, %__A			%and.i.i = and <8 x i64> %__B, %__A
	%0 = bitcast <8 x i64> %and.i.i to <64 x i8>			%0 = bitcast <8 x i64> %and.i.i to <64 x i8>
	%1 = icmp eq <64 x i8> %0, zeroinitializer			%1 = icmp eq <64 x i8> %0, zeroinitializer
	%2 = bitcast <64 x i1> %1 to i64			%2 = bitcast <64 x i1> %1 to i64
	ret i64 %2			ret i64 %2
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define zeroext i32 @TEST_mm512_mask_testn_epi16_mask(i32 %__U, <8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {			define zeroext i32 @TEST_mm512_mask_testn_epi16_mask(i32 %__U, <8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm512_mask_testn_epi16_mask:			; CHECK-LABEL: TEST_mm512_mask_testn_epi16_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestnmw %zmm0, %zmm1, %k0			; CHECK-NEXT: vpandq %zmm0, %zmm1, %zmm0
				; CHECK-NEXT: vptestnmw %zmm0, %zmm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: andl %edi, %eax			; CHECK-NEXT: andl %edi, %eax
	; CHECK-NEXT: vzeroupper			; CHECK-NEXT: vzeroupper
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <8 x i64> %__B, %__A			%and.i.i = and <8 x i64> %__B, %__A
	%0 = bitcast <8 x i64> %and.i.i to <32 x i16>			%0 = bitcast <8 x i64> %and.i.i to <32 x i16>
	%1 = icmp eq <32 x i16> %0, zeroinitializer			%1 = icmp eq <32 x i16> %0, zeroinitializer
	%2 = bitcast i32 %__U to <32 x i1>			%2 = bitcast i32 %__U to <32 x i1>
	%3 = and <32 x i1> %1, %2			%3 = and <32 x i1> %1, %2
	%4 = bitcast <32 x i1> %3 to i32			%4 = bitcast <32 x i1> %3 to i32
	ret i32 %4			ret i32 %4
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define zeroext i64 @TEST_mm512_mask_testn_epi8_mask(i64 %__U, <8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {			define zeroext i64 @TEST_mm512_mask_testn_epi8_mask(i64 %__U, <8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm512_mask_testn_epi8_mask:			; CHECK-LABEL: TEST_mm512_mask_testn_epi8_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestnmb %zmm0, %zmm1, %k0			; CHECK-NEXT: vpandq %zmm0, %zmm1, %zmm0
				; CHECK-NEXT: vptestnmb %zmm0, %zmm0, %k0
	; CHECK-NEXT: kmovq %k0, %rax			; CHECK-NEXT: kmovq %k0, %rax
	; CHECK-NEXT: andq %rdi, %rax			; CHECK-NEXT: andq %rdi, %rax
	; CHECK-NEXT: vzeroupper			; CHECK-NEXT: vzeroupper
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <8 x i64> %__B, %__A			%and.i.i = and <8 x i64> %__B, %__A
	%0 = bitcast <8 x i64> %and.i.i to <64 x i8>			%0 = bitcast <8 x i64> %and.i.i to <64 x i8>
	%1 = icmp eq <64 x i8> %0, zeroinitializer			%1 = icmp eq <64 x i8> %0, zeroinitializer
	%2 = bitcast i64 %__U to <64 x i1>			%2 = bitcast i64 %__U to <64 x i1>
	%3 = and <64 x i1> %1, %2			%3 = and <64 x i1> %1, %2
	%4 = bitcast <64 x i1> %3 to i64			%4 = bitcast <64 x i1> %3 to i64
	ret i64 %4			ret i64 %4
	}			}

test/CodeGen/X86/avx512bwvl-intrinsics-fast-isel.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -fast-isel -mtriple=i386-unknown-unknown -mattr=+avx512f,+avx512bw,+avx512vl \| FileCheck %s --check-prefixes=CHECK,X86			; RUN: llc < %s -fast-isel -mtriple=i386-unknown-unknown -mattr=+avx512f,+avx512bw,+avx512vl \| FileCheck %s --check-prefixes=CHECK,X86
	; RUN: llc < %s -fast-isel -mtriple=x86_64-unknown-unknown -mattr=+avx512f,+avx512bw,+avx512vl \| FileCheck %s --check-prefixes=CHECK,X64			; RUN: llc < %s -fast-isel -mtriple=x86_64-unknown-unknown -mattr=+avx512f,+avx512bw,+avx512vl \| FileCheck %s --check-prefixes=CHECK,X64

	; NOTE: This should use IR equivalent to what is generated by clang/test/CodeGen/avx512vlbw-builtins.c			; NOTE: This should use IR equivalent to what is generated by clang/test/CodeGen/avx512vlbw-builtins.c

	define zeroext i16 @test_mm_test_epi8_mask(<2 x i64> %__A, <2 x i64> %__B) {			define zeroext i16 @test_mm_test_epi8_mask(<2 x i64> %__A, <2 x i64> %__B) {
	; CHECK-LABEL: test_mm_test_epi8_mask:			; CHECK-LABEL: test_mm_test_epi8_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestmb %xmm0, %xmm1, %k0			; CHECK-NEXT: vpand %xmm0, %xmm1, %xmm0
				; CHECK-NEXT: vptestmb %xmm0, %xmm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: movzwl %ax, %eax			; CHECK-NEXT: movzwl %ax, %eax
	; CHECK-NEXT: ret{{[l\|q]}}			; CHECK-NEXT: ret{{[l\|q]}}
	entry:			entry:
	%and.i.i = and <2 x i64> %__B, %__A			%and.i.i = and <2 x i64> %__B, %__A
	%0 = bitcast <2 x i64> %and.i.i to <16 x i8>			%0 = bitcast <2 x i64> %and.i.i to <16 x i8>
	%1 = icmp ne <16 x i8> %0, zeroinitializer			%1 = icmp ne <16 x i8> %0, zeroinitializer
	%2 = bitcast <16 x i1> %1 to i16			%2 = bitcast <16 x i1> %1 to i16
	ret i16 %2			ret i16 %2
	}			}

	define zeroext i16 @test_mm_mask_test_epi8_mask(i16 zeroext %__U, <2 x i64> %__A, <2 x i64> %__B) {			define zeroext i16 @test_mm_mask_test_epi8_mask(i16 zeroext %__U, <2 x i64> %__A, <2 x i64> %__B) {
	; X86-LABEL: test_mm_mask_test_epi8_mask:			; X86-LABEL: test_mm_mask_test_epi8_mask:
	; X86: # %bb.0: # %entry			; X86: # %bb.0: # %entry
	; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1			; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1
	; X86-NEXT: vptestmb %xmm0, %xmm1, %k0 {%k1}			; X86-NEXT: vpand %xmm0, %xmm1, %xmm0
				; X86-NEXT: vptestmb %xmm0, %xmm0, %k0 {%k1}
	; X86-NEXT: kmovd %k0, %eax			; X86-NEXT: kmovd %k0, %eax
	; X86-NEXT: movzwl %ax, %eax			; X86-NEXT: movzwl %ax, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: test_mm_mask_test_epi8_mask:			; X64-LABEL: test_mm_mask_test_epi8_mask:
	; X64: # %bb.0: # %entry			; X64: # %bb.0: # %entry
				; X64-NEXT: vpand %xmm0, %xmm1, %xmm0
	; X64-NEXT: kmovd %edi, %k1			; X64-NEXT: kmovd %edi, %k1
	; X64-NEXT: vptestmb %xmm0, %xmm1, %k0 {%k1}			; X64-NEXT: vptestmb %xmm0, %xmm0, %k0 {%k1}
	; X64-NEXT: kmovd %k0, %eax			; X64-NEXT: kmovd %k0, %eax
	; X64-NEXT: movzwl %ax, %eax			; X64-NEXT: movzwl %ax, %eax
	; X64-NEXT: retq			; X64-NEXT: retq
	entry:			entry:
	%and.i.i = and <2 x i64> %__B, %__A			%and.i.i = and <2 x i64> %__B, %__A
	%0 = bitcast <2 x i64> %and.i.i to <16 x i8>			%0 = bitcast <2 x i64> %and.i.i to <16 x i8>
	%1 = icmp ne <16 x i8> %0, zeroinitializer			%1 = icmp ne <16 x i8> %0, zeroinitializer
	%2 = bitcast i16 %__U to <16 x i1>			%2 = bitcast i16 %__U to <16 x i1>
	%3 = and <16 x i1> %1, %2			%3 = and <16 x i1> %1, %2
	%4 = bitcast <16 x i1> %3 to i16			%4 = bitcast <16 x i1> %3 to i16
	ret i16 %4			ret i16 %4
	}			}

	define i32 @test_mm256_test_epi8_mask(<4 x i64> %__A, <4 x i64> %__B) {			define i32 @test_mm256_test_epi8_mask(<4 x i64> %__A, <4 x i64> %__B) {
	; CHECK-LABEL: test_mm256_test_epi8_mask:			; CHECK-LABEL: test_mm256_test_epi8_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestmb %ymm0, %ymm1, %k0			; CHECK-NEXT: vpand %ymm0, %ymm1, %ymm0
				; CHECK-NEXT: vptestmb %ymm0, %ymm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: vzeroupper			; CHECK-NEXT: vzeroupper
	; CHECK-NEXT: ret{{[l\|q]}}			; CHECK-NEXT: ret{{[l\|q]}}
	entry:			entry:
	%and.i.i = and <4 x i64> %__B, %__A			%and.i.i = and <4 x i64> %__B, %__A
	%0 = bitcast <4 x i64> %and.i.i to <32 x i8>			%0 = bitcast <4 x i64> %and.i.i to <32 x i8>
	%1 = icmp ne <32 x i8> %0, zeroinitializer			%1 = icmp ne <32 x i8> %0, zeroinitializer
	%2 = bitcast <32 x i1> %1 to i32			%2 = bitcast <32 x i1> %1 to i32
	ret i32 %2			ret i32 %2
	}			}

	define i32 @test_mm256_mask_test_epi8_mask(i32 %__U, <4 x i64> %__A, <4 x i64> %__B) {			define i32 @test_mm256_mask_test_epi8_mask(i32 %__U, <4 x i64> %__A, <4 x i64> %__B) {
	; X86-LABEL: test_mm256_mask_test_epi8_mask:			; X86-LABEL: test_mm256_mask_test_epi8_mask:
	; X86: # %bb.0: # %entry			; X86: # %bb.0: # %entry
	; X86-NEXT: kmovd {{[0-9]+}}(%esp), %k1			; X86-NEXT: kmovd {{[0-9]+}}(%esp), %k1
	; X86-NEXT: vptestmb %ymm0, %ymm1, %k0 {%k1}			; X86-NEXT: vpand %ymm0, %ymm1, %ymm0
				; X86-NEXT: vptestmb %ymm0, %ymm0, %k0 {%k1}
	; X86-NEXT: kmovd %k0, %eax			; X86-NEXT: kmovd %k0, %eax
	; X86-NEXT: vzeroupper			; X86-NEXT: vzeroupper
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: test_mm256_mask_test_epi8_mask:			; X64-LABEL: test_mm256_mask_test_epi8_mask:
	; X64: # %bb.0: # %entry			; X64: # %bb.0: # %entry
				; X64-NEXT: vpand %ymm0, %ymm1, %ymm0
	; X64-NEXT: kmovd %edi, %k1			; X64-NEXT: kmovd %edi, %k1
	; X64-NEXT: vptestmb %ymm0, %ymm1, %k0 {%k1}			; X64-NEXT: vptestmb %ymm0, %ymm0, %k0 {%k1}
	; X64-NEXT: kmovd %k0, %eax			; X64-NEXT: kmovd %k0, %eax
	; X64-NEXT: vzeroupper			; X64-NEXT: vzeroupper
	; X64-NEXT: retq			; X64-NEXT: retq
	entry:			entry:
	%and.i.i = and <4 x i64> %__B, %__A			%and.i.i = and <4 x i64> %__B, %__A
	%0 = bitcast <4 x i64> %and.i.i to <32 x i8>			%0 = bitcast <4 x i64> %and.i.i to <32 x i8>
	%1 = icmp ne <32 x i8> %0, zeroinitializer			%1 = icmp ne <32 x i8> %0, zeroinitializer
	%2 = bitcast i32 %__U to <32 x i1>			%2 = bitcast i32 %__U to <32 x i1>
	%3 = and <32 x i1> %1, %2			%3 = and <32 x i1> %1, %2
	%4 = bitcast <32 x i1> %3 to i32			%4 = bitcast <32 x i1> %3 to i32
	ret i32 %4			ret i32 %4
	}			}

	define zeroext i8 @test_mm_test_epi16_mask(<2 x i64> %__A, <2 x i64> %__B) {			define zeroext i8 @test_mm_test_epi16_mask(<2 x i64> %__A, <2 x i64> %__B) {
	; CHECK-LABEL: test_mm_test_epi16_mask:			; CHECK-LABEL: test_mm_test_epi16_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestmw %xmm0, %xmm1, %k0			; CHECK-NEXT: vpand %xmm0, %xmm1, %xmm0
				; CHECK-NEXT: vptestmw %xmm0, %xmm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: movzbl %al, %eax			; CHECK-NEXT: movzbl %al, %eax
	; CHECK-NEXT: ret{{[l\|q]}}			; CHECK-NEXT: ret{{[l\|q]}}
	entry:			entry:
	%and.i.i = and <2 x i64> %__B, %__A			%and.i.i = and <2 x i64> %__B, %__A
	%0 = bitcast <2 x i64> %and.i.i to <8 x i16>			%0 = bitcast <2 x i64> %and.i.i to <8 x i16>
	%1 = icmp ne <8 x i16> %0, zeroinitializer			%1 = icmp ne <8 x i16> %0, zeroinitializer
	%2 = bitcast <8 x i1> %1 to i8			%2 = bitcast <8 x i1> %1 to i8
	ret i8 %2			ret i8 %2
	}			}

	define zeroext i8 @test_mm_mask_test_epi16_mask(i8 zeroext %__U, <2 x i64> %__A, <2 x i64> %__B) {			define zeroext i8 @test_mm_mask_test_epi16_mask(i8 zeroext %__U, <2 x i64> %__A, <2 x i64> %__B) {
	; X86-LABEL: test_mm_mask_test_epi16_mask:			; X86-LABEL: test_mm_mask_test_epi16_mask:
	; X86: # %bb.0: # %entry			; X86: # %bb.0: # %entry
	; X86-NEXT: movb {{[0-9]+}}(%esp), %al			; X86-NEXT: movb {{[0-9]+}}(%esp), %al
				; X86-NEXT: vpand %xmm0, %xmm1, %xmm0
	; X86-NEXT: kmovd %eax, %k1			; X86-NEXT: kmovd %eax, %k1
	; X86-NEXT: vptestmw %xmm0, %xmm1, %k0 {%k1}			; X86-NEXT: vptestmw %xmm0, %xmm0, %k0 {%k1}
	; X86-NEXT: kmovd %k0, %eax			; X86-NEXT: kmovd %k0, %eax
	; X86-NEXT: movzbl %al, %eax			; X86-NEXT: movzbl %al, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: test_mm_mask_test_epi16_mask:			; X64-LABEL: test_mm_mask_test_epi16_mask:
	; X64: # %bb.0: # %entry			; X64: # %bb.0: # %entry
				; X64-NEXT: vpand %xmm0, %xmm1, %xmm0
	; X64-NEXT: kmovd %edi, %k1			; X64-NEXT: kmovd %edi, %k1
	; X64-NEXT: vptestmw %xmm0, %xmm1, %k0 {%k1}			; X64-NEXT: vptestmw %xmm0, %xmm0, %k0 {%k1}
	; X64-NEXT: kmovd %k0, %eax			; X64-NEXT: kmovd %k0, %eax
	; X64-NEXT: movzbl %al, %eax			; X64-NEXT: movzbl %al, %eax
	; X64-NEXT: retq			; X64-NEXT: retq
	entry:			entry:
	%and.i.i = and <2 x i64> %__B, %__A			%and.i.i = and <2 x i64> %__B, %__A
	%0 = bitcast <2 x i64> %and.i.i to <8 x i16>			%0 = bitcast <2 x i64> %and.i.i to <8 x i16>
	%1 = icmp ne <8 x i16> %0, zeroinitializer			%1 = icmp ne <8 x i16> %0, zeroinitializer
	%2 = bitcast i8 %__U to <8 x i1>			%2 = bitcast i8 %__U to <8 x i1>
	%3 = and <8 x i1> %1, %2			%3 = and <8 x i1> %1, %2
	%4 = bitcast <8 x i1> %3 to i8			%4 = bitcast <8 x i1> %3 to i8
	ret i8 %4			ret i8 %4
	}			}

	define zeroext i16 @test_mm256_test_epi16_mask(<4 x i64> %__A, <4 x i64> %__B) {			define zeroext i16 @test_mm256_test_epi16_mask(<4 x i64> %__A, <4 x i64> %__B) {
	; CHECK-LABEL: test_mm256_test_epi16_mask:			; CHECK-LABEL: test_mm256_test_epi16_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestmw %ymm0, %ymm1, %k0			; CHECK-NEXT: vpand %ymm0, %ymm1, %ymm0
				; CHECK-NEXT: vptestmw %ymm0, %ymm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: movzwl %ax, %eax			; CHECK-NEXT: movzwl %ax, %eax
	; CHECK-NEXT: vzeroupper			; CHECK-NEXT: vzeroupper
	; CHECK-NEXT: ret{{[l\|q]}}			; CHECK-NEXT: ret{{[l\|q]}}
	entry:			entry:
	%and.i.i = and <4 x i64> %__B, %__A			%and.i.i = and <4 x i64> %__B, %__A
	%0 = bitcast <4 x i64> %and.i.i to <16 x i16>			%0 = bitcast <4 x i64> %and.i.i to <16 x i16>
	%1 = icmp ne <16 x i16> %0, zeroinitializer			%1 = icmp ne <16 x i16> %0, zeroinitializer
	%2 = bitcast <16 x i1> %1 to i16			%2 = bitcast <16 x i1> %1 to i16
	ret i16 %2			ret i16 %2
	}			}

	define zeroext i16 @test_mm256_mask_test_epi16_mask(i16 zeroext %__U, <4 x i64> %__A, <4 x i64> %__B) {			define zeroext i16 @test_mm256_mask_test_epi16_mask(i16 zeroext %__U, <4 x i64> %__A, <4 x i64> %__B) {
	; X86-LABEL: test_mm256_mask_test_epi16_mask:			; X86-LABEL: test_mm256_mask_test_epi16_mask:
	; X86: # %bb.0: # %entry			; X86: # %bb.0: # %entry
	; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1			; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1
	; X86-NEXT: vptestmw %ymm0, %ymm1, %k0 {%k1}			; X86-NEXT: vpand %ymm0, %ymm1, %ymm0
				; X86-NEXT: vptestmw %ymm0, %ymm0, %k0 {%k1}
	; X86-NEXT: kmovd %k0, %eax			; X86-NEXT: kmovd %k0, %eax
	; X86-NEXT: movzwl %ax, %eax			; X86-NEXT: movzwl %ax, %eax
	; X86-NEXT: vzeroupper			; X86-NEXT: vzeroupper
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: test_mm256_mask_test_epi16_mask:			; X64-LABEL: test_mm256_mask_test_epi16_mask:
	; X64: # %bb.0: # %entry			; X64: # %bb.0: # %entry
				; X64-NEXT: vpand %ymm0, %ymm1, %ymm0
	; X64-NEXT: kmovd %edi, %k1			; X64-NEXT: kmovd %edi, %k1
	; X64-NEXT: vptestmw %ymm0, %ymm1, %k0 {%k1}			; X64-NEXT: vptestmw %ymm0, %ymm0, %k0 {%k1}
	; X64-NEXT: kmovd %k0, %eax			; X64-NEXT: kmovd %k0, %eax
	; X64-NEXT: movzwl %ax, %eax			; X64-NEXT: movzwl %ax, %eax
	; X64-NEXT: vzeroupper			; X64-NEXT: vzeroupper
	; X64-NEXT: retq			; X64-NEXT: retq
	entry:			entry:
	%and.i.i = and <4 x i64> %__B, %__A			%and.i.i = and <4 x i64> %__B, %__A
	%0 = bitcast <4 x i64> %and.i.i to <16 x i16>			%0 = bitcast <4 x i64> %and.i.i to <16 x i16>
	%1 = icmp ne <16 x i16> %0, zeroinitializer			%1 = icmp ne <16 x i16> %0, zeroinitializer
	%2 = bitcast i16 %__U to <16 x i1>			%2 = bitcast i16 %__U to <16 x i1>
	%3 = and <16 x i1> %1, %2			%3 = and <16 x i1> %1, %2
	%4 = bitcast <16 x i1> %3 to i16			%4 = bitcast <16 x i1> %3 to i16
	ret i16 %4			ret i16 %4
	}			}

	define zeroext i16 @test_mm_testn_epi8_mask(<2 x i64> %__A, <2 x i64> %__B) {			define zeroext i16 @test_mm_testn_epi8_mask(<2 x i64> %__A, <2 x i64> %__B) {
	; CHECK-LABEL: test_mm_testn_epi8_mask:			; CHECK-LABEL: test_mm_testn_epi8_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestnmb %xmm0, %xmm1, %k0			; CHECK-NEXT: vpand %xmm0, %xmm1, %xmm0
				; CHECK-NEXT: vptestnmb %xmm0, %xmm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: movzwl %ax, %eax			; CHECK-NEXT: movzwl %ax, %eax
	; CHECK-NEXT: ret{{[l\|q]}}			; CHECK-NEXT: ret{{[l\|q]}}
	entry:			entry:
	%and.i.i = and <2 x i64> %__B, %__A			%and.i.i = and <2 x i64> %__B, %__A
	%0 = bitcast <2 x i64> %and.i.i to <16 x i8>			%0 = bitcast <2 x i64> %and.i.i to <16 x i8>
	%1 = icmp eq <16 x i8> %0, zeroinitializer			%1 = icmp eq <16 x i8> %0, zeroinitializer
	%2 = bitcast <16 x i1> %1 to i16			%2 = bitcast <16 x i1> %1 to i16
	ret i16 %2			ret i16 %2
	}			}

	define zeroext i16 @test_mm_mask_testn_epi8_mask(i16 zeroext %__U, <2 x i64> %__A, <2 x i64> %__B) {			define zeroext i16 @test_mm_mask_testn_epi8_mask(i16 zeroext %__U, <2 x i64> %__A, <2 x i64> %__B) {
	; X86-LABEL: test_mm_mask_testn_epi8_mask:			; X86-LABEL: test_mm_mask_testn_epi8_mask:
	; X86: # %bb.0: # %entry			; X86: # %bb.0: # %entry
	; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1			; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1
	; X86-NEXT: vptestnmb %xmm0, %xmm1, %k0 {%k1}			; X86-NEXT: vpand %xmm0, %xmm1, %xmm0
				; X86-NEXT: vptestnmb %xmm0, %xmm0, %k0 {%k1}
	; X86-NEXT: kmovd %k0, %eax			; X86-NEXT: kmovd %k0, %eax
	; X86-NEXT: movzwl %ax, %eax			; X86-NEXT: movzwl %ax, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: test_mm_mask_testn_epi8_mask:			; X64-LABEL: test_mm_mask_testn_epi8_mask:
	; X64: # %bb.0: # %entry			; X64: # %bb.0: # %entry
				; X64-NEXT: vpand %xmm0, %xmm1, %xmm0
	; X64-NEXT: kmovd %edi, %k1			; X64-NEXT: kmovd %edi, %k1
	; X64-NEXT: vptestnmb %xmm0, %xmm1, %k0 {%k1}			; X64-NEXT: vptestnmb %xmm0, %xmm0, %k0 {%k1}
	; X64-NEXT: kmovd %k0, %eax			; X64-NEXT: kmovd %k0, %eax
	; X64-NEXT: movzwl %ax, %eax			; X64-NEXT: movzwl %ax, %eax
	; X64-NEXT: retq			; X64-NEXT: retq
	entry:			entry:
	%and.i.i = and <2 x i64> %__B, %__A			%and.i.i = and <2 x i64> %__B, %__A
	%0 = bitcast <2 x i64> %and.i.i to <16 x i8>			%0 = bitcast <2 x i64> %and.i.i to <16 x i8>
	%1 = icmp eq <16 x i8> %0, zeroinitializer			%1 = icmp eq <16 x i8> %0, zeroinitializer
	%2 = bitcast i16 %__U to <16 x i1>			%2 = bitcast i16 %__U to <16 x i1>
	%3 = and <16 x i1> %1, %2			%3 = and <16 x i1> %1, %2
	%4 = bitcast <16 x i1> %3 to i16			%4 = bitcast <16 x i1> %3 to i16
	ret i16 %4			ret i16 %4
	}			}

	define i32 @test_mm256_testn_epi8_mask(<4 x i64> %__A, <4 x i64> %__B) {			define i32 @test_mm256_testn_epi8_mask(<4 x i64> %__A, <4 x i64> %__B) {
	; CHECK-LABEL: test_mm256_testn_epi8_mask:			; CHECK-LABEL: test_mm256_testn_epi8_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestnmb %ymm0, %ymm1, %k0			; CHECK-NEXT: vpand %ymm0, %ymm1, %ymm0
				; CHECK-NEXT: vptestnmb %ymm0, %ymm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: vzeroupper			; CHECK-NEXT: vzeroupper
	; CHECK-NEXT: ret{{[l\|q]}}			; CHECK-NEXT: ret{{[l\|q]}}
	entry:			entry:
	%and.i.i = and <4 x i64> %__B, %__A			%and.i.i = and <4 x i64> %__B, %__A
	%0 = bitcast <4 x i64> %and.i.i to <32 x i8>			%0 = bitcast <4 x i64> %and.i.i to <32 x i8>
	%1 = icmp eq <32 x i8> %0, zeroinitializer			%1 = icmp eq <32 x i8> %0, zeroinitializer
	%2 = bitcast <32 x i1> %1 to i32			%2 = bitcast <32 x i1> %1 to i32
	ret i32 %2			ret i32 %2
	}			}

	define i32 @test_mm256_mask_testn_epi8_mask(i32 %__U, <4 x i64> %__A, <4 x i64> %__B) {			define i32 @test_mm256_mask_testn_epi8_mask(i32 %__U, <4 x i64> %__A, <4 x i64> %__B) {
	; X86-LABEL: test_mm256_mask_testn_epi8_mask:			; X86-LABEL: test_mm256_mask_testn_epi8_mask:
	; X86: # %bb.0: # %entry			; X86: # %bb.0: # %entry
	; X86-NEXT: kmovd {{[0-9]+}}(%esp), %k1			; X86-NEXT: kmovd {{[0-9]+}}(%esp), %k1
	; X86-NEXT: vptestnmb %ymm0, %ymm1, %k0 {%k1}			; X86-NEXT: vpand %ymm0, %ymm1, %ymm0
				; X86-NEXT: vptestnmb %ymm0, %ymm0, %k0 {%k1}
	; X86-NEXT: kmovd %k0, %eax			; X86-NEXT: kmovd %k0, %eax
	; X86-NEXT: vzeroupper			; X86-NEXT: vzeroupper
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: test_mm256_mask_testn_epi8_mask:			; X64-LABEL: test_mm256_mask_testn_epi8_mask:
	; X64: # %bb.0: # %entry			; X64: # %bb.0: # %entry
				; X64-NEXT: vpand %ymm0, %ymm1, %ymm0
	; X64-NEXT: kmovd %edi, %k1			; X64-NEXT: kmovd %edi, %k1
	; X64-NEXT: vptestnmb %ymm0, %ymm1, %k0 {%k1}			; X64-NEXT: vptestnmb %ymm0, %ymm0, %k0 {%k1}
	; X64-NEXT: kmovd %k0, %eax			; X64-NEXT: kmovd %k0, %eax
	; X64-NEXT: vzeroupper			; X64-NEXT: vzeroupper
	; X64-NEXT: retq			; X64-NEXT: retq
	entry:			entry:
	%and.i.i = and <4 x i64> %__B, %__A			%and.i.i = and <4 x i64> %__B, %__A
	%0 = bitcast <4 x i64> %and.i.i to <32 x i8>			%0 = bitcast <4 x i64> %and.i.i to <32 x i8>
	%1 = icmp eq <32 x i8> %0, zeroinitializer			%1 = icmp eq <32 x i8> %0, zeroinitializer
	%2 = bitcast i32 %__U to <32 x i1>			%2 = bitcast i32 %__U to <32 x i1>
	%3 = and <32 x i1> %1, %2			%3 = and <32 x i1> %1, %2
	%4 = bitcast <32 x i1> %3 to i32			%4 = bitcast <32 x i1> %3 to i32
	ret i32 %4			ret i32 %4
	}			}

	define zeroext i8 @test_mm_testn_epi16_mask(<2 x i64> %__A, <2 x i64> %__B) {			define zeroext i8 @test_mm_testn_epi16_mask(<2 x i64> %__A, <2 x i64> %__B) {
	; CHECK-LABEL: test_mm_testn_epi16_mask:			; CHECK-LABEL: test_mm_testn_epi16_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestnmw %xmm0, %xmm1, %k0			; CHECK-NEXT: vpand %xmm0, %xmm1, %xmm0
				; CHECK-NEXT: vptestnmw %xmm0, %xmm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: movzbl %al, %eax			; CHECK-NEXT: movzbl %al, %eax
	; CHECK-NEXT: ret{{[l\|q]}}			; CHECK-NEXT: ret{{[l\|q]}}
	entry:			entry:
	%and.i.i = and <2 x i64> %__B, %__A			%and.i.i = and <2 x i64> %__B, %__A
	%0 = bitcast <2 x i64> %and.i.i to <8 x i16>			%0 = bitcast <2 x i64> %and.i.i to <8 x i16>
	%1 = icmp eq <8 x i16> %0, zeroinitializer			%1 = icmp eq <8 x i16> %0, zeroinitializer
	%2 = bitcast <8 x i1> %1 to i8			%2 = bitcast <8 x i1> %1 to i8
	ret i8 %2			ret i8 %2
	}			}

	define zeroext i8 @test_mm_mask_testn_epi16_mask(i8 zeroext %__U, <2 x i64> %__A, <2 x i64> %__B) {			define zeroext i8 @test_mm_mask_testn_epi16_mask(i8 zeroext %__U, <2 x i64> %__A, <2 x i64> %__B) {
	; X86-LABEL: test_mm_mask_testn_epi16_mask:			; X86-LABEL: test_mm_mask_testn_epi16_mask:
	; X86: # %bb.0: # %entry			; X86: # %bb.0: # %entry
	; X86-NEXT: movb {{[0-9]+}}(%esp), %al			; X86-NEXT: movb {{[0-9]+}}(%esp), %al
				; X86-NEXT: vpand %xmm0, %xmm1, %xmm0
	; X86-NEXT: kmovd %eax, %k1			; X86-NEXT: kmovd %eax, %k1
	; X86-NEXT: vptestnmw %xmm0, %xmm1, %k0 {%k1}			; X86-NEXT: vptestnmw %xmm0, %xmm0, %k0 {%k1}
	; X86-NEXT: kmovd %k0, %eax			; X86-NEXT: kmovd %k0, %eax
	; X86-NEXT: movzbl %al, %eax			; X86-NEXT: movzbl %al, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: test_mm_mask_testn_epi16_mask:			; X64-LABEL: test_mm_mask_testn_epi16_mask:
	; X64: # %bb.0: # %entry			; X64: # %bb.0: # %entry
				; X64-NEXT: vpand %xmm0, %xmm1, %xmm0
	; X64-NEXT: kmovd %edi, %k1			; X64-NEXT: kmovd %edi, %k1
	; X64-NEXT: vptestnmw %xmm0, %xmm1, %k0 {%k1}			; X64-NEXT: vptestnmw %xmm0, %xmm0, %k0 {%k1}
	; X64-NEXT: kmovd %k0, %eax			; X64-NEXT: kmovd %k0, %eax
	; X64-NEXT: movzbl %al, %eax			; X64-NEXT: movzbl %al, %eax
	; X64-NEXT: retq			; X64-NEXT: retq
	entry:			entry:
	%and.i.i = and <2 x i64> %__B, %__A			%and.i.i = and <2 x i64> %__B, %__A
	%0 = bitcast <2 x i64> %and.i.i to <8 x i16>			%0 = bitcast <2 x i64> %and.i.i to <8 x i16>
	%1 = icmp eq <8 x i16> %0, zeroinitializer			%1 = icmp eq <8 x i16> %0, zeroinitializer
	%2 = bitcast i8 %__U to <8 x i1>			%2 = bitcast i8 %__U to <8 x i1>
	%3 = and <8 x i1> %1, %2			%3 = and <8 x i1> %1, %2
	%4 = bitcast <8 x i1> %3 to i8			%4 = bitcast <8 x i1> %3 to i8
	ret i8 %4			ret i8 %4
	}			}

	define zeroext i16 @test_mm256_testn_epi16_mask(<4 x i64> %__A, <4 x i64> %__B) {			define zeroext i16 @test_mm256_testn_epi16_mask(<4 x i64> %__A, <4 x i64> %__B) {
	; CHECK-LABEL: test_mm256_testn_epi16_mask:			; CHECK-LABEL: test_mm256_testn_epi16_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestnmw %ymm0, %ymm1, %k0			; CHECK-NEXT: vpand %ymm0, %ymm1, %ymm0
				; CHECK-NEXT: vptestnmw %ymm0, %ymm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: movzwl %ax, %eax			; CHECK-NEXT: movzwl %ax, %eax
	; CHECK-NEXT: vzeroupper			; CHECK-NEXT: vzeroupper
	; CHECK-NEXT: ret{{[l\|q]}}			; CHECK-NEXT: ret{{[l\|q]}}
	entry:			entry:
	%and.i.i = and <4 x i64> %__B, %__A			%and.i.i = and <4 x i64> %__B, %__A
	%0 = bitcast <4 x i64> %and.i.i to <16 x i16>			%0 = bitcast <4 x i64> %and.i.i to <16 x i16>
	%1 = icmp eq <16 x i16> %0, zeroinitializer			%1 = icmp eq <16 x i16> %0, zeroinitializer
	%2 = bitcast <16 x i1> %1 to i16			%2 = bitcast <16 x i1> %1 to i16
	ret i16 %2			ret i16 %2
	}			}

	define zeroext i16 @test_mm256_mask_testn_epi16_mask(i16 zeroext %__U, <4 x i64> %__A, <4 x i64> %__B) {			define zeroext i16 @test_mm256_mask_testn_epi16_mask(i16 zeroext %__U, <4 x i64> %__A, <4 x i64> %__B) {
	; X86-LABEL: test_mm256_mask_testn_epi16_mask:			; X86-LABEL: test_mm256_mask_testn_epi16_mask:
	; X86: # %bb.0: # %entry			; X86: # %bb.0: # %entry
	; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1			; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1
	; X86-NEXT: vptestnmw %ymm0, %ymm1, %k0 {%k1}			; X86-NEXT: vpand %ymm0, %ymm1, %ymm0
				; X86-NEXT: vptestnmw %ymm0, %ymm0, %k0 {%k1}
	; X86-NEXT: kmovd %k0, %eax			; X86-NEXT: kmovd %k0, %eax
	; X86-NEXT: movzwl %ax, %eax			; X86-NEXT: movzwl %ax, %eax
	; X86-NEXT: vzeroupper			; X86-NEXT: vzeroupper
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: test_mm256_mask_testn_epi16_mask:			; X64-LABEL: test_mm256_mask_testn_epi16_mask:
	; X64: # %bb.0: # %entry			; X64: # %bb.0: # %entry
				; X64-NEXT: vpand %ymm0, %ymm1, %ymm0
	; X64-NEXT: kmovd %edi, %k1			; X64-NEXT: kmovd %edi, %k1
	; X64-NEXT: vptestnmw %ymm0, %ymm1, %k0 {%k1}			; X64-NEXT: vptestnmw %ymm0, %ymm0, %k0 {%k1}
	; X64-NEXT: kmovd %k0, %eax			; X64-NEXT: kmovd %k0, %eax
	; X64-NEXT: movzwl %ax, %eax			; X64-NEXT: movzwl %ax, %eax
	; X64-NEXT: vzeroupper			; X64-NEXT: vzeroupper
	; X64-NEXT: retq			; X64-NEXT: retq
	entry:			entry:
	%and.i.i = and <4 x i64> %__B, %__A			%and.i.i = and <4 x i64> %__B, %__A
	%0 = bitcast <4 x i64> %and.i.i to <16 x i16>			%0 = bitcast <4 x i64> %and.i.i to <16 x i16>
	%1 = icmp eq <16 x i16> %0, zeroinitializer			%1 = icmp eq <16 x i16> %0, zeroinitializer
	▲ Show 20 Lines • Show All 650 Lines • Show Last 20 Lines

test/CodeGen/X86/avx512bwvl-vec-test-testn.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw,+avx512vl \| FileCheck %s			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw,+avx512vl \| FileCheck %s

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define zeroext i16 @TEST_mm_test_epi8_mask(<2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {			define zeroext i16 @TEST_mm_test_epi8_mask(<2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm_test_epi8_mask:			; CHECK-LABEL: TEST_mm_test_epi8_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestmb %xmm0, %xmm1, %k0			; CHECK-NEXT: vpand %xmm0, %xmm1, %xmm0
				; CHECK-NEXT: vptestmb %xmm0, %xmm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: # kill: def $ax killed $ax killed $eax			; CHECK-NEXT: # kill: def $ax killed $ax killed $eax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <2 x i64> %__B, %__A			%and.i.i = and <2 x i64> %__B, %__A
	%0 = bitcast <2 x i64> %and.i.i to <16 x i8>			%0 = bitcast <2 x i64> %and.i.i to <16 x i8>
	%1 = icmp ne <16 x i8> %0, zeroinitializer			%1 = icmp ne <16 x i8> %0, zeroinitializer
	%2 = bitcast <16 x i1> %1 to i16			%2 = bitcast <16 x i1> %1 to i16
	ret i16 %2			ret i16 %2
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define zeroext i16 @TEST_mm_mask_test_epi8_mask(i16 zeroext %__U, <2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {			define zeroext i16 @TEST_mm_mask_test_epi8_mask(i16 zeroext %__U, <2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm_mask_test_epi8_mask:			; CHECK-LABEL: TEST_mm_mask_test_epi8_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestmb %xmm0, %xmm1, %k0			; CHECK-NEXT: vpand %xmm0, %xmm1, %xmm0
				; CHECK-NEXT: vptestmb %xmm0, %xmm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: andl %edi, %eax			; CHECK-NEXT: andl %edi, %eax
	; CHECK-NEXT: # kill: def $ax killed $ax killed $eax			; CHECK-NEXT: # kill: def $ax killed $ax killed $eax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <2 x i64> %__B, %__A			%and.i.i = and <2 x i64> %__B, %__A
	%0 = bitcast <2 x i64> %and.i.i to <16 x i8>			%0 = bitcast <2 x i64> %and.i.i to <16 x i8>
	%1 = icmp ne <16 x i8> %0, zeroinitializer			%1 = icmp ne <16 x i8> %0, zeroinitializer
	%2 = bitcast i16 %__U to <16 x i1>			%2 = bitcast i16 %__U to <16 x i1>
	%3 = and <16 x i1> %1, %2			%3 = and <16 x i1> %1, %2
	%4 = bitcast <16 x i1> %3 to i16			%4 = bitcast <16 x i1> %3 to i16
	ret i16 %4			ret i16 %4
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define zeroext i8 @TEST_mm_test_epi16_mask(<2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {			define zeroext i8 @TEST_mm_test_epi16_mask(<2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm_test_epi16_mask:			; CHECK-LABEL: TEST_mm_test_epi16_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestmw %xmm0, %xmm1, %k0			; CHECK-NEXT: vpand %xmm0, %xmm1, %xmm0
				; CHECK-NEXT: vptestmw %xmm0, %xmm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: # kill: def $al killed $al killed $eax			; CHECK-NEXT: # kill: def $al killed $al killed $eax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <2 x i64> %__B, %__A			%and.i.i = and <2 x i64> %__B, %__A
	%0 = bitcast <2 x i64> %and.i.i to <8 x i16>			%0 = bitcast <2 x i64> %and.i.i to <8 x i16>
	%1 = icmp ne <8 x i16> %0, zeroinitializer			%1 = icmp ne <8 x i16> %0, zeroinitializer
	%2 = bitcast <8 x i1> %1 to i8			%2 = bitcast <8 x i1> %1 to i8
	ret i8 %2			ret i8 %2
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define zeroext i8 @TEST_mm_mask_test_epi16_mask(i8 zeroext %__U, <2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {			define zeroext i8 @TEST_mm_mask_test_epi16_mask(i8 zeroext %__U, <2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm_mask_test_epi16_mask:			; CHECK-LABEL: TEST_mm_mask_test_epi16_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestmw %xmm0, %xmm1, %k0			; CHECK-NEXT: vpand %xmm0, %xmm1, %xmm0
				; CHECK-NEXT: vptestmw %xmm0, %xmm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: andb %dil, %al			; CHECK-NEXT: andb %dil, %al
	; CHECK-NEXT: # kill: def $al killed $al killed $eax			; CHECK-NEXT: # kill: def $al killed $al killed $eax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <2 x i64> %__B, %__A			%and.i.i = and <2 x i64> %__B, %__A
	%0 = bitcast <2 x i64> %and.i.i to <8 x i16>			%0 = bitcast <2 x i64> %and.i.i to <8 x i16>
	%1 = icmp ne <8 x i16> %0, zeroinitializer			%1 = icmp ne <8 x i16> %0, zeroinitializer
	%2 = bitcast i8 %__U to <8 x i1>			%2 = bitcast i8 %__U to <8 x i1>
	%3 = and <8 x i1> %1, %2			%3 = and <8 x i1> %1, %2
	%4 = bitcast <8 x i1> %3 to i8			%4 = bitcast <8 x i1> %3 to i8
	ret i8 %4			ret i8 %4
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define zeroext i16 @TEST_mm_testn_epi8_mask(<2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {			define zeroext i16 @TEST_mm_testn_epi8_mask(<2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm_testn_epi8_mask:			; CHECK-LABEL: TEST_mm_testn_epi8_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestnmb %xmm0, %xmm1, %k0			; CHECK-NEXT: vpand %xmm0, %xmm1, %xmm0
				; CHECK-NEXT: vptestnmb %xmm0, %xmm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: # kill: def $ax killed $ax killed $eax			; CHECK-NEXT: # kill: def $ax killed $ax killed $eax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <2 x i64> %__B, %__A			%and.i.i = and <2 x i64> %__B, %__A
	%0 = bitcast <2 x i64> %and.i.i to <16 x i8>			%0 = bitcast <2 x i64> %and.i.i to <16 x i8>
	%1 = icmp eq <16 x i8> %0, zeroinitializer			%1 = icmp eq <16 x i8> %0, zeroinitializer
	%2 = bitcast <16 x i1> %1 to i16			%2 = bitcast <16 x i1> %1 to i16
	ret i16 %2			ret i16 %2
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define zeroext i16 @TEST_mm_mask_testn_epi8_mask(i16 zeroext %__U, <2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {			define zeroext i16 @TEST_mm_mask_testn_epi8_mask(i16 zeroext %__U, <2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm_mask_testn_epi8_mask:			; CHECK-LABEL: TEST_mm_mask_testn_epi8_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestnmb %xmm0, %xmm1, %k0			; CHECK-NEXT: vpand %xmm0, %xmm1, %xmm0
				; CHECK-NEXT: vptestnmb %xmm0, %xmm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: andl %edi, %eax			; CHECK-NEXT: andl %edi, %eax
	; CHECK-NEXT: # kill: def $ax killed $ax killed $eax			; CHECK-NEXT: # kill: def $ax killed $ax killed $eax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <2 x i64> %__B, %__A			%and.i.i = and <2 x i64> %__B, %__A
	%0 = bitcast <2 x i64> %and.i.i to <16 x i8>			%0 = bitcast <2 x i64> %and.i.i to <16 x i8>
	%1 = icmp eq <16 x i8> %0, zeroinitializer			%1 = icmp eq <16 x i8> %0, zeroinitializer
	%2 = bitcast i16 %__U to <16 x i1>			%2 = bitcast i16 %__U to <16 x i1>
	%3 = and <16 x i1> %1, %2			%3 = and <16 x i1> %1, %2
	%4 = bitcast <16 x i1> %3 to i16			%4 = bitcast <16 x i1> %3 to i16
	ret i16 %4			ret i16 %4
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define zeroext i8 @TEST_mm_testn_epi16_mask(<2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {			define zeroext i8 @TEST_mm_testn_epi16_mask(<2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm_testn_epi16_mask:			; CHECK-LABEL: TEST_mm_testn_epi16_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestnmw %xmm0, %xmm1, %k0			; CHECK-NEXT: vpand %xmm0, %xmm1, %xmm0
				; CHECK-NEXT: vptestnmw %xmm0, %xmm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: # kill: def $al killed $al killed $eax			; CHECK-NEXT: # kill: def $al killed $al killed $eax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <2 x i64> %__B, %__A			%and.i.i = and <2 x i64> %__B, %__A
	%0 = bitcast <2 x i64> %and.i.i to <8 x i16>			%0 = bitcast <2 x i64> %and.i.i to <8 x i16>
	%1 = icmp eq <8 x i16> %0, zeroinitializer			%1 = icmp eq <8 x i16> %0, zeroinitializer
	%2 = bitcast <8 x i1> %1 to i8			%2 = bitcast <8 x i1> %1 to i8
	ret i8 %2			ret i8 %2
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define zeroext i8 @TEST_mm_mask_testn_epi16_mask(i8 zeroext %__U, <2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {			define zeroext i8 @TEST_mm_mask_testn_epi16_mask(i8 zeroext %__U, <2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm_mask_testn_epi16_mask:			; CHECK-LABEL: TEST_mm_mask_testn_epi16_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestnmw %xmm0, %xmm1, %k0			; CHECK-NEXT: vpand %xmm0, %xmm1, %xmm0
				; CHECK-NEXT: vptestnmw %xmm0, %xmm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: andb %dil, %al			; CHECK-NEXT: andb %dil, %al
	; CHECK-NEXT: # kill: def $al killed $al killed $eax			; CHECK-NEXT: # kill: def $al killed $al killed $eax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <2 x i64> %__B, %__A			%and.i.i = and <2 x i64> %__B, %__A
	%0 = bitcast <2 x i64> %and.i.i to <8 x i16>			%0 = bitcast <2 x i64> %and.i.i to <8 x i16>
	%1 = icmp eq <8 x i16> %0, zeroinitializer			%1 = icmp eq <8 x i16> %0, zeroinitializer
	%2 = bitcast i8 %__U to <8 x i1>			%2 = bitcast i8 %__U to <8 x i1>
	%3 = and <8 x i1> %1, %2			%3 = and <8 x i1> %1, %2
	%4 = bitcast <8 x i1> %3 to i8			%4 = bitcast <8 x i1> %3 to i8
	ret i8 %4			ret i8 %4
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define i32 @TEST_mm256_test_epi8_mask(<4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {			define i32 @TEST_mm256_test_epi8_mask(<4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm256_test_epi8_mask:			; CHECK-LABEL: TEST_mm256_test_epi8_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestmb %ymm0, %ymm1, %k0			; CHECK-NEXT: vpand %ymm0, %ymm1, %ymm0
				; CHECK-NEXT: vptestmb %ymm0, %ymm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: vzeroupper			; CHECK-NEXT: vzeroupper
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <4 x i64> %__B, %__A			%and.i.i = and <4 x i64> %__B, %__A
	%0 = bitcast <4 x i64> %and.i.i to <32 x i8>			%0 = bitcast <4 x i64> %and.i.i to <32 x i8>
	%1 = icmp ne <32 x i8> %0, zeroinitializer			%1 = icmp ne <32 x i8> %0, zeroinitializer
	%2 = bitcast <32 x i1> %1 to i32			%2 = bitcast <32 x i1> %1 to i32
	ret i32 %2			ret i32 %2
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define i32 @TEST_mm256_mask_test_epi8_mask(i32 %__U, <4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {			define i32 @TEST_mm256_mask_test_epi8_mask(i32 %__U, <4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm256_mask_test_epi8_mask:			; CHECK-LABEL: TEST_mm256_mask_test_epi8_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestmb %ymm0, %ymm1, %k0			; CHECK-NEXT: vpand %ymm0, %ymm1, %ymm0
				; CHECK-NEXT: vptestmb %ymm0, %ymm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: andl %edi, %eax			; CHECK-NEXT: andl %edi, %eax
	; CHECK-NEXT: vzeroupper			; CHECK-NEXT: vzeroupper
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <4 x i64> %__B, %__A			%and.i.i = and <4 x i64> %__B, %__A
	%0 = bitcast <4 x i64> %and.i.i to <32 x i8>			%0 = bitcast <4 x i64> %and.i.i to <32 x i8>
	%1 = icmp ne <32 x i8> %0, zeroinitializer			%1 = icmp ne <32 x i8> %0, zeroinitializer
	%2 = bitcast i32 %__U to <32 x i1>			%2 = bitcast i32 %__U to <32 x i1>
	%3 = and <32 x i1> %1, %2			%3 = and <32 x i1> %1, %2
	%4 = bitcast <32 x i1> %3 to i32			%4 = bitcast <32 x i1> %3 to i32
	ret i32 %4			ret i32 %4
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define zeroext i16 @TEST_mm256_test_epi16_mask(<4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {			define zeroext i16 @TEST_mm256_test_epi16_mask(<4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm256_test_epi16_mask:			; CHECK-LABEL: TEST_mm256_test_epi16_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestmw %ymm0, %ymm1, %k0			; CHECK-NEXT: vpand %ymm0, %ymm1, %ymm0
				; CHECK-NEXT: vptestmw %ymm0, %ymm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: # kill: def $ax killed $ax killed $eax			; CHECK-NEXT: # kill: def $ax killed $ax killed $eax
	; CHECK-NEXT: vzeroupper			; CHECK-NEXT: vzeroupper
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <4 x i64> %__B, %__A			%and.i.i = and <4 x i64> %__B, %__A
	%0 = bitcast <4 x i64> %and.i.i to <16 x i16>			%0 = bitcast <4 x i64> %and.i.i to <16 x i16>
	%1 = icmp ne <16 x i16> %0, zeroinitializer			%1 = icmp ne <16 x i16> %0, zeroinitializer
	%2 = bitcast <16 x i1> %1 to i16			%2 = bitcast <16 x i1> %1 to i16
	ret i16 %2			ret i16 %2
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define zeroext i16 @TEST_mm256_mask_test_epi16_mask(i16 zeroext %__U, <4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {			define zeroext i16 @TEST_mm256_mask_test_epi16_mask(i16 zeroext %__U, <4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm256_mask_test_epi16_mask:			; CHECK-LABEL: TEST_mm256_mask_test_epi16_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestmw %ymm0, %ymm1, %k0			; CHECK-NEXT: vpand %ymm0, %ymm1, %ymm0
				; CHECK-NEXT: vptestmw %ymm0, %ymm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: andl %edi, %eax			; CHECK-NEXT: andl %edi, %eax
	; CHECK-NEXT: # kill: def $ax killed $ax killed $eax			; CHECK-NEXT: # kill: def $ax killed $ax killed $eax
	; CHECK-NEXT: vzeroupper			; CHECK-NEXT: vzeroupper
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <4 x i64> %__B, %__A			%and.i.i = and <4 x i64> %__B, %__A
	%0 = bitcast <4 x i64> %and.i.i to <16 x i16>			%0 = bitcast <4 x i64> %and.i.i to <16 x i16>
	%1 = icmp ne <16 x i16> %0, zeroinitializer			%1 = icmp ne <16 x i16> %0, zeroinitializer
	%2 = bitcast i16 %__U to <16 x i1>			%2 = bitcast i16 %__U to <16 x i1>
	%3 = and <16 x i1> %1, %2			%3 = and <16 x i1> %1, %2
	%4 = bitcast <16 x i1> %3 to i16			%4 = bitcast <16 x i1> %3 to i16
	ret i16 %4			ret i16 %4
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define i32 @TEST_mm256_testn_epi8_mask(<4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {			define i32 @TEST_mm256_testn_epi8_mask(<4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm256_testn_epi8_mask:			; CHECK-LABEL: TEST_mm256_testn_epi8_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestnmb %ymm0, %ymm1, %k0			; CHECK-NEXT: vpand %ymm0, %ymm1, %ymm0
				; CHECK-NEXT: vptestnmb %ymm0, %ymm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: vzeroupper			; CHECK-NEXT: vzeroupper
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <4 x i64> %__B, %__A			%and.i.i = and <4 x i64> %__B, %__A
	%0 = bitcast <4 x i64> %and.i.i to <32 x i8>			%0 = bitcast <4 x i64> %and.i.i to <32 x i8>
	%1 = icmp eq <32 x i8> %0, zeroinitializer			%1 = icmp eq <32 x i8> %0, zeroinitializer
	%2 = bitcast <32 x i1> %1 to i32			%2 = bitcast <32 x i1> %1 to i32
	ret i32 %2			ret i32 %2
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define i32 @TEST_mm256_mask_testn_epi8_mask(i32 %__U, <4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {			define i32 @TEST_mm256_mask_testn_epi8_mask(i32 %__U, <4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm256_mask_testn_epi8_mask:			; CHECK-LABEL: TEST_mm256_mask_testn_epi8_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestnmb %ymm0, %ymm1, %k0			; CHECK-NEXT: vpand %ymm0, %ymm1, %ymm0
				; CHECK-NEXT: vptestnmb %ymm0, %ymm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: andl %edi, %eax			; CHECK-NEXT: andl %edi, %eax
	; CHECK-NEXT: vzeroupper			; CHECK-NEXT: vzeroupper
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <4 x i64> %__B, %__A			%and.i.i = and <4 x i64> %__B, %__A
	%0 = bitcast <4 x i64> %and.i.i to <32 x i8>			%0 = bitcast <4 x i64> %and.i.i to <32 x i8>
	%1 = icmp eq <32 x i8> %0, zeroinitializer			%1 = icmp eq <32 x i8> %0, zeroinitializer
	%2 = bitcast i32 %__U to <32 x i1>			%2 = bitcast i32 %__U to <32 x i1>
	%3 = and <32 x i1> %1, %2			%3 = and <32 x i1> %1, %2
	%4 = bitcast <32 x i1> %3 to i32			%4 = bitcast <32 x i1> %3 to i32
	ret i32 %4			ret i32 %4
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define zeroext i16 @TEST_mm256_testn_epi16_mask(<4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {			define zeroext i16 @TEST_mm256_testn_epi16_mask(<4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm256_testn_epi16_mask:			; CHECK-LABEL: TEST_mm256_testn_epi16_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestnmw %ymm0, %ymm1, %k0			; CHECK-NEXT: vpand %ymm0, %ymm1, %ymm0
				; CHECK-NEXT: vptestnmw %ymm0, %ymm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: # kill: def $ax killed $ax killed $eax			; CHECK-NEXT: # kill: def $ax killed $ax killed $eax
	; CHECK-NEXT: vzeroupper			; CHECK-NEXT: vzeroupper
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <4 x i64> %__B, %__A			%and.i.i = and <4 x i64> %__B, %__A
	%0 = bitcast <4 x i64> %and.i.i to <16 x i16>			%0 = bitcast <4 x i64> %and.i.i to <16 x i16>
	%1 = icmp eq <16 x i16> %0, zeroinitializer			%1 = icmp eq <16 x i16> %0, zeroinitializer
	%2 = bitcast <16 x i1> %1 to i16			%2 = bitcast <16 x i1> %1 to i16
	ret i16 %2			ret i16 %2
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define zeroext i16 @TEST_mm256_mask_testn_epi16_mask(i16 zeroext %__U, <4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {			define zeroext i16 @TEST_mm256_mask_testn_epi16_mask(i16 zeroext %__U, <4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {
	; CHECK-LABEL: TEST_mm256_mask_testn_epi16_mask:			; CHECK-LABEL: TEST_mm256_mask_testn_epi16_mask:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vptestnmw %ymm0, %ymm1, %k0			; CHECK-NEXT: vpand %ymm0, %ymm1, %ymm0
				; CHECK-NEXT: vptestnmw %ymm0, %ymm0, %k0
	; CHECK-NEXT: kmovd %k0, %eax			; CHECK-NEXT: kmovd %k0, %eax
	; CHECK-NEXT: andl %edi, %eax			; CHECK-NEXT: andl %edi, %eax
	; CHECK-NEXT: # kill: def $ax killed $ax killed $eax			; CHECK-NEXT: # kill: def $ax killed $ax killed $eax
	; CHECK-NEXT: vzeroupper			; CHECK-NEXT: vzeroupper
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%and.i.i = and <4 x i64> %__B, %__A			%and.i.i = and <4 x i64> %__B, %__A
	%0 = bitcast <4 x i64> %and.i.i to <16 x i16>			%0 = bitcast <4 x i64> %and.i.i to <16 x i16>
	%1 = icmp eq <16 x i16> %0, zeroinitializer			%1 = icmp eq <16 x i16> %0, zeroinitializer
	%2 = bitcast i16 %__U to <16 x i1>			%2 = bitcast i16 %__U to <16 x i1>
	%3 = and <16 x i1> %1, %2			%3 = and <16 x i1> %1, %2
	%4 = bitcast <16 x i1> %3 to i16			%4 = bitcast <16 x i1> %3 to i16
	ret i16 %4			ret i16 %4
	}			}

test/CodeGen/X86/avx512dqvl-intrinsics-upgrade.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+avx512dq,+avx512vl --show-mc-encoding \| FileCheck %s --check-prefixes=CHECK,X86		; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+avx512dq,+avx512vl --show-mc-encoding \| FileCheck %s --check-prefixes=CHECK,X86
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512dq,+avx512vl --show-mc-encoding \| FileCheck %s --check-prefixes=CHECK,X64		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512dq,+avx512vl --show-mc-encoding \| FileCheck %s --check-prefixes=CHECK,X64

define <4 x float> @test_mask_andnot_ps_rr_128(<4 x float> %a, <4 x float> %b) {		define <4 x float> @test_mask_andnot_ps_rr_128(<4 x float> %a, <4 x float> %b) {
; CHECK-LABEL: test_mask_andnot_ps_rr_128:		; CHECK-LABEL: test_mask_andnot_ps_rr_128:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vandnps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x55,0xc1]		; CHECK-NEXT: vandnps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x55,0xc1]
; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]		; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
%res = call <4 x float> @llvm.x86.avx512.mask.andn.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)		%res = call <4 x float> @llvm.x86.avx512.mask.andn.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_andnot_ps_rrk_128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask) {		define <4 x float> @test_mask_andnot_ps_rrk_128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_andnot_ps_rrk_128:		; X86-LABEL: test_mask_andnot_ps_rrk_128:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vandnps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x55,0xc1]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]
; X86-NEXT: vandnps %xmm1, %xmm0, %xmm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x09,0x55,0xd1]		; X86-NEXT: vblendmps %xmm0, %xmm2, %xmm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x09,0x65,0xc0]
; X86-NEXT: vmovaps %xmm2, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc2]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_andnot_ps_rrk_128:		; X64-LABEL: test_mask_andnot_ps_rrk_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandnps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x55,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vandnps %xmm1, %xmm0, %xmm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x09,0x55,0xd1]		; X64-NEXT: vblendmps %xmm0, %xmm2, %xmm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x09,0x65,0xc0]
; X64-NEXT: vmovaps %xmm2, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc2]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <4 x float> @llvm.x86.avx512.mask.andn.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.andn.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_andnot_ps_rrkz_128(<4 x float> %a, <4 x float> %b, i8 %mask) {		define <4 x float> @test_mask_andnot_ps_rrkz_128(<4 x float> %a, <4 x float> %b, i8 %mask) {
; X86-LABEL: test_mask_andnot_ps_rrkz_128:		; X86-LABEL: test_mask_andnot_ps_rrkz_128:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vandnps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x55,0xc1]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]
; X86-NEXT: vandnps %xmm1, %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x55,0xc1]		; X86-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_andnot_ps_rrkz_128:		; X64-LABEL: test_mask_andnot_ps_rrkz_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandnps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x55,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vandnps %xmm1, %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x55,0xc1]		; X64-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <4 x float> @llvm.x86.avx512.mask.andn.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.andn.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_andnot_ps_rm_128(<4 x float> %a, <4 x float>* %ptr_b) {		define <4 x float> @test_mask_andnot_ps_rm_128(<4 x float> %a, <4 x float>* %ptr_b) {
; X86-LABEL: test_mask_andnot_ps_rm_128:		; X86-LABEL: test_mask_andnot_ps_rm_128:
; X86: # %bb.0:		; X86: # %bb.0:
Show All 9 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <4 x float> @llvm.x86.avx512.mask.andn.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)		%res = call <4 x float> @llvm.x86.avx512.mask.andn.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_andnot_ps_rmk_128(<4 x float> %a, <4 x float>* %ptr_b, <4 x float> %passThru, i8 %mask) {		define <4 x float> @test_mask_andnot_ps_rmk_128(<4 x float> %a, <4 x float>* %ptr_b, <4 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_andnot_ps_rmk_128:		; X86-LABEL: test_mask_andnot_ps_rmk_128:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandnps (%eax), %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x55,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandnps (%eax), %xmm0, %xmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x09,0x55,0x08]		; X86-NEXT: vblendmps %xmm0, %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x09,0x65,0xc0]
; X86-NEXT: vmovaps %xmm1, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_andnot_ps_rmk_128:		; X64-LABEL: test_mask_andnot_ps_rmk_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandnps (%rdi), %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x55,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandnps (%rdi), %xmm0, %xmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x09,0x55,0x0f]		; X64-NEXT: vblendmps %xmm0, %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x09,0x65,0xc0]
; X64-NEXT: vmovaps %xmm1, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <4 x float>, <4 x float>* %ptr_b		%b = load <4 x float>, <4 x float>* %ptr_b
%res = call <4 x float> @llvm.x86.avx512.mask.andn.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.andn.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_andnot_ps_rmkz_128(<4 x float> %a, <4 x float>* %ptr_b, i8 %mask) {		define <4 x float> @test_mask_andnot_ps_rmkz_128(<4 x float> %a, <4 x float>* %ptr_b, i8 %mask) {
; X86-LABEL: test_mask_andnot_ps_rmkz_128:		; X86-LABEL: test_mask_andnot_ps_rmkz_128:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandnps (%eax), %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x55,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandnps (%eax), %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x55,0x00]		; X86-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_andnot_ps_rmkz_128:		; X64-LABEL: test_mask_andnot_ps_rmkz_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandnps (%rdi), %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x55,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandnps (%rdi), %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x55,0x07]		; X64-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <4 x float>, <4 x float>* %ptr_b		%b = load <4 x float>, <4 x float>* %ptr_b
%res = call <4 x float> @llvm.x86.avx512.mask.andn.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.andn.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_andnot_ps_rmb_128(<4 x float> %a, float* %ptr_b) {		define <4 x float> @test_mask_andnot_ps_rmb_128(<4 x float> %a, float* %ptr_b) {
; X86-LABEL: test_mask_andnot_ps_rmb_128:		; X86-LABEL: test_mask_andnot_ps_rmb_128:
Show All 12 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <4 x float> @llvm.x86.avx512.mask.andn.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)		%res = call <4 x float> @llvm.x86.avx512.mask.andn.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_andnot_ps_rmbk_128(<4 x float> %a, float* %ptr_b, <4 x float> %passThru, i8 %mask) {		define <4 x float> @test_mask_andnot_ps_rmbk_128(<4 x float> %a, float* %ptr_b, <4 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_andnot_ps_rmbk_128:		; X86-LABEL: test_mask_andnot_ps_rmbk_128:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandnps (%eax){1to4}, %xmm0, %xmm0 # encoding: [0x62,0xf1,0x7c,0x18,0x55,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandnps (%eax){1to4}, %xmm0, %xmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x19,0x55,0x08]		; X86-NEXT: vblendmps %xmm0, %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x09,0x65,0xc0]
; X86-NEXT: vmovaps %xmm1, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_andnot_ps_rmbk_128:		; X64-LABEL: test_mask_andnot_ps_rmbk_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandnps (%rdi){1to4}, %xmm0, %xmm0 # encoding: [0x62,0xf1,0x7c,0x18,0x55,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandnps (%rdi){1to4}, %xmm0, %xmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x19,0x55,0x0f]		; X64-NEXT: vblendmps %xmm0, %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x09,0x65,0xc0]
; X64-NEXT: vmovaps %xmm1, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <4 x float> undef, float %q, i32 0		%vecinit.i = insertelement <4 x float> undef, float %q, i32 0
%b = shufflevector <4 x float> %vecinit.i, <4 x float> undef, <4 x i32> zeroinitializer		%b = shufflevector <4 x float> %vecinit.i, <4 x float> undef, <4 x i32> zeroinitializer
%res = call <4 x float> @llvm.x86.avx512.mask.andn.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.andn.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_andnot_ps_rmbkz_128(<4 x float> %a, float* %ptr_b, i8 %mask) {		define <4 x float> @test_mask_andnot_ps_rmbkz_128(<4 x float> %a, float* %ptr_b, i8 %mask) {
; X86-LABEL: test_mask_andnot_ps_rmbkz_128:		; X86-LABEL: test_mask_andnot_ps_rmbkz_128:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandnps (%eax){1to4}, %xmm0, %xmm0 # encoding: [0x62,0xf1,0x7c,0x18,0x55,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandnps (%eax){1to4}, %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x99,0x55,0x00]		; X86-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_andnot_ps_rmbkz_128:		; X64-LABEL: test_mask_andnot_ps_rmbkz_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandnps (%rdi){1to4}, %xmm0, %xmm0 # encoding: [0x62,0xf1,0x7c,0x18,0x55,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandnps (%rdi){1to4}, %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x99,0x55,0x07]		; X64-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <4 x float> undef, float %q, i32 0		%vecinit.i = insertelement <4 x float> undef, float %q, i32 0
%b = shufflevector <4 x float> %vecinit.i, <4 x float> undef, <4 x i32> zeroinitializer		%b = shufflevector <4 x float> %vecinit.i, <4 x float> undef, <4 x i32> zeroinitializer
%res = call <4 x float> @llvm.x86.avx512.mask.andn.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.andn.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

declare <4 x float> @llvm.x86.avx512.mask.andn.ps.128(<4 x float>, <4 x float>, <4 x float>, i8)		declare <4 x float> @llvm.x86.avx512.mask.andn.ps.128(<4 x float>, <4 x float>, <4 x float>, i8)

define <8 x float> @test_mask_andnot_ps_rr_256(<8 x float> %a, <8 x float> %b) {		define <8 x float> @test_mask_andnot_ps_rr_256(<8 x float> %a, <8 x float> %b) {
; CHECK-LABEL: test_mask_andnot_ps_rr_256:		; CHECK-LABEL: test_mask_andnot_ps_rr_256:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vandnps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x55,0xc1]		; CHECK-NEXT: vandnps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x55,0xc1]
; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]		; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
%res = call <8 x float> @llvm.x86.avx512.mask.andn.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)		%res = call <8 x float> @llvm.x86.avx512.mask.andn.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_andnot_ps_rrk_256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask) {		define <8 x float> @test_mask_andnot_ps_rrk_256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_andnot_ps_rrk_256:		; X86-LABEL: test_mask_andnot_ps_rrk_256:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vandnps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x55,0xc1]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]
; X86-NEXT: vandnps %ymm1, %ymm0, %ymm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x29,0x55,0xd1]		; X86-NEXT: vblendmps %ymm0, %ymm2, %ymm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x29,0x65,0xc0]
; X86-NEXT: vmovaps %ymm2, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc2]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_andnot_ps_rrk_256:		; X64-LABEL: test_mask_andnot_ps_rrk_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandnps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x55,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vandnps %ymm1, %ymm0, %ymm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x29,0x55,0xd1]		; X64-NEXT: vblendmps %ymm0, %ymm2, %ymm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x29,0x65,0xc0]
; X64-NEXT: vmovaps %ymm2, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc2]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <8 x float> @llvm.x86.avx512.mask.andn.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.andn.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_andnot_ps_rrkz_256(<8 x float> %a, <8 x float> %b, i8 %mask) {		define <8 x float> @test_mask_andnot_ps_rrkz_256(<8 x float> %a, <8 x float> %b, i8 %mask) {
; X86-LABEL: test_mask_andnot_ps_rrkz_256:		; X86-LABEL: test_mask_andnot_ps_rrkz_256:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vandnps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x55,0xc1]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]
; X86-NEXT: vandnps %ymm1, %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x55,0xc1]		; X86-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_andnot_ps_rrkz_256:		; X64-LABEL: test_mask_andnot_ps_rrkz_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandnps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x55,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vandnps %ymm1, %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x55,0xc1]		; X64-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <8 x float> @llvm.x86.avx512.mask.andn.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.andn.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_andnot_ps_rm_256(<8 x float> %a, <8 x float>* %ptr_b) {		define <8 x float> @test_mask_andnot_ps_rm_256(<8 x float> %a, <8 x float>* %ptr_b) {
; X86-LABEL: test_mask_andnot_ps_rm_256:		; X86-LABEL: test_mask_andnot_ps_rm_256:
; X86: # %bb.0:		; X86: # %bb.0:
Show All 9 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <8 x float> @llvm.x86.avx512.mask.andn.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)		%res = call <8 x float> @llvm.x86.avx512.mask.andn.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_andnot_ps_rmk_256(<8 x float> %a, <8 x float>* %ptr_b, <8 x float> %passThru, i8 %mask) {		define <8 x float> @test_mask_andnot_ps_rmk_256(<8 x float> %a, <8 x float>* %ptr_b, <8 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_andnot_ps_rmk_256:		; X86-LABEL: test_mask_andnot_ps_rmk_256:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandnps (%eax), %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x55,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandnps (%eax), %ymm0, %ymm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x29,0x55,0x08]		; X86-NEXT: vblendmps %ymm0, %ymm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x75,0x29,0x65,0xc0]
; X86-NEXT: vmovaps %ymm1, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_andnot_ps_rmk_256:		; X64-LABEL: test_mask_andnot_ps_rmk_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandnps (%rdi), %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x55,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandnps (%rdi), %ymm0, %ymm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x29,0x55,0x0f]		; X64-NEXT: vblendmps %ymm0, %ymm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x75,0x29,0x65,0xc0]
; X64-NEXT: vmovaps %ymm1, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <8 x float>, <8 x float>* %ptr_b		%b = load <8 x float>, <8 x float>* %ptr_b
%res = call <8 x float> @llvm.x86.avx512.mask.andn.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.andn.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_andnot_ps_rmkz_256(<8 x float> %a, <8 x float>* %ptr_b, i8 %mask) {		define <8 x float> @test_mask_andnot_ps_rmkz_256(<8 x float> %a, <8 x float>* %ptr_b, i8 %mask) {
; X86-LABEL: test_mask_andnot_ps_rmkz_256:		; X86-LABEL: test_mask_andnot_ps_rmkz_256:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandnps (%eax), %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x55,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandnps (%eax), %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x55,0x00]		; X86-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_andnot_ps_rmkz_256:		; X64-LABEL: test_mask_andnot_ps_rmkz_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandnps (%rdi), %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x55,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandnps (%rdi), %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x55,0x07]		; X64-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <8 x float>, <8 x float>* %ptr_b		%b = load <8 x float>, <8 x float>* %ptr_b
%res = call <8 x float> @llvm.x86.avx512.mask.andn.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.andn.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_andnot_ps_rmb_256(<8 x float> %a, float* %ptr_b) {		define <8 x float> @test_mask_andnot_ps_rmb_256(<8 x float> %a, float* %ptr_b) {
; X86-LABEL: test_mask_andnot_ps_rmb_256:		; X86-LABEL: test_mask_andnot_ps_rmb_256:
Show All 12 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <8 x float> @llvm.x86.avx512.mask.andn.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)		%res = call <8 x float> @llvm.x86.avx512.mask.andn.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_andnot_ps_rmbk_256(<8 x float> %a, float* %ptr_b, <8 x float> %passThru, i8 %mask) {		define <8 x float> @test_mask_andnot_ps_rmbk_256(<8 x float> %a, float* %ptr_b, <8 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_andnot_ps_rmbk_256:		; X86-LABEL: test_mask_andnot_ps_rmbk_256:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandnps (%eax){1to8}, %ymm0, %ymm0 # encoding: [0x62,0xf1,0x7c,0x38,0x55,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandnps (%eax){1to8}, %ymm0, %ymm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x39,0x55,0x08]		; X86-NEXT: vblendmps %ymm0, %ymm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x75,0x29,0x65,0xc0]
; X86-NEXT: vmovaps %ymm1, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_andnot_ps_rmbk_256:		; X64-LABEL: test_mask_andnot_ps_rmbk_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandnps (%rdi){1to8}, %ymm0, %ymm0 # encoding: [0x62,0xf1,0x7c,0x38,0x55,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandnps (%rdi){1to8}, %ymm0, %ymm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x39,0x55,0x0f]		; X64-NEXT: vblendmps %ymm0, %ymm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x75,0x29,0x65,0xc0]
; X64-NEXT: vmovaps %ymm1, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <8 x float> undef, float %q, i32 0		%vecinit.i = insertelement <8 x float> undef, float %q, i32 0
%b = shufflevector <8 x float> %vecinit.i, <8 x float> undef, <8 x i32> zeroinitializer		%b = shufflevector <8 x float> %vecinit.i, <8 x float> undef, <8 x i32> zeroinitializer
%res = call <8 x float> @llvm.x86.avx512.mask.andn.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.andn.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_andnot_ps_rmbkz_256(<8 x float> %a, float* %ptr_b, i8 %mask) {		define <8 x float> @test_mask_andnot_ps_rmbkz_256(<8 x float> %a, float* %ptr_b, i8 %mask) {
; X86-LABEL: test_mask_andnot_ps_rmbkz_256:		; X86-LABEL: test_mask_andnot_ps_rmbkz_256:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandnps (%eax){1to8}, %ymm0, %ymm0 # encoding: [0x62,0xf1,0x7c,0x38,0x55,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandnps (%eax){1to8}, %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xb9,0x55,0x00]		; X86-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_andnot_ps_rmbkz_256:		; X64-LABEL: test_mask_andnot_ps_rmbkz_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandnps (%rdi){1to8}, %ymm0, %ymm0 # encoding: [0x62,0xf1,0x7c,0x38,0x55,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandnps (%rdi){1to8}, %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xb9,0x55,0x07]		; X64-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <8 x float> undef, float %q, i32 0		%vecinit.i = insertelement <8 x float> undef, float %q, i32 0
%b = shufflevector <8 x float> %vecinit.i, <8 x float> undef, <8 x i32> zeroinitializer		%b = shufflevector <8 x float> %vecinit.i, <8 x float> undef, <8 x i32> zeroinitializer
%res = call <8 x float> @llvm.x86.avx512.mask.andn.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.andn.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

declare <8 x float> @llvm.x86.avx512.mask.andn.ps.256(<8 x float>, <8 x float>, <8 x float>, i8)		declare <8 x float> @llvm.x86.avx512.mask.andn.ps.256(<8 x float>, <8 x float>, <8 x float>, i8)

define <16 x float> @test_mask_andnot_ps_rr_512(<16 x float> %a, <16 x float> %b) {		define <16 x float> @test_mask_andnot_ps_rr_512(<16 x float> %a, <16 x float> %b) {
; CHECK-LABEL: test_mask_andnot_ps_rr_512:		; CHECK-LABEL: test_mask_andnot_ps_rr_512:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vandnps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x55,0xc1]		; CHECK-NEXT: vandnps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x55,0xc1]
; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]		; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
%res = call <16 x float> @llvm.x86.avx512.mask.andn.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)		%res = call <16 x float> @llvm.x86.avx512.mask.andn.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_andnot_ps_rrk_512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask) {		define <16 x float> @test_mask_andnot_ps_rrk_512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask) {
; X86-LABEL: test_mask_andnot_ps_rrk_512:		; X86-LABEL: test_mask_andnot_ps_rrk_512:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vandnps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x55,0xc1]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]
; X86-NEXT: vandnps %zmm1, %zmm0, %zmm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x49,0x55,0xd1]		; X86-NEXT: vblendmps %zmm0, %zmm2, %zmm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x49,0x65,0xc0]
; X86-NEXT: vmovaps %zmm2, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc2]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_andnot_ps_rrk_512:		; X64-LABEL: test_mask_andnot_ps_rrk_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandnps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x55,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vandnps %zmm1, %zmm0, %zmm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x49,0x55,0xd1]		; X64-NEXT: vblendmps %zmm0, %zmm2, %zmm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x49,0x65,0xc0]
; X64-NEXT: vmovaps %zmm2, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc2]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <16 x float> @llvm.x86.avx512.mask.andn.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.andn.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_andnot_ps_rrkz_512(<16 x float> %a, <16 x float> %b, i16 %mask) {		define <16 x float> @test_mask_andnot_ps_rrkz_512(<16 x float> %a, <16 x float> %b, i16 %mask) {
; X86-LABEL: test_mask_andnot_ps_rrkz_512:		; X86-LABEL: test_mask_andnot_ps_rrkz_512:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vandnps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x55,0xc1]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]
; X86-NEXT: vandnps %zmm1, %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x55,0xc1]		; X86-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_andnot_ps_rrkz_512:		; X64-LABEL: test_mask_andnot_ps_rrkz_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandnps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x55,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vandnps %zmm1, %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x55,0xc1]		; X64-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <16 x float> @llvm.x86.avx512.mask.andn.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.andn.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_andnot_ps_rm_512(<16 x float> %a, <16 x float>* %ptr_b) {		define <16 x float> @test_mask_andnot_ps_rm_512(<16 x float> %a, <16 x float>* %ptr_b) {
; X86-LABEL: test_mask_andnot_ps_rm_512:		; X86-LABEL: test_mask_andnot_ps_rm_512:
; X86: # %bb.0:		; X86: # %bb.0:
Show All 9 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <16 x float> @llvm.x86.avx512.mask.andn.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)		%res = call <16 x float> @llvm.x86.avx512.mask.andn.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_andnot_ps_rmk_512(<16 x float> %a, <16 x float>* %ptr_b, <16 x float> %passThru, i16 %mask) {		define <16 x float> @test_mask_andnot_ps_rmk_512(<16 x float> %a, <16 x float>* %ptr_b, <16 x float> %passThru, i16 %mask) {
; X86-LABEL: test_mask_andnot_ps_rmk_512:		; X86-LABEL: test_mask_andnot_ps_rmk_512:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandnps (%eax), %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x55,0x00]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandnps (%eax), %zmm0, %zmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x49,0x55,0x08]		; X86-NEXT: vblendmps %zmm0, %zmm1, %zmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x49,0x65,0xc0]
; X86-NEXT: vmovaps %zmm1, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_andnot_ps_rmk_512:		; X64-LABEL: test_mask_andnot_ps_rmk_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandnps (%rdi), %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x55,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandnps (%rdi), %zmm0, %zmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x49,0x55,0x0f]		; X64-NEXT: vblendmps %zmm0, %zmm1, %zmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x49,0x65,0xc0]
; X64-NEXT: vmovaps %zmm1, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <16 x float>, <16 x float>* %ptr_b		%b = load <16 x float>, <16 x float>* %ptr_b
%res = call <16 x float> @llvm.x86.avx512.mask.andn.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.andn.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_andnot_ps_rmkz_512(<16 x float> %a, <16 x float>* %ptr_b, i16 %mask) {		define <16 x float> @test_mask_andnot_ps_rmkz_512(<16 x float> %a, <16 x float>* %ptr_b, i16 %mask) {
; X86-LABEL: test_mask_andnot_ps_rmkz_512:		; X86-LABEL: test_mask_andnot_ps_rmkz_512:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandnps (%eax), %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x55,0x00]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandnps (%eax), %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x55,0x00]		; X86-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_andnot_ps_rmkz_512:		; X64-LABEL: test_mask_andnot_ps_rmkz_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandnps (%rdi), %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x55,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandnps (%rdi), %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x55,0x07]		; X64-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <16 x float>, <16 x float>* %ptr_b		%b = load <16 x float>, <16 x float>* %ptr_b
%res = call <16 x float> @llvm.x86.avx512.mask.andn.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.andn.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_andnot_ps_rmb_512(<16 x float> %a, float* %ptr_b) {		define <16 x float> @test_mask_andnot_ps_rmb_512(<16 x float> %a, float* %ptr_b) {
; X86-LABEL: test_mask_andnot_ps_rmb_512:		; X86-LABEL: test_mask_andnot_ps_rmb_512:
Show All 12 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <16 x float> @llvm.x86.avx512.mask.andn.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)		%res = call <16 x float> @llvm.x86.avx512.mask.andn.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_andnot_ps_rmbk_512(<16 x float> %a, float* %ptr_b, <16 x float> %passThru, i16 %mask) {		define <16 x float> @test_mask_andnot_ps_rmbk_512(<16 x float> %a, float* %ptr_b, <16 x float> %passThru, i16 %mask) {
; X86-LABEL: test_mask_andnot_ps_rmbk_512:		; X86-LABEL: test_mask_andnot_ps_rmbk_512:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandnps (%eax){1to16}, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x58,0x55,0x00]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandnps (%eax){1to16}, %zmm0, %zmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x59,0x55,0x08]		; X86-NEXT: vblendmps %zmm0, %zmm1, %zmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x49,0x65,0xc0]
; X86-NEXT: vmovaps %zmm1, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_andnot_ps_rmbk_512:		; X64-LABEL: test_mask_andnot_ps_rmbk_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandnps (%rdi){1to16}, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x58,0x55,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandnps (%rdi){1to16}, %zmm0, %zmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x59,0x55,0x0f]		; X64-NEXT: vblendmps %zmm0, %zmm1, %zmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x49,0x65,0xc0]
; X64-NEXT: vmovaps %zmm1, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <16 x float> undef, float %q, i32 0		%vecinit.i = insertelement <16 x float> undef, float %q, i32 0
%b = shufflevector <16 x float> %vecinit.i, <16 x float> undef, <16 x i32> zeroinitializer		%b = shufflevector <16 x float> %vecinit.i, <16 x float> undef, <16 x i32> zeroinitializer
%res = call <16 x float> @llvm.x86.avx512.mask.andn.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.andn.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_andnot_ps_rmbkz_512(<16 x float> %a, float* %ptr_b, i16 %mask) {		define <16 x float> @test_mask_andnot_ps_rmbkz_512(<16 x float> %a, float* %ptr_b, i16 %mask) {
; X86-LABEL: test_mask_andnot_ps_rmbkz_512:		; X86-LABEL: test_mask_andnot_ps_rmbkz_512:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandnps (%eax){1to16}, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x58,0x55,0x00]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandnps (%eax){1to16}, %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xd9,0x55,0x00]		; X86-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_andnot_ps_rmbkz_512:		; X64-LABEL: test_mask_andnot_ps_rmbkz_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandnps (%rdi){1to16}, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x58,0x55,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandnps (%rdi){1to16}, %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xd9,0x55,0x07]		; X64-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <16 x float> undef, float %q, i32 0		%vecinit.i = insertelement <16 x float> undef, float %q, i32 0
%b = shufflevector <16 x float> %vecinit.i, <16 x float> undef, <16 x i32> zeroinitializer		%b = shufflevector <16 x float> %vecinit.i, <16 x float> undef, <16 x i32> zeroinitializer
%res = call <16 x float> @llvm.x86.avx512.mask.andn.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.andn.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

declare <16 x float> @llvm.x86.avx512.mask.andn.ps.512(<16 x float>, <16 x float>, <16 x float>, i16)		declare <16 x float> @llvm.x86.avx512.mask.andn.ps.512(<16 x float>, <16 x float>, <16 x float>, i16)

define <4 x float> @test_mask_and_ps_rr_128(<4 x float> %a, <4 x float> %b) {		define <4 x float> @test_mask_and_ps_rr_128(<4 x float> %a, <4 x float> %b) {
; CHECK-LABEL: test_mask_and_ps_rr_128:		; CHECK-LABEL: test_mask_and_ps_rr_128:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vandps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x54,0xc1]		; CHECK-NEXT: vandps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x54,0xc1]
; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]		; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
%res = call <4 x float> @llvm.x86.avx512.mask.and.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)		%res = call <4 x float> @llvm.x86.avx512.mask.and.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_and_ps_rrk_128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask) {		define <4 x float> @test_mask_and_ps_rrk_128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_and_ps_rrk_128:		; X86-LABEL: test_mask_and_ps_rrk_128:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vandps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x54,0xc1]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]
; X86-NEXT: vandps %xmm1, %xmm0, %xmm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x09,0x54,0xd1]		; X86-NEXT: vblendmps %xmm0, %xmm2, %xmm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x09,0x65,0xc0]
; X86-NEXT: vmovaps %xmm2, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc2]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_and_ps_rrk_128:		; X64-LABEL: test_mask_and_ps_rrk_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x54,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vandps %xmm1, %xmm0, %xmm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x09,0x54,0xd1]		; X64-NEXT: vblendmps %xmm0, %xmm2, %xmm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x09,0x65,0xc0]
; X64-NEXT: vmovaps %xmm2, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc2]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <4 x float> @llvm.x86.avx512.mask.and.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.and.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_and_ps_rrkz_128(<4 x float> %a, <4 x float> %b, i8 %mask) {		define <4 x float> @test_mask_and_ps_rrkz_128(<4 x float> %a, <4 x float> %b, i8 %mask) {
; X86-LABEL: test_mask_and_ps_rrkz_128:		; X86-LABEL: test_mask_and_ps_rrkz_128:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vandps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x54,0xc1]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]
; X86-NEXT: vandps %xmm1, %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x54,0xc1]		; X86-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_and_ps_rrkz_128:		; X64-LABEL: test_mask_and_ps_rrkz_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x54,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vandps %xmm1, %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x54,0xc1]		; X64-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <4 x float> @llvm.x86.avx512.mask.and.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.and.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_and_ps_rm_128(<4 x float> %a, <4 x float>* %ptr_b) {		define <4 x float> @test_mask_and_ps_rm_128(<4 x float> %a, <4 x float>* %ptr_b) {
; X86-LABEL: test_mask_and_ps_rm_128:		; X86-LABEL: test_mask_and_ps_rm_128:
; X86: # %bb.0:		; X86: # %bb.0:
Show All 9 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <4 x float> @llvm.x86.avx512.mask.and.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)		%res = call <4 x float> @llvm.x86.avx512.mask.and.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_and_ps_rmk_128(<4 x float> %a, <4 x float>* %ptr_b, <4 x float> %passThru, i8 %mask) {		define <4 x float> @test_mask_and_ps_rmk_128(<4 x float> %a, <4 x float>* %ptr_b, <4 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_and_ps_rmk_128:		; X86-LABEL: test_mask_and_ps_rmk_128:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandps (%eax), %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x54,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandps (%eax), %xmm0, %xmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x09,0x54,0x08]		; X86-NEXT: vblendmps %xmm0, %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x09,0x65,0xc0]
; X86-NEXT: vmovaps %xmm1, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_and_ps_rmk_128:		; X64-LABEL: test_mask_and_ps_rmk_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandps (%rdi), %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x54,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandps (%rdi), %xmm0, %xmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x09,0x54,0x0f]		; X64-NEXT: vblendmps %xmm0, %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x09,0x65,0xc0]
; X64-NEXT: vmovaps %xmm1, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <4 x float>, <4 x float>* %ptr_b		%b = load <4 x float>, <4 x float>* %ptr_b
%res = call <4 x float> @llvm.x86.avx512.mask.and.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.and.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_and_ps_rmkz_128(<4 x float> %a, <4 x float>* %ptr_b, i8 %mask) {		define <4 x float> @test_mask_and_ps_rmkz_128(<4 x float> %a, <4 x float>* %ptr_b, i8 %mask) {
; X86-LABEL: test_mask_and_ps_rmkz_128:		; X86-LABEL: test_mask_and_ps_rmkz_128:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandps (%eax), %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x54,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandps (%eax), %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x54,0x00]		; X86-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_and_ps_rmkz_128:		; X64-LABEL: test_mask_and_ps_rmkz_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandps (%rdi), %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x54,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandps (%rdi), %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x54,0x07]		; X64-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <4 x float>, <4 x float>* %ptr_b		%b = load <4 x float>, <4 x float>* %ptr_b
%res = call <4 x float> @llvm.x86.avx512.mask.and.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.and.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_and_ps_rmb_128(<4 x float> %a, float* %ptr_b) {		define <4 x float> @test_mask_and_ps_rmb_128(<4 x float> %a, float* %ptr_b) {
; X86-LABEL: test_mask_and_ps_rmb_128:		; X86-LABEL: test_mask_and_ps_rmb_128:
Show All 12 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <4 x float> @llvm.x86.avx512.mask.and.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)		%res = call <4 x float> @llvm.x86.avx512.mask.and.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_and_ps_rmbk_128(<4 x float> %a, float* %ptr_b, <4 x float> %passThru, i8 %mask) {		define <4 x float> @test_mask_and_ps_rmbk_128(<4 x float> %a, float* %ptr_b, <4 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_and_ps_rmbk_128:		; X86-LABEL: test_mask_and_ps_rmbk_128:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandps (%eax){1to4}, %xmm0, %xmm0 # encoding: [0x62,0xf1,0x7c,0x18,0x54,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandps (%eax){1to4}, %xmm0, %xmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x19,0x54,0x08]		; X86-NEXT: vblendmps %xmm0, %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x09,0x65,0xc0]
; X86-NEXT: vmovaps %xmm1, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_and_ps_rmbk_128:		; X64-LABEL: test_mask_and_ps_rmbk_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandps (%rdi){1to4}, %xmm0, %xmm0 # encoding: [0x62,0xf1,0x7c,0x18,0x54,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandps (%rdi){1to4}, %xmm0, %xmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x19,0x54,0x0f]		; X64-NEXT: vblendmps %xmm0, %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x09,0x65,0xc0]
; X64-NEXT: vmovaps %xmm1, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <4 x float> undef, float %q, i32 0		%vecinit.i = insertelement <4 x float> undef, float %q, i32 0
%b = shufflevector <4 x float> %vecinit.i, <4 x float> undef, <4 x i32> zeroinitializer		%b = shufflevector <4 x float> %vecinit.i, <4 x float> undef, <4 x i32> zeroinitializer
%res = call <4 x float> @llvm.x86.avx512.mask.and.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.and.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_and_ps_rmbkz_128(<4 x float> %a, float* %ptr_b, i8 %mask) {		define <4 x float> @test_mask_and_ps_rmbkz_128(<4 x float> %a, float* %ptr_b, i8 %mask) {
; X86-LABEL: test_mask_and_ps_rmbkz_128:		; X86-LABEL: test_mask_and_ps_rmbkz_128:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandps (%eax){1to4}, %xmm0, %xmm0 # encoding: [0x62,0xf1,0x7c,0x18,0x54,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandps (%eax){1to4}, %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x99,0x54,0x00]		; X86-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_and_ps_rmbkz_128:		; X64-LABEL: test_mask_and_ps_rmbkz_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandps (%rdi){1to4}, %xmm0, %xmm0 # encoding: [0x62,0xf1,0x7c,0x18,0x54,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandps (%rdi){1to4}, %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x99,0x54,0x07]		; X64-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <4 x float> undef, float %q, i32 0		%vecinit.i = insertelement <4 x float> undef, float %q, i32 0
%b = shufflevector <4 x float> %vecinit.i, <4 x float> undef, <4 x i32> zeroinitializer		%b = shufflevector <4 x float> %vecinit.i, <4 x float> undef, <4 x i32> zeroinitializer
%res = call <4 x float> @llvm.x86.avx512.mask.and.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.and.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

declare <4 x float> @llvm.x86.avx512.mask.and.ps.128(<4 x float>, <4 x float>, <4 x float>, i8)		declare <4 x float> @llvm.x86.avx512.mask.and.ps.128(<4 x float>, <4 x float>, <4 x float>, i8)

define <8 x float> @test_mask_and_ps_rr_256(<8 x float> %a, <8 x float> %b) {		define <8 x float> @test_mask_and_ps_rr_256(<8 x float> %a, <8 x float> %b) {
; CHECK-LABEL: test_mask_and_ps_rr_256:		; CHECK-LABEL: test_mask_and_ps_rr_256:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vandps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x54,0xc1]		; CHECK-NEXT: vandps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x54,0xc1]
; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]		; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
%res = call <8 x float> @llvm.x86.avx512.mask.and.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)		%res = call <8 x float> @llvm.x86.avx512.mask.and.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_and_ps_rrk_256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask) {		define <8 x float> @test_mask_and_ps_rrk_256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_and_ps_rrk_256:		; X86-LABEL: test_mask_and_ps_rrk_256:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vandps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x54,0xc1]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]
; X86-NEXT: vandps %ymm1, %ymm0, %ymm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x29,0x54,0xd1]		; X86-NEXT: vblendmps %ymm0, %ymm2, %ymm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x29,0x65,0xc0]
; X86-NEXT: vmovaps %ymm2, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc2]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_and_ps_rrk_256:		; X64-LABEL: test_mask_and_ps_rrk_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x54,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vandps %ymm1, %ymm0, %ymm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x29,0x54,0xd1]		; X64-NEXT: vblendmps %ymm0, %ymm2, %ymm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x29,0x65,0xc0]
; X64-NEXT: vmovaps %ymm2, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc2]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <8 x float> @llvm.x86.avx512.mask.and.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.and.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_and_ps_rrkz_256(<8 x float> %a, <8 x float> %b, i8 %mask) {		define <8 x float> @test_mask_and_ps_rrkz_256(<8 x float> %a, <8 x float> %b, i8 %mask) {
; X86-LABEL: test_mask_and_ps_rrkz_256:		; X86-LABEL: test_mask_and_ps_rrkz_256:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vandps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x54,0xc1]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]
; X86-NEXT: vandps %ymm1, %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x54,0xc1]		; X86-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_and_ps_rrkz_256:		; X64-LABEL: test_mask_and_ps_rrkz_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x54,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vandps %ymm1, %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x54,0xc1]		; X64-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <8 x float> @llvm.x86.avx512.mask.and.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.and.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_and_ps_rm_256(<8 x float> %a, <8 x float>* %ptr_b) {		define <8 x float> @test_mask_and_ps_rm_256(<8 x float> %a, <8 x float>* %ptr_b) {
; X86-LABEL: test_mask_and_ps_rm_256:		; X86-LABEL: test_mask_and_ps_rm_256:
; X86: # %bb.0:		; X86: # %bb.0:
Show All 9 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <8 x float> @llvm.x86.avx512.mask.and.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)		%res = call <8 x float> @llvm.x86.avx512.mask.and.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_and_ps_rmk_256(<8 x float> %a, <8 x float>* %ptr_b, <8 x float> %passThru, i8 %mask) {		define <8 x float> @test_mask_and_ps_rmk_256(<8 x float> %a, <8 x float>* %ptr_b, <8 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_and_ps_rmk_256:		; X86-LABEL: test_mask_and_ps_rmk_256:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandps (%eax), %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x54,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandps (%eax), %ymm0, %ymm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x29,0x54,0x08]		; X86-NEXT: vblendmps %ymm0, %ymm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x75,0x29,0x65,0xc0]
; X86-NEXT: vmovaps %ymm1, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_and_ps_rmk_256:		; X64-LABEL: test_mask_and_ps_rmk_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandps (%rdi), %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x54,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandps (%rdi), %ymm0, %ymm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x29,0x54,0x0f]		; X64-NEXT: vblendmps %ymm0, %ymm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x75,0x29,0x65,0xc0]
; X64-NEXT: vmovaps %ymm1, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <8 x float>, <8 x float>* %ptr_b		%b = load <8 x float>, <8 x float>* %ptr_b
%res = call <8 x float> @llvm.x86.avx512.mask.and.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.and.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_and_ps_rmkz_256(<8 x float> %a, <8 x float>* %ptr_b, i8 %mask) {		define <8 x float> @test_mask_and_ps_rmkz_256(<8 x float> %a, <8 x float>* %ptr_b, i8 %mask) {
; X86-LABEL: test_mask_and_ps_rmkz_256:		; X86-LABEL: test_mask_and_ps_rmkz_256:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandps (%eax), %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x54,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandps (%eax), %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x54,0x00]		; X86-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_and_ps_rmkz_256:		; X64-LABEL: test_mask_and_ps_rmkz_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandps (%rdi), %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x54,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandps (%rdi), %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x54,0x07]		; X64-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <8 x float>, <8 x float>* %ptr_b		%b = load <8 x float>, <8 x float>* %ptr_b
%res = call <8 x float> @llvm.x86.avx512.mask.and.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.and.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_and_ps_rmb_256(<8 x float> %a, float* %ptr_b) {		define <8 x float> @test_mask_and_ps_rmb_256(<8 x float> %a, float* %ptr_b) {
; X86-LABEL: test_mask_and_ps_rmb_256:		; X86-LABEL: test_mask_and_ps_rmb_256:
Show All 12 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <8 x float> @llvm.x86.avx512.mask.and.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)		%res = call <8 x float> @llvm.x86.avx512.mask.and.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_and_ps_rmbk_256(<8 x float> %a, float* %ptr_b, <8 x float> %passThru, i8 %mask) {		define <8 x float> @test_mask_and_ps_rmbk_256(<8 x float> %a, float* %ptr_b, <8 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_and_ps_rmbk_256:		; X86-LABEL: test_mask_and_ps_rmbk_256:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandps (%eax){1to8}, %ymm0, %ymm0 # encoding: [0x62,0xf1,0x7c,0x38,0x54,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandps (%eax){1to8}, %ymm0, %ymm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x39,0x54,0x08]		; X86-NEXT: vblendmps %ymm0, %ymm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x75,0x29,0x65,0xc0]
; X86-NEXT: vmovaps %ymm1, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_and_ps_rmbk_256:		; X64-LABEL: test_mask_and_ps_rmbk_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandps (%rdi){1to8}, %ymm0, %ymm0 # encoding: [0x62,0xf1,0x7c,0x38,0x54,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandps (%rdi){1to8}, %ymm0, %ymm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x39,0x54,0x0f]		; X64-NEXT: vblendmps %ymm0, %ymm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x75,0x29,0x65,0xc0]
; X64-NEXT: vmovaps %ymm1, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <8 x float> undef, float %q, i32 0		%vecinit.i = insertelement <8 x float> undef, float %q, i32 0
%b = shufflevector <8 x float> %vecinit.i, <8 x float> undef, <8 x i32> zeroinitializer		%b = shufflevector <8 x float> %vecinit.i, <8 x float> undef, <8 x i32> zeroinitializer
%res = call <8 x float> @llvm.x86.avx512.mask.and.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.and.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_and_ps_rmbkz_256(<8 x float> %a, float* %ptr_b, i8 %mask) {		define <8 x float> @test_mask_and_ps_rmbkz_256(<8 x float> %a, float* %ptr_b, i8 %mask) {
; X86-LABEL: test_mask_and_ps_rmbkz_256:		; X86-LABEL: test_mask_and_ps_rmbkz_256:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandps (%eax){1to8}, %ymm0, %ymm0 # encoding: [0x62,0xf1,0x7c,0x38,0x54,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandps (%eax){1to8}, %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xb9,0x54,0x00]		; X86-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_and_ps_rmbkz_256:		; X64-LABEL: test_mask_and_ps_rmbkz_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandps (%rdi){1to8}, %ymm0, %ymm0 # encoding: [0x62,0xf1,0x7c,0x38,0x54,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandps (%rdi){1to8}, %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xb9,0x54,0x07]		; X64-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <8 x float> undef, float %q, i32 0		%vecinit.i = insertelement <8 x float> undef, float %q, i32 0
%b = shufflevector <8 x float> %vecinit.i, <8 x float> undef, <8 x i32> zeroinitializer		%b = shufflevector <8 x float> %vecinit.i, <8 x float> undef, <8 x i32> zeroinitializer
%res = call <8 x float> @llvm.x86.avx512.mask.and.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.and.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

declare <8 x float> @llvm.x86.avx512.mask.and.ps.256(<8 x float>, <8 x float>, <8 x float>, i8)		declare <8 x float> @llvm.x86.avx512.mask.and.ps.256(<8 x float>, <8 x float>, <8 x float>, i8)

define <16 x float> @test_mask_and_ps_rr_512(<16 x float> %a, <16 x float> %b) {		define <16 x float> @test_mask_and_ps_rr_512(<16 x float> %a, <16 x float> %b) {
; CHECK-LABEL: test_mask_and_ps_rr_512:		; CHECK-LABEL: test_mask_and_ps_rr_512:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vandps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x54,0xc1]		; CHECK-NEXT: vandps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x54,0xc1]
; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]		; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
%res = call <16 x float> @llvm.x86.avx512.mask.and.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)		%res = call <16 x float> @llvm.x86.avx512.mask.and.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_and_ps_rrk_512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask) {		define <16 x float> @test_mask_and_ps_rrk_512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask) {
; X86-LABEL: test_mask_and_ps_rrk_512:		; X86-LABEL: test_mask_and_ps_rrk_512:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vandps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x54,0xc1]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]
; X86-NEXT: vandps %zmm1, %zmm0, %zmm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x49,0x54,0xd1]		; X86-NEXT: vblendmps %zmm0, %zmm2, %zmm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x49,0x65,0xc0]
; X86-NEXT: vmovaps %zmm2, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc2]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_and_ps_rrk_512:		; X64-LABEL: test_mask_and_ps_rrk_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x54,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vandps %zmm1, %zmm0, %zmm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x49,0x54,0xd1]		; X64-NEXT: vblendmps %zmm0, %zmm2, %zmm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x49,0x65,0xc0]
; X64-NEXT: vmovaps %zmm2, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc2]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <16 x float> @llvm.x86.avx512.mask.and.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.and.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_and_ps_rrkz_512(<16 x float> %a, <16 x float> %b, i16 %mask) {		define <16 x float> @test_mask_and_ps_rrkz_512(<16 x float> %a, <16 x float> %b, i16 %mask) {
; X86-LABEL: test_mask_and_ps_rrkz_512:		; X86-LABEL: test_mask_and_ps_rrkz_512:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vandps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x54,0xc1]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]
; X86-NEXT: vandps %zmm1, %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x54,0xc1]		; X86-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_and_ps_rrkz_512:		; X64-LABEL: test_mask_and_ps_rrkz_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x54,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vandps %zmm1, %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x54,0xc1]		; X64-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <16 x float> @llvm.x86.avx512.mask.and.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.and.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_and_ps_rm_512(<16 x float> %a, <16 x float>* %ptr_b) {		define <16 x float> @test_mask_and_ps_rm_512(<16 x float> %a, <16 x float>* %ptr_b) {
; X86-LABEL: test_mask_and_ps_rm_512:		; X86-LABEL: test_mask_and_ps_rm_512:
; X86: # %bb.0:		; X86: # %bb.0:
Show All 9 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <16 x float> @llvm.x86.avx512.mask.and.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)		%res = call <16 x float> @llvm.x86.avx512.mask.and.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_and_ps_rmk_512(<16 x float> %a, <16 x float>* %ptr_b, <16 x float> %passThru, i16 %mask) {		define <16 x float> @test_mask_and_ps_rmk_512(<16 x float> %a, <16 x float>* %ptr_b, <16 x float> %passThru, i16 %mask) {
; X86-LABEL: test_mask_and_ps_rmk_512:		; X86-LABEL: test_mask_and_ps_rmk_512:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandps (%eax), %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x54,0x00]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandps (%eax), %zmm0, %zmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x49,0x54,0x08]		; X86-NEXT: vblendmps %zmm0, %zmm1, %zmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x49,0x65,0xc0]
; X86-NEXT: vmovaps %zmm1, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_and_ps_rmk_512:		; X64-LABEL: test_mask_and_ps_rmk_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandps (%rdi), %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x54,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandps (%rdi), %zmm0, %zmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x49,0x54,0x0f]		; X64-NEXT: vblendmps %zmm0, %zmm1, %zmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x49,0x65,0xc0]
; X64-NEXT: vmovaps %zmm1, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <16 x float>, <16 x float>* %ptr_b		%b = load <16 x float>, <16 x float>* %ptr_b
%res = call <16 x float> @llvm.x86.avx512.mask.and.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.and.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_and_ps_rmkz_512(<16 x float> %a, <16 x float>* %ptr_b, i16 %mask) {		define <16 x float> @test_mask_and_ps_rmkz_512(<16 x float> %a, <16 x float>* %ptr_b, i16 %mask) {
; X86-LABEL: test_mask_and_ps_rmkz_512:		; X86-LABEL: test_mask_and_ps_rmkz_512:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandps (%eax), %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x54,0x00]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandps (%eax), %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x54,0x00]		; X86-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_and_ps_rmkz_512:		; X64-LABEL: test_mask_and_ps_rmkz_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandps (%rdi), %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x54,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandps (%rdi), %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x54,0x07]		; X64-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <16 x float>, <16 x float>* %ptr_b		%b = load <16 x float>, <16 x float>* %ptr_b
%res = call <16 x float> @llvm.x86.avx512.mask.and.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.and.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_and_ps_rmb_512(<16 x float> %a, float* %ptr_b) {		define <16 x float> @test_mask_and_ps_rmb_512(<16 x float> %a, float* %ptr_b) {
; X86-LABEL: test_mask_and_ps_rmb_512:		; X86-LABEL: test_mask_and_ps_rmb_512:
Show All 12 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <16 x float> @llvm.x86.avx512.mask.and.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)		%res = call <16 x float> @llvm.x86.avx512.mask.and.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_and_ps_rmbk_512(<16 x float> %a, float* %ptr_b, <16 x float> %passThru, i16 %mask) {		define <16 x float> @test_mask_and_ps_rmbk_512(<16 x float> %a, float* %ptr_b, <16 x float> %passThru, i16 %mask) {
; X86-LABEL: test_mask_and_ps_rmbk_512:		; X86-LABEL: test_mask_and_ps_rmbk_512:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandps (%eax){1to16}, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x58,0x54,0x00]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandps (%eax){1to16}, %zmm0, %zmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x59,0x54,0x08]		; X86-NEXT: vblendmps %zmm0, %zmm1, %zmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x49,0x65,0xc0]
; X86-NEXT: vmovaps %zmm1, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_and_ps_rmbk_512:		; X64-LABEL: test_mask_and_ps_rmbk_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandps (%rdi){1to16}, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x58,0x54,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandps (%rdi){1to16}, %zmm0, %zmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x59,0x54,0x0f]		; X64-NEXT: vblendmps %zmm0, %zmm1, %zmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x49,0x65,0xc0]
; X64-NEXT: vmovaps %zmm1, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <16 x float> undef, float %q, i32 0		%vecinit.i = insertelement <16 x float> undef, float %q, i32 0
%b = shufflevector <16 x float> %vecinit.i, <16 x float> undef, <16 x i32> zeroinitializer		%b = shufflevector <16 x float> %vecinit.i, <16 x float> undef, <16 x i32> zeroinitializer
%res = call <16 x float> @llvm.x86.avx512.mask.and.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.and.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_and_ps_rmbkz_512(<16 x float> %a, float* %ptr_b, i16 %mask) {		define <16 x float> @test_mask_and_ps_rmbkz_512(<16 x float> %a, float* %ptr_b, i16 %mask) {
; X86-LABEL: test_mask_and_ps_rmbkz_512:		; X86-LABEL: test_mask_and_ps_rmbkz_512:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vandps (%eax){1to16}, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x58,0x54,0x00]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]
; X86-NEXT: vandps (%eax){1to16}, %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xd9,0x54,0x00]		; X86-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_and_ps_rmbkz_512:		; X64-LABEL: test_mask_and_ps_rmbkz_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vandps (%rdi){1to16}, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x58,0x54,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vandps (%rdi){1to16}, %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xd9,0x54,0x07]		; X64-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <16 x float> undef, float %q, i32 0		%vecinit.i = insertelement <16 x float> undef, float %q, i32 0
%b = shufflevector <16 x float> %vecinit.i, <16 x float> undef, <16 x i32> zeroinitializer		%b = shufflevector <16 x float> %vecinit.i, <16 x float> undef, <16 x i32> zeroinitializer
%res = call <16 x float> @llvm.x86.avx512.mask.and.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.and.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

declare <16 x float> @llvm.x86.avx512.mask.and.ps.512(<16 x float>, <16 x float>, <16 x float>, i16)		declare <16 x float> @llvm.x86.avx512.mask.and.ps.512(<16 x float>, <16 x float>, <16 x float>, i16)

define <4 x float> @test_mask_or_ps_rr_128(<4 x float> %a, <4 x float> %b) {		define <4 x float> @test_mask_or_ps_rr_128(<4 x float> %a, <4 x float> %b) {
; CHECK-LABEL: test_mask_or_ps_rr_128:		; CHECK-LABEL: test_mask_or_ps_rr_128:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vorps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x56,0xc1]		; CHECK-NEXT: vorps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x56,0xc1]
; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]		; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
%res = call <4 x float> @llvm.x86.avx512.mask.or.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)		%res = call <4 x float> @llvm.x86.avx512.mask.or.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_or_ps_rrk_128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask) {		define <4 x float> @test_mask_or_ps_rrk_128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_or_ps_rrk_128:		; X86-LABEL: test_mask_or_ps_rrk_128:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vorps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x56,0xc1]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]
; X86-NEXT: vorps %xmm1, %xmm0, %xmm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x09,0x56,0xd1]		; X86-NEXT: vblendmps %xmm0, %xmm2, %xmm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x09,0x65,0xc0]
; X86-NEXT: vmovaps %xmm2, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc2]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_or_ps_rrk_128:		; X64-LABEL: test_mask_or_ps_rrk_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vorps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x56,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vorps %xmm1, %xmm0, %xmm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x09,0x56,0xd1]		; X64-NEXT: vblendmps %xmm0, %xmm2, %xmm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x09,0x65,0xc0]
; X64-NEXT: vmovaps %xmm2, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc2]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <4 x float> @llvm.x86.avx512.mask.or.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.or.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_or_ps_rrkz_128(<4 x float> %a, <4 x float> %b, i8 %mask) {		define <4 x float> @test_mask_or_ps_rrkz_128(<4 x float> %a, <4 x float> %b, i8 %mask) {
; X86-LABEL: test_mask_or_ps_rrkz_128:		; X86-LABEL: test_mask_or_ps_rrkz_128:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vorps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x56,0xc1]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]
; X86-NEXT: vorps %xmm1, %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x56,0xc1]		; X86-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_or_ps_rrkz_128:		; X64-LABEL: test_mask_or_ps_rrkz_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vorps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x56,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vorps %xmm1, %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x56,0xc1]		; X64-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <4 x float> @llvm.x86.avx512.mask.or.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.or.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_or_ps_rm_128(<4 x float> %a, <4 x float>* %ptr_b) {		define <4 x float> @test_mask_or_ps_rm_128(<4 x float> %a, <4 x float>* %ptr_b) {
; X86-LABEL: test_mask_or_ps_rm_128:		; X86-LABEL: test_mask_or_ps_rm_128:
; X86: # %bb.0:		; X86: # %bb.0:
Show All 9 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <4 x float> @llvm.x86.avx512.mask.or.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)		%res = call <4 x float> @llvm.x86.avx512.mask.or.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_or_ps_rmk_128(<4 x float> %a, <4 x float>* %ptr_b, <4 x float> %passThru, i8 %mask) {		define <4 x float> @test_mask_or_ps_rmk_128(<4 x float> %a, <4 x float>* %ptr_b, <4 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_or_ps_rmk_128:		; X86-LABEL: test_mask_or_ps_rmk_128:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vorps (%eax), %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x56,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vorps (%eax), %xmm0, %xmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x09,0x56,0x08]		; X86-NEXT: vblendmps %xmm0, %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x09,0x65,0xc0]
; X86-NEXT: vmovaps %xmm1, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_or_ps_rmk_128:		; X64-LABEL: test_mask_or_ps_rmk_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vorps (%rdi), %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x56,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vorps (%rdi), %xmm0, %xmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x09,0x56,0x0f]		; X64-NEXT: vblendmps %xmm0, %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x09,0x65,0xc0]
; X64-NEXT: vmovaps %xmm1, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <4 x float>, <4 x float>* %ptr_b		%b = load <4 x float>, <4 x float>* %ptr_b
%res = call <4 x float> @llvm.x86.avx512.mask.or.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.or.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_or_ps_rmkz_128(<4 x float> %a, <4 x float>* %ptr_b, i8 %mask) {		define <4 x float> @test_mask_or_ps_rmkz_128(<4 x float> %a, <4 x float>* %ptr_b, i8 %mask) {
; X86-LABEL: test_mask_or_ps_rmkz_128:		; X86-LABEL: test_mask_or_ps_rmkz_128:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vorps (%eax), %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x56,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vorps (%eax), %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x56,0x00]		; X86-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_or_ps_rmkz_128:		; X64-LABEL: test_mask_or_ps_rmkz_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vorps (%rdi), %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x56,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vorps (%rdi), %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x56,0x07]		; X64-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <4 x float>, <4 x float>* %ptr_b		%b = load <4 x float>, <4 x float>* %ptr_b
%res = call <4 x float> @llvm.x86.avx512.mask.or.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.or.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_or_ps_rmb_128(<4 x float> %a, float* %ptr_b) {		define <4 x float> @test_mask_or_ps_rmb_128(<4 x float> %a, float* %ptr_b) {
; X86-LABEL: test_mask_or_ps_rmb_128:		; X86-LABEL: test_mask_or_ps_rmb_128:
Show All 12 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <4 x float> @llvm.x86.avx512.mask.or.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)		%res = call <4 x float> @llvm.x86.avx512.mask.or.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_or_ps_rmbk_128(<4 x float> %a, float* %ptr_b, <4 x float> %passThru, i8 %mask) {		define <4 x float> @test_mask_or_ps_rmbk_128(<4 x float> %a, float* %ptr_b, <4 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_or_ps_rmbk_128:		; X86-LABEL: test_mask_or_ps_rmbk_128:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vorps (%eax){1to4}, %xmm0, %xmm0 # encoding: [0x62,0xf1,0x7c,0x18,0x56,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vorps (%eax){1to4}, %xmm0, %xmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x19,0x56,0x08]		; X86-NEXT: vblendmps %xmm0, %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x09,0x65,0xc0]
; X86-NEXT: vmovaps %xmm1, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_or_ps_rmbk_128:		; X64-LABEL: test_mask_or_ps_rmbk_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vorps (%rdi){1to4}, %xmm0, %xmm0 # encoding: [0x62,0xf1,0x7c,0x18,0x56,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vorps (%rdi){1to4}, %xmm0, %xmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x19,0x56,0x0f]		; X64-NEXT: vblendmps %xmm0, %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x09,0x65,0xc0]
; X64-NEXT: vmovaps %xmm1, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <4 x float> undef, float %q, i32 0		%vecinit.i = insertelement <4 x float> undef, float %q, i32 0
%b = shufflevector <4 x float> %vecinit.i, <4 x float> undef, <4 x i32> zeroinitializer		%b = shufflevector <4 x float> %vecinit.i, <4 x float> undef, <4 x i32> zeroinitializer
%res = call <4 x float> @llvm.x86.avx512.mask.or.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.or.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_or_ps_rmbkz_128(<4 x float> %a, float* %ptr_b, i8 %mask) {		define <4 x float> @test_mask_or_ps_rmbkz_128(<4 x float> %a, float* %ptr_b, i8 %mask) {
; X86-LABEL: test_mask_or_ps_rmbkz_128:		; X86-LABEL: test_mask_or_ps_rmbkz_128:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vorps (%eax){1to4}, %xmm0, %xmm0 # encoding: [0x62,0xf1,0x7c,0x18,0x56,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vorps (%eax){1to4}, %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x99,0x56,0x00]		; X86-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_or_ps_rmbkz_128:		; X64-LABEL: test_mask_or_ps_rmbkz_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vorps (%rdi){1to4}, %xmm0, %xmm0 # encoding: [0x62,0xf1,0x7c,0x18,0x56,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vorps (%rdi){1to4}, %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x99,0x56,0x07]		; X64-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <4 x float> undef, float %q, i32 0		%vecinit.i = insertelement <4 x float> undef, float %q, i32 0
%b = shufflevector <4 x float> %vecinit.i, <4 x float> undef, <4 x i32> zeroinitializer		%b = shufflevector <4 x float> %vecinit.i, <4 x float> undef, <4 x i32> zeroinitializer
%res = call <4 x float> @llvm.x86.avx512.mask.or.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.or.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

declare <4 x float> @llvm.x86.avx512.mask.or.ps.128(<4 x float>, <4 x float>, <4 x float>, i8)		declare <4 x float> @llvm.x86.avx512.mask.or.ps.128(<4 x float>, <4 x float>, <4 x float>, i8)

define <8 x float> @test_mask_or_ps_rr_256(<8 x float> %a, <8 x float> %b) {		define <8 x float> @test_mask_or_ps_rr_256(<8 x float> %a, <8 x float> %b) {
; CHECK-LABEL: test_mask_or_ps_rr_256:		; CHECK-LABEL: test_mask_or_ps_rr_256:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vorps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x56,0xc1]		; CHECK-NEXT: vorps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x56,0xc1]
; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]		; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
%res = call <8 x float> @llvm.x86.avx512.mask.or.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)		%res = call <8 x float> @llvm.x86.avx512.mask.or.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_or_ps_rrk_256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask) {		define <8 x float> @test_mask_or_ps_rrk_256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_or_ps_rrk_256:		; X86-LABEL: test_mask_or_ps_rrk_256:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vorps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x56,0xc1]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]
; X86-NEXT: vorps %ymm1, %ymm0, %ymm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x29,0x56,0xd1]		; X86-NEXT: vblendmps %ymm0, %ymm2, %ymm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x29,0x65,0xc0]
; X86-NEXT: vmovaps %ymm2, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc2]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_or_ps_rrk_256:		; X64-LABEL: test_mask_or_ps_rrk_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vorps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x56,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vorps %ymm1, %ymm0, %ymm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x29,0x56,0xd1]		; X64-NEXT: vblendmps %ymm0, %ymm2, %ymm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x29,0x65,0xc0]
; X64-NEXT: vmovaps %ymm2, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc2]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <8 x float> @llvm.x86.avx512.mask.or.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.or.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_or_ps_rrkz_256(<8 x float> %a, <8 x float> %b, i8 %mask) {		define <8 x float> @test_mask_or_ps_rrkz_256(<8 x float> %a, <8 x float> %b, i8 %mask) {
; X86-LABEL: test_mask_or_ps_rrkz_256:		; X86-LABEL: test_mask_or_ps_rrkz_256:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vorps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x56,0xc1]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]
; X86-NEXT: vorps %ymm1, %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x56,0xc1]		; X86-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_or_ps_rrkz_256:		; X64-LABEL: test_mask_or_ps_rrkz_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vorps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x56,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vorps %ymm1, %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x56,0xc1]		; X64-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <8 x float> @llvm.x86.avx512.mask.or.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.or.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_or_ps_rm_256(<8 x float> %a, <8 x float>* %ptr_b) {		define <8 x float> @test_mask_or_ps_rm_256(<8 x float> %a, <8 x float>* %ptr_b) {
; X86-LABEL: test_mask_or_ps_rm_256:		; X86-LABEL: test_mask_or_ps_rm_256:
; X86: # %bb.0:		; X86: # %bb.0:
Show All 9 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <8 x float> @llvm.x86.avx512.mask.or.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)		%res = call <8 x float> @llvm.x86.avx512.mask.or.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_or_ps_rmk_256(<8 x float> %a, <8 x float>* %ptr_b, <8 x float> %passThru, i8 %mask) {		define <8 x float> @test_mask_or_ps_rmk_256(<8 x float> %a, <8 x float>* %ptr_b, <8 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_or_ps_rmk_256:		; X86-LABEL: test_mask_or_ps_rmk_256:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vorps (%eax), %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x56,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vorps (%eax), %ymm0, %ymm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x29,0x56,0x08]		; X86-NEXT: vblendmps %ymm0, %ymm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x75,0x29,0x65,0xc0]
; X86-NEXT: vmovaps %ymm1, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_or_ps_rmk_256:		; X64-LABEL: test_mask_or_ps_rmk_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vorps (%rdi), %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x56,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vorps (%rdi), %ymm0, %ymm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x29,0x56,0x0f]		; X64-NEXT: vblendmps %ymm0, %ymm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x75,0x29,0x65,0xc0]
; X64-NEXT: vmovaps %ymm1, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <8 x float>, <8 x float>* %ptr_b		%b = load <8 x float>, <8 x float>* %ptr_b
%res = call <8 x float> @llvm.x86.avx512.mask.or.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.or.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_or_ps_rmkz_256(<8 x float> %a, <8 x float>* %ptr_b, i8 %mask) {		define <8 x float> @test_mask_or_ps_rmkz_256(<8 x float> %a, <8 x float>* %ptr_b, i8 %mask) {
; X86-LABEL: test_mask_or_ps_rmkz_256:		; X86-LABEL: test_mask_or_ps_rmkz_256:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vorps (%eax), %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x56,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vorps (%eax), %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x56,0x00]		; X86-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_or_ps_rmkz_256:		; X64-LABEL: test_mask_or_ps_rmkz_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vorps (%rdi), %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x56,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vorps (%rdi), %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x56,0x07]		; X64-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <8 x float>, <8 x float>* %ptr_b		%b = load <8 x float>, <8 x float>* %ptr_b
%res = call <8 x float> @llvm.x86.avx512.mask.or.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.or.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_or_ps_rmb_256(<8 x float> %a, float* %ptr_b) {		define <8 x float> @test_mask_or_ps_rmb_256(<8 x float> %a, float* %ptr_b) {
; X86-LABEL: test_mask_or_ps_rmb_256:		; X86-LABEL: test_mask_or_ps_rmb_256:
Show All 12 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <8 x float> @llvm.x86.avx512.mask.or.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)		%res = call <8 x float> @llvm.x86.avx512.mask.or.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_or_ps_rmbk_256(<8 x float> %a, float* %ptr_b, <8 x float> %passThru, i8 %mask) {		define <8 x float> @test_mask_or_ps_rmbk_256(<8 x float> %a, float* %ptr_b, <8 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_or_ps_rmbk_256:		; X86-LABEL: test_mask_or_ps_rmbk_256:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vorps (%eax){1to8}, %ymm0, %ymm0 # encoding: [0x62,0xf1,0x7c,0x38,0x56,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vorps (%eax){1to8}, %ymm0, %ymm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x39,0x56,0x08]		; X86-NEXT: vblendmps %ymm0, %ymm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x75,0x29,0x65,0xc0]
; X86-NEXT: vmovaps %ymm1, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_or_ps_rmbk_256:		; X64-LABEL: test_mask_or_ps_rmbk_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vorps (%rdi){1to8}, %ymm0, %ymm0 # encoding: [0x62,0xf1,0x7c,0x38,0x56,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vorps (%rdi){1to8}, %ymm0, %ymm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x39,0x56,0x0f]		; X64-NEXT: vblendmps %ymm0, %ymm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x75,0x29,0x65,0xc0]
; X64-NEXT: vmovaps %ymm1, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <8 x float> undef, float %q, i32 0		%vecinit.i = insertelement <8 x float> undef, float %q, i32 0
%b = shufflevector <8 x float> %vecinit.i, <8 x float> undef, <8 x i32> zeroinitializer		%b = shufflevector <8 x float> %vecinit.i, <8 x float> undef, <8 x i32> zeroinitializer
%res = call <8 x float> @llvm.x86.avx512.mask.or.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.or.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_or_ps_rmbkz_256(<8 x float> %a, float* %ptr_b, i8 %mask) {		define <8 x float> @test_mask_or_ps_rmbkz_256(<8 x float> %a, float* %ptr_b, i8 %mask) {
; X86-LABEL: test_mask_or_ps_rmbkz_256:		; X86-LABEL: test_mask_or_ps_rmbkz_256:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vorps (%eax){1to8}, %ymm0, %ymm0 # encoding: [0x62,0xf1,0x7c,0x38,0x56,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vorps (%eax){1to8}, %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xb9,0x56,0x00]		; X86-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_or_ps_rmbkz_256:		; X64-LABEL: test_mask_or_ps_rmbkz_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vorps (%rdi){1to8}, %ymm0, %ymm0 # encoding: [0x62,0xf1,0x7c,0x38,0x56,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vorps (%rdi){1to8}, %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xb9,0x56,0x07]		; X64-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <8 x float> undef, float %q, i32 0		%vecinit.i = insertelement <8 x float> undef, float %q, i32 0
%b = shufflevector <8 x float> %vecinit.i, <8 x float> undef, <8 x i32> zeroinitializer		%b = shufflevector <8 x float> %vecinit.i, <8 x float> undef, <8 x i32> zeroinitializer
%res = call <8 x float> @llvm.x86.avx512.mask.or.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.or.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

declare <8 x float> @llvm.x86.avx512.mask.or.ps.256(<8 x float>, <8 x float>, <8 x float>, i8)		declare <8 x float> @llvm.x86.avx512.mask.or.ps.256(<8 x float>, <8 x float>, <8 x float>, i8)

define <16 x float> @test_mask_or_ps_rr_512(<16 x float> %a, <16 x float> %b) {		define <16 x float> @test_mask_or_ps_rr_512(<16 x float> %a, <16 x float> %b) {
; CHECK-LABEL: test_mask_or_ps_rr_512:		; CHECK-LABEL: test_mask_or_ps_rr_512:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vorps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x56,0xc1]		; CHECK-NEXT: vorps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x56,0xc1]
; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]		; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
%res = call <16 x float> @llvm.x86.avx512.mask.or.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)		%res = call <16 x float> @llvm.x86.avx512.mask.or.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_or_ps_rrk_512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask) {		define <16 x float> @test_mask_or_ps_rrk_512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask) {
; X86-LABEL: test_mask_or_ps_rrk_512:		; X86-LABEL: test_mask_or_ps_rrk_512:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vorps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x56,0xc1]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]
; X86-NEXT: vorps %zmm1, %zmm0, %zmm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x49,0x56,0xd1]		; X86-NEXT: vblendmps %zmm0, %zmm2, %zmm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x49,0x65,0xc0]
; X86-NEXT: vmovaps %zmm2, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc2]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_or_ps_rrk_512:		; X64-LABEL: test_mask_or_ps_rrk_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vorps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x56,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vorps %zmm1, %zmm0, %zmm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x49,0x56,0xd1]		; X64-NEXT: vblendmps %zmm0, %zmm2, %zmm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x49,0x65,0xc0]
; X64-NEXT: vmovaps %zmm2, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc2]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <16 x float> @llvm.x86.avx512.mask.or.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.or.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_or_ps_rrkz_512(<16 x float> %a, <16 x float> %b, i16 %mask) {		define <16 x float> @test_mask_or_ps_rrkz_512(<16 x float> %a, <16 x float> %b, i16 %mask) {
; X86-LABEL: test_mask_or_ps_rrkz_512:		; X86-LABEL: test_mask_or_ps_rrkz_512:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vorps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x56,0xc1]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]
; X86-NEXT: vorps %zmm1, %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x56,0xc1]		; X86-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_or_ps_rrkz_512:		; X64-LABEL: test_mask_or_ps_rrkz_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vorps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x56,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vorps %zmm1, %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x56,0xc1]		; X64-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <16 x float> @llvm.x86.avx512.mask.or.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.or.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_or_ps_rm_512(<16 x float> %a, <16 x float>* %ptr_b) {		define <16 x float> @test_mask_or_ps_rm_512(<16 x float> %a, <16 x float>* %ptr_b) {
; X86-LABEL: test_mask_or_ps_rm_512:		; X86-LABEL: test_mask_or_ps_rm_512:
; X86: # %bb.0:		; X86: # %bb.0:
Show All 9 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <16 x float> @llvm.x86.avx512.mask.or.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)		%res = call <16 x float> @llvm.x86.avx512.mask.or.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_or_ps_rmk_512(<16 x float> %a, <16 x float>* %ptr_b, <16 x float> %passThru, i16 %mask) {		define <16 x float> @test_mask_or_ps_rmk_512(<16 x float> %a, <16 x float>* %ptr_b, <16 x float> %passThru, i16 %mask) {
; X86-LABEL: test_mask_or_ps_rmk_512:		; X86-LABEL: test_mask_or_ps_rmk_512:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vorps (%eax), %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x56,0x00]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]
; X86-NEXT: vorps (%eax), %zmm0, %zmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x49,0x56,0x08]		; X86-NEXT: vblendmps %zmm0, %zmm1, %zmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x49,0x65,0xc0]
; X86-NEXT: vmovaps %zmm1, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_or_ps_rmk_512:		; X64-LABEL: test_mask_or_ps_rmk_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vorps (%rdi), %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x56,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vorps (%rdi), %zmm0, %zmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x49,0x56,0x0f]		; X64-NEXT: vblendmps %zmm0, %zmm1, %zmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x49,0x65,0xc0]
; X64-NEXT: vmovaps %zmm1, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <16 x float>, <16 x float>* %ptr_b		%b = load <16 x float>, <16 x float>* %ptr_b
%res = call <16 x float> @llvm.x86.avx512.mask.or.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.or.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_or_ps_rmkz_512(<16 x float> %a, <16 x float>* %ptr_b, i16 %mask) {		define <16 x float> @test_mask_or_ps_rmkz_512(<16 x float> %a, <16 x float>* %ptr_b, i16 %mask) {
; X86-LABEL: test_mask_or_ps_rmkz_512:		; X86-LABEL: test_mask_or_ps_rmkz_512:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vorps (%eax), %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x56,0x00]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]
; X86-NEXT: vorps (%eax), %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x56,0x00]		; X86-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_or_ps_rmkz_512:		; X64-LABEL: test_mask_or_ps_rmkz_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vorps (%rdi), %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x56,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vorps (%rdi), %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x56,0x07]		; X64-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <16 x float>, <16 x float>* %ptr_b		%b = load <16 x float>, <16 x float>* %ptr_b
%res = call <16 x float> @llvm.x86.avx512.mask.or.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.or.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_or_ps_rmb_512(<16 x float> %a, float* %ptr_b) {		define <16 x float> @test_mask_or_ps_rmb_512(<16 x float> %a, float* %ptr_b) {
; X86-LABEL: test_mask_or_ps_rmb_512:		; X86-LABEL: test_mask_or_ps_rmb_512:
Show All 12 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <16 x float> @llvm.x86.avx512.mask.or.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)		%res = call <16 x float> @llvm.x86.avx512.mask.or.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_or_ps_rmbk_512(<16 x float> %a, float* %ptr_b, <16 x float> %passThru, i16 %mask) {		define <16 x float> @test_mask_or_ps_rmbk_512(<16 x float> %a, float* %ptr_b, <16 x float> %passThru, i16 %mask) {
; X86-LABEL: test_mask_or_ps_rmbk_512:		; X86-LABEL: test_mask_or_ps_rmbk_512:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vorps (%eax){1to16}, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x58,0x56,0x00]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]
; X86-NEXT: vorps (%eax){1to16}, %zmm0, %zmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x59,0x56,0x08]		; X86-NEXT: vblendmps %zmm0, %zmm1, %zmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x49,0x65,0xc0]
; X86-NEXT: vmovaps %zmm1, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_or_ps_rmbk_512:		; X64-LABEL: test_mask_or_ps_rmbk_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vorps (%rdi){1to16}, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x58,0x56,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vorps (%rdi){1to16}, %zmm0, %zmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x59,0x56,0x0f]		; X64-NEXT: vblendmps %zmm0, %zmm1, %zmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x49,0x65,0xc0]
; X64-NEXT: vmovaps %zmm1, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <16 x float> undef, float %q, i32 0		%vecinit.i = insertelement <16 x float> undef, float %q, i32 0
%b = shufflevector <16 x float> %vecinit.i, <16 x float> undef, <16 x i32> zeroinitializer		%b = shufflevector <16 x float> %vecinit.i, <16 x float> undef, <16 x i32> zeroinitializer
%res = call <16 x float> @llvm.x86.avx512.mask.or.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.or.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_or_ps_rmbkz_512(<16 x float> %a, float* %ptr_b, i16 %mask) {		define <16 x float> @test_mask_or_ps_rmbkz_512(<16 x float> %a, float* %ptr_b, i16 %mask) {
; X86-LABEL: test_mask_or_ps_rmbkz_512:		; X86-LABEL: test_mask_or_ps_rmbkz_512:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vorps (%eax){1to16}, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x58,0x56,0x00]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]
; X86-NEXT: vorps (%eax){1to16}, %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xd9,0x56,0x00]		; X86-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_or_ps_rmbkz_512:		; X64-LABEL: test_mask_or_ps_rmbkz_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vorps (%rdi){1to16}, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x58,0x56,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vorps (%rdi){1to16}, %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xd9,0x56,0x07]		; X64-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <16 x float> undef, float %q, i32 0		%vecinit.i = insertelement <16 x float> undef, float %q, i32 0
%b = shufflevector <16 x float> %vecinit.i, <16 x float> undef, <16 x i32> zeroinitializer		%b = shufflevector <16 x float> %vecinit.i, <16 x float> undef, <16 x i32> zeroinitializer
%res = call <16 x float> @llvm.x86.avx512.mask.or.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.or.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

declare <16 x float> @llvm.x86.avx512.mask.or.ps.512(<16 x float>, <16 x float>, <16 x float>, i16)		declare <16 x float> @llvm.x86.avx512.mask.or.ps.512(<16 x float>, <16 x float>, <16 x float>, i16)

define <4 x float> @test_mask_xor_ps_rr_128(<4 x float> %a, <4 x float> %b) {		define <4 x float> @test_mask_xor_ps_rr_128(<4 x float> %a, <4 x float> %b) {
; CHECK-LABEL: test_mask_xor_ps_rr_128:		; CHECK-LABEL: test_mask_xor_ps_rr_128:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vxorps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x57,0xc1]		; CHECK-NEXT: vxorps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x57,0xc1]
; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]		; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
%res = call <4 x float> @llvm.x86.avx512.mask.xor.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)		%res = call <4 x float> @llvm.x86.avx512.mask.xor.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_xor_ps_rrk_128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask) {		define <4 x float> @test_mask_xor_ps_rrk_128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_xor_ps_rrk_128:		; X86-LABEL: test_mask_xor_ps_rrk_128:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vxorps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x57,0xc1]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]
; X86-NEXT: vxorps %xmm1, %xmm0, %xmm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x09,0x57,0xd1]		; X86-NEXT: vblendmps %xmm0, %xmm2, %xmm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x09,0x65,0xc0]
; X86-NEXT: vmovaps %xmm2, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc2]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_xor_ps_rrk_128:		; X64-LABEL: test_mask_xor_ps_rrk_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vxorps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x57,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vxorps %xmm1, %xmm0, %xmm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x09,0x57,0xd1]		; X64-NEXT: vblendmps %xmm0, %xmm2, %xmm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x09,0x65,0xc0]
; X64-NEXT: vmovaps %xmm2, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc2]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <4 x float> @llvm.x86.avx512.mask.xor.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.xor.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_xor_ps_rrkz_128(<4 x float> %a, <4 x float> %b, i8 %mask) {		define <4 x float> @test_mask_xor_ps_rrkz_128(<4 x float> %a, <4 x float> %b, i8 %mask) {
; X86-LABEL: test_mask_xor_ps_rrkz_128:		; X86-LABEL: test_mask_xor_ps_rrkz_128:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vxorps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x57,0xc1]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]
; X86-NEXT: vxorps %xmm1, %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x57,0xc1]		; X86-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_xor_ps_rrkz_128:		; X64-LABEL: test_mask_xor_ps_rrkz_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vxorps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x57,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vxorps %xmm1, %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x57,0xc1]		; X64-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <4 x float> @llvm.x86.avx512.mask.xor.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.xor.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_xor_ps_rm_128(<4 x float> %a, <4 x float>* %ptr_b) {		define <4 x float> @test_mask_xor_ps_rm_128(<4 x float> %a, <4 x float>* %ptr_b) {
; X86-LABEL: test_mask_xor_ps_rm_128:		; X86-LABEL: test_mask_xor_ps_rm_128:
; X86: # %bb.0:		; X86: # %bb.0:
Show All 9 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <4 x float> @llvm.x86.avx512.mask.xor.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)		%res = call <4 x float> @llvm.x86.avx512.mask.xor.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_xor_ps_rmk_128(<4 x float> %a, <4 x float>* %ptr_b, <4 x float> %passThru, i8 %mask) {		define <4 x float> @test_mask_xor_ps_rmk_128(<4 x float> %a, <4 x float>* %ptr_b, <4 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_xor_ps_rmk_128:		; X86-LABEL: test_mask_xor_ps_rmk_128:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vxorps (%eax), %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x57,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vxorps (%eax), %xmm0, %xmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x09,0x57,0x08]		; X86-NEXT: vblendmps %xmm0, %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x09,0x65,0xc0]
; X86-NEXT: vmovaps %xmm1, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_xor_ps_rmk_128:		; X64-LABEL: test_mask_xor_ps_rmk_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vxorps (%rdi), %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x57,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vxorps (%rdi), %xmm0, %xmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x09,0x57,0x0f]		; X64-NEXT: vblendmps %xmm0, %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x09,0x65,0xc0]
; X64-NEXT: vmovaps %xmm1, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <4 x float>, <4 x float>* %ptr_b		%b = load <4 x float>, <4 x float>* %ptr_b
%res = call <4 x float> @llvm.x86.avx512.mask.xor.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.xor.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_xor_ps_rmkz_128(<4 x float> %a, <4 x float>* %ptr_b, i8 %mask) {		define <4 x float> @test_mask_xor_ps_rmkz_128(<4 x float> %a, <4 x float>* %ptr_b, i8 %mask) {
; X86-LABEL: test_mask_xor_ps_rmkz_128:		; X86-LABEL: test_mask_xor_ps_rmkz_128:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vxorps (%eax), %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x57,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vxorps (%eax), %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x57,0x00]		; X86-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_xor_ps_rmkz_128:		; X64-LABEL: test_mask_xor_ps_rmkz_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vxorps (%rdi), %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x57,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vxorps (%rdi), %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x57,0x07]		; X64-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <4 x float>, <4 x float>* %ptr_b		%b = load <4 x float>, <4 x float>* %ptr_b
%res = call <4 x float> @llvm.x86.avx512.mask.xor.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.xor.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_xor_ps_rmb_128(<4 x float> %a, float* %ptr_b) {		define <4 x float> @test_mask_xor_ps_rmb_128(<4 x float> %a, float* %ptr_b) {
; X86-LABEL: test_mask_xor_ps_rmb_128:		; X86-LABEL: test_mask_xor_ps_rmb_128:
Show All 12 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <4 x float> @llvm.x86.avx512.mask.xor.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)		%res = call <4 x float> @llvm.x86.avx512.mask.xor.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 -1)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_xor_ps_rmbk_128(<4 x float> %a, float* %ptr_b, <4 x float> %passThru, i8 %mask) {		define <4 x float> @test_mask_xor_ps_rmbk_128(<4 x float> %a, float* %ptr_b, <4 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_xor_ps_rmbk_128:		; X86-LABEL: test_mask_xor_ps_rmbk_128:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vxorps (%eax){1to4}, %xmm0, %xmm0 # encoding: [0x62,0xf1,0x7c,0x18,0x57,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vxorps (%eax){1to4}, %xmm0, %xmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x19,0x57,0x08]		; X86-NEXT: vblendmps %xmm0, %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x09,0x65,0xc0]
; X86-NEXT: vmovaps %xmm1, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_xor_ps_rmbk_128:		; X64-LABEL: test_mask_xor_ps_rmbk_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vxorps (%rdi){1to4}, %xmm0, %xmm0 # encoding: [0x62,0xf1,0x7c,0x18,0x57,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vxorps (%rdi){1to4}, %xmm0, %xmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x19,0x57,0x0f]		; X64-NEXT: vblendmps %xmm0, %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x09,0x65,0xc0]
; X64-NEXT: vmovaps %xmm1, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <4 x float> undef, float %q, i32 0		%vecinit.i = insertelement <4 x float> undef, float %q, i32 0
%b = shufflevector <4 x float> %vecinit.i, <4 x float> undef, <4 x i32> zeroinitializer		%b = shufflevector <4 x float> %vecinit.i, <4 x float> undef, <4 x i32> zeroinitializer
%res = call <4 x float> @llvm.x86.avx512.mask.xor.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.xor.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> %passThru, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_mask_xor_ps_rmbkz_128(<4 x float> %a, float* %ptr_b, i8 %mask) {		define <4 x float> @test_mask_xor_ps_rmbkz_128(<4 x float> %a, float* %ptr_b, i8 %mask) {
; X86-LABEL: test_mask_xor_ps_rmbkz_128:		; X86-LABEL: test_mask_xor_ps_rmbkz_128:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vxorps (%eax){1to4}, %xmm0, %xmm0 # encoding: [0x62,0xf1,0x7c,0x18,0x57,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vxorps (%eax){1to4}, %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x99,0x57,0x00]		; X86-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_xor_ps_rmbkz_128:		; X64-LABEL: test_mask_xor_ps_rmbkz_128:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vxorps (%rdi){1to4}, %xmm0, %xmm0 # encoding: [0x62,0xf1,0x7c,0x18,0x57,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vxorps (%rdi){1to4}, %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x99,0x57,0x07]		; X64-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0x89,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <4 x float> undef, float %q, i32 0		%vecinit.i = insertelement <4 x float> undef, float %q, i32 0
%b = shufflevector <4 x float> %vecinit.i, <4 x float> undef, <4 x i32> zeroinitializer		%b = shufflevector <4 x float> %vecinit.i, <4 x float> undef, <4 x i32> zeroinitializer
%res = call <4 x float> @llvm.x86.avx512.mask.xor.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)		%res = call <4 x float> @llvm.x86.avx512.mask.xor.ps.128(<4 x float> %a, <4 x float> %b, <4 x float> zeroinitializer, i8 %mask)
ret <4 x float> %res		ret <4 x float> %res
}		}

declare <4 x float> @llvm.x86.avx512.mask.xor.ps.128(<4 x float>, <4 x float>, <4 x float>, i8)		declare <4 x float> @llvm.x86.avx512.mask.xor.ps.128(<4 x float>, <4 x float>, <4 x float>, i8)

define <8 x float> @test_mask_xor_ps_rr_256(<8 x float> %a, <8 x float> %b) {		define <8 x float> @test_mask_xor_ps_rr_256(<8 x float> %a, <8 x float> %b) {
; CHECK-LABEL: test_mask_xor_ps_rr_256:		; CHECK-LABEL: test_mask_xor_ps_rr_256:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vxorps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x57,0xc1]		; CHECK-NEXT: vxorps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x57,0xc1]
; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]		; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
%res = call <8 x float> @llvm.x86.avx512.mask.xor.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)		%res = call <8 x float> @llvm.x86.avx512.mask.xor.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_xor_ps_rrk_256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask) {		define <8 x float> @test_mask_xor_ps_rrk_256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_xor_ps_rrk_256:		; X86-LABEL: test_mask_xor_ps_rrk_256:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vxorps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x57,0xc1]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]
; X86-NEXT: vxorps %ymm1, %ymm0, %ymm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x29,0x57,0xd1]		; X86-NEXT: vblendmps %ymm0, %ymm2, %ymm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x29,0x65,0xc0]
; X86-NEXT: vmovaps %ymm2, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc2]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_xor_ps_rrk_256:		; X64-LABEL: test_mask_xor_ps_rrk_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vxorps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x57,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vxorps %ymm1, %ymm0, %ymm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x29,0x57,0xd1]		; X64-NEXT: vblendmps %ymm0, %ymm2, %ymm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x29,0x65,0xc0]
; X64-NEXT: vmovaps %ymm2, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc2]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <8 x float> @llvm.x86.avx512.mask.xor.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.xor.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_xor_ps_rrkz_256(<8 x float> %a, <8 x float> %b, i8 %mask) {		define <8 x float> @test_mask_xor_ps_rrkz_256(<8 x float> %a, <8 x float> %b, i8 %mask) {
; X86-LABEL: test_mask_xor_ps_rrkz_256:		; X86-LABEL: test_mask_xor_ps_rrkz_256:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vxorps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x57,0xc1]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x04]
; X86-NEXT: vxorps %ymm1, %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x57,0xc1]		; X86-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_xor_ps_rrkz_256:		; X64-LABEL: test_mask_xor_ps_rrkz_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vxorps %ymm1, %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x57,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vxorps %ymm1, %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x57,0xc1]		; X64-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <8 x float> @llvm.x86.avx512.mask.xor.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.xor.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_xor_ps_rm_256(<8 x float> %a, <8 x float>* %ptr_b) {		define <8 x float> @test_mask_xor_ps_rm_256(<8 x float> %a, <8 x float>* %ptr_b) {
; X86-LABEL: test_mask_xor_ps_rm_256:		; X86-LABEL: test_mask_xor_ps_rm_256:
; X86: # %bb.0:		; X86: # %bb.0:
Show All 9 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <8 x float> @llvm.x86.avx512.mask.xor.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)		%res = call <8 x float> @llvm.x86.avx512.mask.xor.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_xor_ps_rmk_256(<8 x float> %a, <8 x float>* %ptr_b, <8 x float> %passThru, i8 %mask) {		define <8 x float> @test_mask_xor_ps_rmk_256(<8 x float> %a, <8 x float>* %ptr_b, <8 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_xor_ps_rmk_256:		; X86-LABEL: test_mask_xor_ps_rmk_256:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vxorps (%eax), %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x57,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vxorps (%eax), %ymm0, %ymm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x29,0x57,0x08]		; X86-NEXT: vblendmps %ymm0, %ymm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x75,0x29,0x65,0xc0]
; X86-NEXT: vmovaps %ymm1, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_xor_ps_rmk_256:		; X64-LABEL: test_mask_xor_ps_rmk_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vxorps (%rdi), %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x57,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vxorps (%rdi), %ymm0, %ymm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x29,0x57,0x0f]		; X64-NEXT: vblendmps %ymm0, %ymm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x75,0x29,0x65,0xc0]
; X64-NEXT: vmovaps %ymm1, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <8 x float>, <8 x float>* %ptr_b		%b = load <8 x float>, <8 x float>* %ptr_b
%res = call <8 x float> @llvm.x86.avx512.mask.xor.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.xor.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_xor_ps_rmkz_256(<8 x float> %a, <8 x float>* %ptr_b, i8 %mask) {		define <8 x float> @test_mask_xor_ps_rmkz_256(<8 x float> %a, <8 x float>* %ptr_b, i8 %mask) {
; X86-LABEL: test_mask_xor_ps_rmkz_256:		; X86-LABEL: test_mask_xor_ps_rmkz_256:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vxorps (%eax), %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x57,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vxorps (%eax), %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x57,0x00]		; X86-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_xor_ps_rmkz_256:		; X64-LABEL: test_mask_xor_ps_rmkz_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vxorps (%rdi), %ymm0, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x57,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vxorps (%rdi), %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x57,0x07]		; X64-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <8 x float>, <8 x float>* %ptr_b		%b = load <8 x float>, <8 x float>* %ptr_b
%res = call <8 x float> @llvm.x86.avx512.mask.xor.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.xor.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_xor_ps_rmb_256(<8 x float> %a, float* %ptr_b) {		define <8 x float> @test_mask_xor_ps_rmb_256(<8 x float> %a, float* %ptr_b) {
; X86-LABEL: test_mask_xor_ps_rmb_256:		; X86-LABEL: test_mask_xor_ps_rmb_256:
Show All 12 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <8 x float> @llvm.x86.avx512.mask.xor.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)		%res = call <8 x float> @llvm.x86.avx512.mask.xor.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 -1)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_xor_ps_rmbk_256(<8 x float> %a, float* %ptr_b, <8 x float> %passThru, i8 %mask) {		define <8 x float> @test_mask_xor_ps_rmbk_256(<8 x float> %a, float* %ptr_b, <8 x float> %passThru, i8 %mask) {
; X86-LABEL: test_mask_xor_ps_rmbk_256:		; X86-LABEL: test_mask_xor_ps_rmbk_256:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vxorps (%eax){1to8}, %ymm0, %ymm0 # encoding: [0x62,0xf1,0x7c,0x38,0x57,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vxorps (%eax){1to8}, %ymm0, %ymm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x39,0x57,0x08]		; X86-NEXT: vblendmps %ymm0, %ymm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x75,0x29,0x65,0xc0]
; X86-NEXT: vmovaps %ymm1, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_xor_ps_rmbk_256:		; X64-LABEL: test_mask_xor_ps_rmbk_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vxorps (%rdi){1to8}, %ymm0, %ymm0 # encoding: [0x62,0xf1,0x7c,0x38,0x57,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vxorps (%rdi){1to8}, %ymm0, %ymm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x39,0x57,0x0f]		; X64-NEXT: vblendmps %ymm0, %ymm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x75,0x29,0x65,0xc0]
; X64-NEXT: vmovaps %ymm1, %ymm0 # EVEX TO VEX Compression encoding: [0xc5,0xfc,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <8 x float> undef, float %q, i32 0		%vecinit.i = insertelement <8 x float> undef, float %q, i32 0
%b = shufflevector <8 x float> %vecinit.i, <8 x float> undef, <8 x i32> zeroinitializer		%b = shufflevector <8 x float> %vecinit.i, <8 x float> undef, <8 x i32> zeroinitializer
%res = call <8 x float> @llvm.x86.avx512.mask.xor.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.xor.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> %passThru, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_mask_xor_ps_rmbkz_256(<8 x float> %a, float* %ptr_b, i8 %mask) {		define <8 x float> @test_mask_xor_ps_rmbkz_256(<8 x float> %a, float* %ptr_b, i8 %mask) {
; X86-LABEL: test_mask_xor_ps_rmbkz_256:		; X86-LABEL: test_mask_xor_ps_rmbkz_256:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vxorps (%eax){1to8}, %ymm0, %ymm0 # encoding: [0x62,0xf1,0x7c,0x38,0x57,0x00]
; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovb {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf9,0x90,0x4c,0x24,0x08]
; X86-NEXT: vxorps (%eax){1to8}, %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xb9,0x57,0x00]		; X86-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_xor_ps_rmbkz_256:		; X64-LABEL: test_mask_xor_ps_rmbkz_256:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vxorps (%rdi){1to8}, %ymm0, %ymm0 # encoding: [0x62,0xf1,0x7c,0x38,0x57,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vxorps (%rdi){1to8}, %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xb9,0x57,0x07]		; X64-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xa9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <8 x float> undef, float %q, i32 0		%vecinit.i = insertelement <8 x float> undef, float %q, i32 0
%b = shufflevector <8 x float> %vecinit.i, <8 x float> undef, <8 x i32> zeroinitializer		%b = shufflevector <8 x float> %vecinit.i, <8 x float> undef, <8 x i32> zeroinitializer
%res = call <8 x float> @llvm.x86.avx512.mask.xor.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)		%res = call <8 x float> @llvm.x86.avx512.mask.xor.ps.256(<8 x float> %a, <8 x float> %b, <8 x float> zeroinitializer, i8 %mask)
ret <8 x float> %res		ret <8 x float> %res
}		}

declare <8 x float> @llvm.x86.avx512.mask.xor.ps.256(<8 x float>, <8 x float>, <8 x float>, i8)		declare <8 x float> @llvm.x86.avx512.mask.xor.ps.256(<8 x float>, <8 x float>, <8 x float>, i8)

define <16 x float> @test_mask_xor_ps_rr_512(<16 x float> %a, <16 x float> %b) {		define <16 x float> @test_mask_xor_ps_rr_512(<16 x float> %a, <16 x float> %b) {
; CHECK-LABEL: test_mask_xor_ps_rr_512:		; CHECK-LABEL: test_mask_xor_ps_rr_512:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vxorps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x57,0xc1]		; CHECK-NEXT: vxorps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x57,0xc1]
; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]		; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
%res = call <16 x float> @llvm.x86.avx512.mask.xor.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)		%res = call <16 x float> @llvm.x86.avx512.mask.xor.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_xor_ps_rrk_512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask) {		define <16 x float> @test_mask_xor_ps_rrk_512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask) {
; X86-LABEL: test_mask_xor_ps_rrk_512:		; X86-LABEL: test_mask_xor_ps_rrk_512:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vxorps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x57,0xc1]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]
; X86-NEXT: vxorps %zmm1, %zmm0, %zmm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x49,0x57,0xd1]		; X86-NEXT: vblendmps %zmm0, %zmm2, %zmm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x49,0x65,0xc0]
; X86-NEXT: vmovaps %zmm2, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc2]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_xor_ps_rrk_512:		; X64-LABEL: test_mask_xor_ps_rrk_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vxorps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x57,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vxorps %zmm1, %zmm0, %zmm2 {%k1} # encoding: [0x62,0xf1,0x7c,0x49,0x57,0xd1]		; X64-NEXT: vblendmps %zmm0, %zmm2, %zmm0 {%k1} # encoding: [0x62,0xf2,0x6d,0x49,0x65,0xc0]
; X64-NEXT: vmovaps %zmm2, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc2]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <16 x float> @llvm.x86.avx512.mask.xor.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.xor.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_xor_ps_rrkz_512(<16 x float> %a, <16 x float> %b, i16 %mask) {		define <16 x float> @test_mask_xor_ps_rrkz_512(<16 x float> %a, <16 x float> %b, i16 %mask) {
; X86-LABEL: test_mask_xor_ps_rrkz_512:		; X86-LABEL: test_mask_xor_ps_rrkz_512:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: vxorps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x57,0xc1]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]
; X86-NEXT: vxorps %zmm1, %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x57,0xc1]		; X86-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_xor_ps_rrkz_512:		; X64-LABEL: test_mask_xor_ps_rrkz_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vxorps %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x57,0xc1]
; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]		; X64-NEXT: kmovw %edi, %k1 # encoding: [0xc5,0xf8,0x92,0xcf]
; X64-NEXT: vxorps %zmm1, %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x57,0xc1]		; X64-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%res = call <16 x float> @llvm.x86.avx512.mask.xor.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.xor.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_xor_ps_rm_512(<16 x float> %a, <16 x float>* %ptr_b) {		define <16 x float> @test_mask_xor_ps_rm_512(<16 x float> %a, <16 x float>* %ptr_b) {
; X86-LABEL: test_mask_xor_ps_rm_512:		; X86-LABEL: test_mask_xor_ps_rm_512:
; X86: # %bb.0:		; X86: # %bb.0:
Show All 9 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <16 x float> @llvm.x86.avx512.mask.xor.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)		%res = call <16 x float> @llvm.x86.avx512.mask.xor.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_xor_ps_rmk_512(<16 x float> %a, <16 x float>* %ptr_b, <16 x float> %passThru, i16 %mask) {		define <16 x float> @test_mask_xor_ps_rmk_512(<16 x float> %a, <16 x float>* %ptr_b, <16 x float> %passThru, i16 %mask) {
; X86-LABEL: test_mask_xor_ps_rmk_512:		; X86-LABEL: test_mask_xor_ps_rmk_512:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vxorps (%eax), %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x57,0x00]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]
; X86-NEXT: vxorps (%eax), %zmm0, %zmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x49,0x57,0x08]		; X86-NEXT: vblendmps %zmm0, %zmm1, %zmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x49,0x65,0xc0]
; X86-NEXT: vmovaps %zmm1, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_xor_ps_rmk_512:		; X64-LABEL: test_mask_xor_ps_rmk_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vxorps (%rdi), %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x57,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vxorps (%rdi), %zmm0, %zmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x49,0x57,0x0f]		; X64-NEXT: vblendmps %zmm0, %zmm1, %zmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x49,0x65,0xc0]
; X64-NEXT: vmovaps %zmm1, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <16 x float>, <16 x float>* %ptr_b		%b = load <16 x float>, <16 x float>* %ptr_b
%res = call <16 x float> @llvm.x86.avx512.mask.xor.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.xor.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_xor_ps_rmkz_512(<16 x float> %a, <16 x float>* %ptr_b, i16 %mask) {		define <16 x float> @test_mask_xor_ps_rmkz_512(<16 x float> %a, <16 x float>* %ptr_b, i16 %mask) {
; X86-LABEL: test_mask_xor_ps_rmkz_512:		; X86-LABEL: test_mask_xor_ps_rmkz_512:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vxorps (%eax), %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x57,0x00]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]
; X86-NEXT: vxorps (%eax), %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x57,0x00]		; X86-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_xor_ps_rmkz_512:		; X64-LABEL: test_mask_xor_ps_rmkz_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vxorps (%rdi), %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x57,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vxorps (%rdi), %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x57,0x07]		; X64-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%b = load <16 x float>, <16 x float>* %ptr_b		%b = load <16 x float>, <16 x float>* %ptr_b
%res = call <16 x float> @llvm.x86.avx512.mask.xor.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.xor.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_xor_ps_rmb_512(<16 x float> %a, float* %ptr_b) {		define <16 x float> @test_mask_xor_ps_rmb_512(<16 x float> %a, float* %ptr_b) {
; X86-LABEL: test_mask_xor_ps_rmb_512:		; X86-LABEL: test_mask_xor_ps_rmb_512:
Show All 12 Lines	; X64-NEXT: retq # encoding: [0xc3]
%res = call <16 x float> @llvm.x86.avx512.mask.xor.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)		%res = call <16 x float> @llvm.x86.avx512.mask.xor.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 -1)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_xor_ps_rmbk_512(<16 x float> %a, float* %ptr_b, <16 x float> %passThru, i16 %mask) {		define <16 x float> @test_mask_xor_ps_rmbk_512(<16 x float> %a, float* %ptr_b, <16 x float> %passThru, i16 %mask) {
; X86-LABEL: test_mask_xor_ps_rmbk_512:		; X86-LABEL: test_mask_xor_ps_rmbk_512:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vxorps (%eax){1to16}, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x58,0x57,0x00]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]
; X86-NEXT: vxorps (%eax){1to16}, %zmm0, %zmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x59,0x57,0x08]		; X86-NEXT: vblendmps %zmm0, %zmm1, %zmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x49,0x65,0xc0]
; X86-NEXT: vmovaps %zmm1, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc1]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_xor_ps_rmbk_512:		; X64-LABEL: test_mask_xor_ps_rmbk_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vxorps (%rdi){1to16}, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x58,0x57,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vxorps (%rdi){1to16}, %zmm0, %zmm1 {%k1} # encoding: [0x62,0xf1,0x7c,0x59,0x57,0x0f]		; X64-NEXT: vblendmps %zmm0, %zmm1, %zmm0 {%k1} # encoding: [0x62,0xf2,0x75,0x49,0x65,0xc0]
; X64-NEXT: vmovaps %zmm1, %zmm0 # encoding: [0x62,0xf1,0x7c,0x48,0x28,0xc1]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <16 x float> undef, float %q, i32 0		%vecinit.i = insertelement <16 x float> undef, float %q, i32 0
%b = shufflevector <16 x float> %vecinit.i, <16 x float> undef, <16 x i32> zeroinitializer		%b = shufflevector <16 x float> %vecinit.i, <16 x float> undef, <16 x i32> zeroinitializer
%res = call <16 x float> @llvm.x86.avx512.mask.xor.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.xor.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %passThru, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_mask_xor_ps_rmbkz_512(<16 x float> %a, float* %ptr_b, i16 %mask) {		define <16 x float> @test_mask_xor_ps_rmbkz_512(<16 x float> %a, float* %ptr_b, i16 %mask) {
; X86-LABEL: test_mask_xor_ps_rmbkz_512:		; X86-LABEL: test_mask_xor_ps_rmbkz_512:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
		; X86-NEXT: vxorps (%eax){1to16}, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x58,0x57,0x00]
; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]		; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x08]
; X86-NEXT: vxorps (%eax){1to16}, %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xd9,0x57,0x00]		; X86-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X86-NEXT: retl # encoding: [0xc3]		; X86-NEXT: retl # encoding: [0xc3]
;		;
; X64-LABEL: test_mask_xor_ps_rmbkz_512:		; X64-LABEL: test_mask_xor_ps_rmbkz_512:
; X64: # %bb.0:		; X64: # %bb.0:
		; X64-NEXT: vxorps (%rdi){1to16}, %zmm0, %zmm0 # encoding: [0x62,0xf1,0x7c,0x58,0x57,0x07]
; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]		; X64-NEXT: kmovw %esi, %k1 # encoding: [0xc5,0xf8,0x92,0xce]
; X64-NEXT: vxorps (%rdi){1to16}, %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xd9,0x57,0x07]		; X64-NEXT: vmovaps %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf1,0x7c,0xc9,0x28,0xc0]
; X64-NEXT: retq # encoding: [0xc3]		; X64-NEXT: retq # encoding: [0xc3]
%q = load float, float* %ptr_b		%q = load float, float* %ptr_b
%vecinit.i = insertelement <16 x float> undef, float %q, i32 0		%vecinit.i = insertelement <16 x float> undef, float %q, i32 0
%b = shufflevector <16 x float> %vecinit.i, <16 x float> undef, <16 x i32> zeroinitializer		%b = shufflevector <16 x float> %vecinit.i, <16 x float> undef, <16 x i32> zeroinitializer
%res = call <16 x float> @llvm.x86.avx512.mask.xor.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)		%res = call <16 x float> @llvm.x86.avx512.mask.xor.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> zeroinitializer, i16 %mask)
ret <16 x float> %res		ret <16 x float> %res
}		}

▲ Show 20 Lines • Show All 1,082 Lines • Show Last 20 Lines

test/CodeGen/X86/avx512f-vec-test-testn.ll

Show All 31 Lines	entry:
%1 = bitcast <8 x i1> %0 to i8		%1 = bitcast <8 x i1> %0 to i8
ret i8 %1		ret i8 %1
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define zeroext i16 @TEST_mm512_test_epi32_mask(<8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {		define zeroext i16 @TEST_mm512_test_epi32_mask(<8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {
; CHECK-LABEL: TEST_mm512_test_epi32_mask:		; CHECK-LABEL: TEST_mm512_test_epi32_mask:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vptestmd %zmm0, %zmm1, %k0		; CHECK-NEXT: vpandq %zmm0, %zmm1, %zmm0
		; CHECK-NEXT: vptestmd %zmm0, %zmm0, %k0
; CHECK-NEXT: kmovw %k0, %eax		; CHECK-NEXT: kmovw %k0, %eax
; CHECK-NEXT: # kill: def $ax killed $ax killed $eax		; CHECK-NEXT: # kill: def $ax killed $ax killed $eax
; CHECK-NEXT: vzeroupper		; CHECK-NEXT: vzeroupper
; CHECK-NEXT: retq		; CHECK-NEXT: retq
entry:		entry:
%and.i.i = and <8 x i64> %__B, %__A		%and.i.i = and <8 x i64> %__B, %__A
%0 = bitcast <8 x i64> %and.i.i to <16 x i32>		%0 = bitcast <8 x i64> %and.i.i to <16 x i32>
%1 = icmp ne <16 x i32> %0, zeroinitializer		%1 = icmp ne <16 x i32> %0, zeroinitializer
Show All 19 Lines	entry:
%3 = bitcast <8 x i1> %2 to i8		%3 = bitcast <8 x i1> %2 to i8
ret i8 %3		ret i8 %3
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define zeroext i16 @TEST_mm512_mask_test_epi32_mask(i16 %__U, <8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {		define zeroext i16 @TEST_mm512_mask_test_epi32_mask(i16 %__U, <8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {
; CHECK-LABEL: TEST_mm512_mask_test_epi32_mask:		; CHECK-LABEL: TEST_mm512_mask_test_epi32_mask:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vptestmd %zmm0, %zmm1, %k0		; CHECK-NEXT: vpandq %zmm0, %zmm1, %zmm0
		; CHECK-NEXT: vptestmd %zmm0, %zmm0, %k0
; CHECK-NEXT: kmovw %k0, %eax		; CHECK-NEXT: kmovw %k0, %eax
; CHECK-NEXT: andl %edi, %eax		; CHECK-NEXT: andl %edi, %eax
; CHECK-NEXT: # kill: def $ax killed $ax killed $eax		; CHECK-NEXT: # kill: def $ax killed $ax killed $eax
; CHECK-NEXT: vzeroupper		; CHECK-NEXT: vzeroupper
; CHECK-NEXT: retq		; CHECK-NEXT: retq
entry:		entry:
%and.i.i = and <8 x i64> %__B, %__A		%and.i.i = and <8 x i64> %__B, %__A
%0 = bitcast <8 x i64> %and.i.i to <16 x i32>		%0 = bitcast <8 x i64> %and.i.i to <16 x i32>
Show All 35 Lines	entry:
%1 = bitcast <8 x i1> %0 to i8		%1 = bitcast <8 x i1> %0 to i8
ret i8 %1		ret i8 %1
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define zeroext i16 @TEST_mm512_testn_epi32_mask(<8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {		define zeroext i16 @TEST_mm512_testn_epi32_mask(<8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {
; CHECK-LABEL: TEST_mm512_testn_epi32_mask:		; CHECK-LABEL: TEST_mm512_testn_epi32_mask:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vptestnmd %zmm0, %zmm1, %k0		; CHECK-NEXT: vpandq %zmm0, %zmm1, %zmm0
		; CHECK-NEXT: vptestnmd %zmm0, %zmm0, %k0
; CHECK-NEXT: kmovw %k0, %eax		; CHECK-NEXT: kmovw %k0, %eax
; CHECK-NEXT: # kill: def $ax killed $ax killed $eax		; CHECK-NEXT: # kill: def $ax killed $ax killed $eax
; CHECK-NEXT: vzeroupper		; CHECK-NEXT: vzeroupper
; CHECK-NEXT: retq		; CHECK-NEXT: retq
entry:		entry:
%and.i.i = and <8 x i64> %__B, %__A		%and.i.i = and <8 x i64> %__B, %__A
%0 = bitcast <8 x i64> %and.i.i to <16 x i32>		%0 = bitcast <8 x i64> %and.i.i to <16 x i32>
%1 = icmp eq <16 x i32> %0, zeroinitializer		%1 = icmp eq <16 x i32> %0, zeroinitializer
Show All 19 Lines	entry:
%3 = bitcast <8 x i1> %2 to i8		%3 = bitcast <8 x i1> %2 to i8
ret i8 %3		ret i8 %3
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define zeroext i16 @TEST_mm512_mask_testn_epi32_mask(i16 %__U, <8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {		define zeroext i16 @TEST_mm512_mask_testn_epi32_mask(i16 %__U, <8 x i64> %__A, <8 x i64> %__B) local_unnamed_addr #0 {
; CHECK-LABEL: TEST_mm512_mask_testn_epi32_mask:		; CHECK-LABEL: TEST_mm512_mask_testn_epi32_mask:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vptestnmd %zmm0, %zmm1, %k0		; CHECK-NEXT: vpandq %zmm0, %zmm1, %zmm0
		; CHECK-NEXT: vptestnmd %zmm0, %zmm0, %k0
; CHECK-NEXT: kmovw %k0, %eax		; CHECK-NEXT: kmovw %k0, %eax
; CHECK-NEXT: andl %edi, %eax		; CHECK-NEXT: andl %edi, %eax
; CHECK-NEXT: # kill: def $ax killed $ax killed $eax		; CHECK-NEXT: # kill: def $ax killed $ax killed $eax
; CHECK-NEXT: vzeroupper		; CHECK-NEXT: vzeroupper
; CHECK-NEXT: retq		; CHECK-NEXT: retq
entry:		entry:
%and.i.i = and <8 x i64> %__B, %__A		%and.i.i = and <8 x i64> %__B, %__A
%0 = bitcast <8 x i64> %and.i.i to <16 x i32>		%0 = bitcast <8 x i64> %and.i.i to <16 x i32>
%1 = icmp eq <16 x i32> %0, zeroinitializer		%1 = icmp eq <16 x i32> %0, zeroinitializer
%2 = bitcast i16 %__U to <16 x i1>		%2 = bitcast i16 %__U to <16 x i1>
%3 = and <16 x i1> %1, %2		%3 = and <16 x i1> %1, %2
%4 = bitcast <16 x i1> %3 to i16		%4 = bitcast <16 x i1> %3 to i16
ret i16 %4		ret i16 %4
}		}

test/CodeGen/X86/avx512vl-intrinsics-fast-isel.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 1,447 Lines • ▼ Show 20 Lines	entry:
%extract = shufflevector <8 x i1> %0, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%extract = shufflevector <8 x i1> %0, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%1 = select <4 x i1> %extract, <4 x i64> %shuffle, <4 x i64> zeroinitializer		%1 = select <4 x i1> %extract, <4 x i64> %shuffle, <4 x i64> zeroinitializer
ret <4 x i64> %1		ret <4 x i64> %1
}		}

define zeroext i8 @test_mm_test_epi32_mask(<2 x i64> %__A, <2 x i64> %__B) {		define zeroext i8 @test_mm_test_epi32_mask(<2 x i64> %__A, <2 x i64> %__B) {
; CHECK-LABEL: test_mm_test_epi32_mask:		; CHECK-LABEL: test_mm_test_epi32_mask:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vptestmd %xmm0, %xmm1, %k0		; CHECK-NEXT: vpand %xmm0, %xmm1, %xmm0
		; CHECK-NEXT: vptestmd %xmm0, %xmm0, %k0
; CHECK-NEXT: kmovw %k0, %eax		; CHECK-NEXT: kmovw %k0, %eax
; CHECK-NEXT: movzbl %al, %eax		; CHECK-NEXT: movzbl %al, %eax
; CHECK-NEXT: ret{{[l\|q]}}		; CHECK-NEXT: ret{{[l\|q]}}
entry:		entry:
%and.i.i = and <2 x i64> %__B, %__A		%and.i.i = and <2 x i64> %__B, %__A
%0 = bitcast <2 x i64> %and.i.i to <4 x i32>		%0 = bitcast <2 x i64> %and.i.i to <4 x i32>
%1 = icmp ne <4 x i32> %0, zeroinitializer		%1 = icmp ne <4 x i32> %0, zeroinitializer
%2 = shufflevector <4 x i1> %1, <4 x i1> zeroinitializer, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>		%2 = shufflevector <4 x i1> %1, <4 x i1> zeroinitializer, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
%3 = bitcast <8 x i1> %2 to i8		%3 = bitcast <8 x i1> %2 to i8
ret i8 %3		ret i8 %3
}		}

define zeroext i8 @test_mm_mask_test_epi32_mask(i8 zeroext %__U, <2 x i64> %__A, <2 x i64> %__B) {		define zeroext i8 @test_mm_mask_test_epi32_mask(i8 zeroext %__U, <2 x i64> %__A, <2 x i64> %__B) {
; X86-LABEL: test_mm_mask_test_epi32_mask:		; X86-LABEL: test_mm_mask_test_epi32_mask:
; X86: # %bb.0: # %entry		; X86: # %bb.0: # %entry
; X86-NEXT: movb {{[0-9]+}}(%esp), %al		; X86-NEXT: movb {{[0-9]+}}(%esp), %al
		; X86-NEXT: vpand %xmm0, %xmm1, %xmm0
; X86-NEXT: kmovw %eax, %k1		; X86-NEXT: kmovw %eax, %k1
; X86-NEXT: vptestmd %xmm0, %xmm1, %k0 {%k1}		; X86-NEXT: vptestmd %xmm0, %xmm0, %k0 {%k1}
; X86-NEXT: kmovw %k0, %eax		; X86-NEXT: kmovw %k0, %eax
; X86-NEXT: movzbl %al, %eax		; X86-NEXT: movzbl %al, %eax
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: test_mm_mask_test_epi32_mask:		; X64-LABEL: test_mm_mask_test_epi32_mask:
; X64: # %bb.0: # %entry		; X64: # %bb.0: # %entry
		; X64-NEXT: vpand %xmm0, %xmm1, %xmm0
; X64-NEXT: kmovw %edi, %k1		; X64-NEXT: kmovw %edi, %k1
; X64-NEXT: vptestmd %xmm0, %xmm1, %k0 {%k1}		; X64-NEXT: vptestmd %xmm0, %xmm0, %k0 {%k1}
; X64-NEXT: kmovw %k0, %eax		; X64-NEXT: kmovw %k0, %eax
; X64-NEXT: movzbl %al, %eax		; X64-NEXT: movzbl %al, %eax
; X64-NEXT: retq		; X64-NEXT: retq
entry:		entry:
%and.i.i = and <2 x i64> %__B, %__A		%and.i.i = and <2 x i64> %__B, %__A
%0 = bitcast <2 x i64> %and.i.i to <4 x i32>		%0 = bitcast <2 x i64> %and.i.i to <4 x i32>
%1 = icmp ne <4 x i32> %0, zeroinitializer		%1 = icmp ne <4 x i32> %0, zeroinitializer
%2 = bitcast i8 %__U to <8 x i1>		%2 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %2, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%extract.i = shufflevector <8 x i1> %2, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%3 = and <4 x i1> %1, %extract.i		%3 = and <4 x i1> %1, %extract.i
%4 = shufflevector <4 x i1> %3, <4 x i1> zeroinitializer, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>		%4 = shufflevector <4 x i1> %3, <4 x i1> zeroinitializer, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
%5 = bitcast <8 x i1> %4 to i8		%5 = bitcast <8 x i1> %4 to i8
ret i8 %5		ret i8 %5
}		}

define zeroext i8 @test_mm256_test_epi32_mask(<4 x i64> %__A, <4 x i64> %__B) {		define zeroext i8 @test_mm256_test_epi32_mask(<4 x i64> %__A, <4 x i64> %__B) {
; CHECK-LABEL: test_mm256_test_epi32_mask:		; CHECK-LABEL: test_mm256_test_epi32_mask:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vptestmd %ymm0, %ymm1, %k0		; CHECK-NEXT: vpand %ymm0, %ymm1, %ymm0
		; CHECK-NEXT: vptestmd %ymm0, %ymm0, %k0
; CHECK-NEXT: kmovw %k0, %eax		; CHECK-NEXT: kmovw %k0, %eax
; CHECK-NEXT: movzbl %al, %eax		; CHECK-NEXT: movzbl %al, %eax
; CHECK-NEXT: vzeroupper		; CHECK-NEXT: vzeroupper
; CHECK-NEXT: ret{{[l\|q]}}		; CHECK-NEXT: ret{{[l\|q]}}
entry:		entry:
%and.i.i = and <4 x i64> %__B, %__A		%and.i.i = and <4 x i64> %__B, %__A
%0 = bitcast <4 x i64> %and.i.i to <8 x i32>		%0 = bitcast <4 x i64> %and.i.i to <8 x i32>
%1 = icmp ne <8 x i32> %0, zeroinitializer		%1 = icmp ne <8 x i32> %0, zeroinitializer
%2 = bitcast <8 x i1> %1 to i8		%2 = bitcast <8 x i1> %1 to i8
ret i8 %2		ret i8 %2
}		}

define zeroext i8 @test_mm256_mask_test_epi32_mask(i8 zeroext %__U, <4 x i64> %__A, <4 x i64> %__B) {		define zeroext i8 @test_mm256_mask_test_epi32_mask(i8 zeroext %__U, <4 x i64> %__A, <4 x i64> %__B) {
; X86-LABEL: test_mm256_mask_test_epi32_mask:		; X86-LABEL: test_mm256_mask_test_epi32_mask:
; X86: # %bb.0: # %entry		; X86: # %bb.0: # %entry
; X86-NEXT: movb {{[0-9]+}}(%esp), %al		; X86-NEXT: movb {{[0-9]+}}(%esp), %al
		; X86-NEXT: vpand %ymm0, %ymm1, %ymm0
; X86-NEXT: kmovw %eax, %k1		; X86-NEXT: kmovw %eax, %k1
; X86-NEXT: vptestmd %ymm0, %ymm1, %k0 {%k1}		; X86-NEXT: vptestmd %ymm0, %ymm0, %k0 {%k1}
; X86-NEXT: kmovw %k0, %eax		; X86-NEXT: kmovw %k0, %eax
; X86-NEXT: movzbl %al, %eax		; X86-NEXT: movzbl %al, %eax
; X86-NEXT: vzeroupper		; X86-NEXT: vzeroupper
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: test_mm256_mask_test_epi32_mask:		; X64-LABEL: test_mm256_mask_test_epi32_mask:
; X64: # %bb.0: # %entry		; X64: # %bb.0: # %entry
		; X64-NEXT: vpand %ymm0, %ymm1, %ymm0
; X64-NEXT: kmovw %edi, %k1		; X64-NEXT: kmovw %edi, %k1
; X64-NEXT: vptestmd %ymm0, %ymm1, %k0 {%k1}		; X64-NEXT: vptestmd %ymm0, %ymm0, %k0 {%k1}
; X64-NEXT: kmovw %k0, %eax		; X64-NEXT: kmovw %k0, %eax
; X64-NEXT: movzbl %al, %eax		; X64-NEXT: movzbl %al, %eax
; X64-NEXT: vzeroupper		; X64-NEXT: vzeroupper
; X64-NEXT: retq		; X64-NEXT: retq
entry:		entry:
%and.i.i = and <4 x i64> %__B, %__A		%and.i.i = and <4 x i64> %__B, %__A
%0 = bitcast <4 x i64> %and.i.i to <8 x i32>		%0 = bitcast <4 x i64> %and.i.i to <8 x i32>
%1 = icmp ne <8 x i32> %0, zeroinitializer		%1 = icmp ne <8 x i32> %0, zeroinitializer
▲ Show 20 Lines • Show All 90 Lines • ▼ Show 20 Lines	entry:
%3 = shufflevector <4 x i1> %2, <4 x i1> zeroinitializer, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>		%3 = shufflevector <4 x i1> %2, <4 x i1> zeroinitializer, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
%4 = bitcast <8 x i1> %3 to i8		%4 = bitcast <8 x i1> %3 to i8
ret i8 %4		ret i8 %4
}		}

define zeroext i8 @test_mm_testn_epi32_mask(<2 x i64> %__A, <2 x i64> %__B) {		define zeroext i8 @test_mm_testn_epi32_mask(<2 x i64> %__A, <2 x i64> %__B) {
; CHECK-LABEL: test_mm_testn_epi32_mask:		; CHECK-LABEL: test_mm_testn_epi32_mask:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vptestnmd %xmm0, %xmm1, %k0		; CHECK-NEXT: vpand %xmm0, %xmm1, %xmm0
		; CHECK-NEXT: vptestnmd %xmm0, %xmm0, %k0
; CHECK-NEXT: kmovw %k0, %eax		; CHECK-NEXT: kmovw %k0, %eax
; CHECK-NEXT: movzbl %al, %eax		; CHECK-NEXT: movzbl %al, %eax
; CHECK-NEXT: ret{{[l\|q]}}		; CHECK-NEXT: ret{{[l\|q]}}
entry:		entry:
%and.i.i = and <2 x i64> %__B, %__A		%and.i.i = and <2 x i64> %__B, %__A
%0 = bitcast <2 x i64> %and.i.i to <4 x i32>		%0 = bitcast <2 x i64> %and.i.i to <4 x i32>
%1 = icmp eq <4 x i32> %0, zeroinitializer		%1 = icmp eq <4 x i32> %0, zeroinitializer
%2 = shufflevector <4 x i1> %1, <4 x i1> zeroinitializer, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>		%2 = shufflevector <4 x i1> %1, <4 x i1> zeroinitializer, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
%3 = bitcast <8 x i1> %2 to i8		%3 = bitcast <8 x i1> %2 to i8
ret i8 %3		ret i8 %3
}		}

define zeroext i8 @test_mm_mask_testn_epi32_mask(i8 zeroext %__U, <2 x i64> %__A, <2 x i64> %__B) {		define zeroext i8 @test_mm_mask_testn_epi32_mask(i8 zeroext %__U, <2 x i64> %__A, <2 x i64> %__B) {
; X86-LABEL: test_mm_mask_testn_epi32_mask:		; X86-LABEL: test_mm_mask_testn_epi32_mask:
; X86: # %bb.0: # %entry		; X86: # %bb.0: # %entry
; X86-NEXT: movb {{[0-9]+}}(%esp), %al		; X86-NEXT: movb {{[0-9]+}}(%esp), %al
		; X86-NEXT: vpand %xmm0, %xmm1, %xmm0
; X86-NEXT: kmovw %eax, %k1		; X86-NEXT: kmovw %eax, %k1
; X86-NEXT: vptestnmd %xmm0, %xmm1, %k0 {%k1}		; X86-NEXT: vptestnmd %xmm0, %xmm0, %k0 {%k1}
; X86-NEXT: kmovw %k0, %eax		; X86-NEXT: kmovw %k0, %eax
; X86-NEXT: movzbl %al, %eax		; X86-NEXT: movzbl %al, %eax
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: test_mm_mask_testn_epi32_mask:		; X64-LABEL: test_mm_mask_testn_epi32_mask:
; X64: # %bb.0: # %entry		; X64: # %bb.0: # %entry
		; X64-NEXT: vpand %xmm0, %xmm1, %xmm0
; X64-NEXT: kmovw %edi, %k1		; X64-NEXT: kmovw %edi, %k1
; X64-NEXT: vptestnmd %xmm0, %xmm1, %k0 {%k1}		; X64-NEXT: vptestnmd %xmm0, %xmm0, %k0 {%k1}
; X64-NEXT: kmovw %k0, %eax		; X64-NEXT: kmovw %k0, %eax
; X64-NEXT: movzbl %al, %eax		; X64-NEXT: movzbl %al, %eax
; X64-NEXT: retq		; X64-NEXT: retq
entry:		entry:
%and.i.i = and <2 x i64> %__B, %__A		%and.i.i = and <2 x i64> %__B, %__A
%0 = bitcast <2 x i64> %and.i.i to <4 x i32>		%0 = bitcast <2 x i64> %and.i.i to <4 x i32>
%1 = icmp eq <4 x i32> %0, zeroinitializer		%1 = icmp eq <4 x i32> %0, zeroinitializer
%2 = bitcast i8 %__U to <8 x i1>		%2 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %2, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%extract.i = shufflevector <8 x i1> %2, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%3 = and <4 x i1> %1, %extract.i		%3 = and <4 x i1> %1, %extract.i
%4 = shufflevector <4 x i1> %3, <4 x i1> zeroinitializer, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>		%4 = shufflevector <4 x i1> %3, <4 x i1> zeroinitializer, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
%5 = bitcast <8 x i1> %4 to i8		%5 = bitcast <8 x i1> %4 to i8
ret i8 %5		ret i8 %5
}		}

define zeroext i8 @test_mm256_testn_epi32_mask(<4 x i64> %__A, <4 x i64> %__B) {		define zeroext i8 @test_mm256_testn_epi32_mask(<4 x i64> %__A, <4 x i64> %__B) {
; CHECK-LABEL: test_mm256_testn_epi32_mask:		; CHECK-LABEL: test_mm256_testn_epi32_mask:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vptestnmd %ymm0, %ymm1, %k0		; CHECK-NEXT: vpand %ymm0, %ymm1, %ymm0
		; CHECK-NEXT: vptestnmd %ymm0, %ymm0, %k0
; CHECK-NEXT: kmovw %k0, %eax		; CHECK-NEXT: kmovw %k0, %eax
; CHECK-NEXT: movzbl %al, %eax		; CHECK-NEXT: movzbl %al, %eax
; CHECK-NEXT: vzeroupper		; CHECK-NEXT: vzeroupper
; CHECK-NEXT: ret{{[l\|q]}}		; CHECK-NEXT: ret{{[l\|q]}}
entry:		entry:
%and.i.i = and <4 x i64> %__B, %__A		%and.i.i = and <4 x i64> %__B, %__A
%0 = bitcast <4 x i64> %and.i.i to <8 x i32>		%0 = bitcast <4 x i64> %and.i.i to <8 x i32>
%1 = icmp eq <8 x i32> %0, zeroinitializer		%1 = icmp eq <8 x i32> %0, zeroinitializer
%2 = bitcast <8 x i1> %1 to i8		%2 = bitcast <8 x i1> %1 to i8
ret i8 %2		ret i8 %2
}		}

define zeroext i8 @test_mm256_mask_testn_epi32_mask(i8 zeroext %__U, <4 x i64> %__A, <4 x i64> %__B) {		define zeroext i8 @test_mm256_mask_testn_epi32_mask(i8 zeroext %__U, <4 x i64> %__A, <4 x i64> %__B) {
; X86-LABEL: test_mm256_mask_testn_epi32_mask:		; X86-LABEL: test_mm256_mask_testn_epi32_mask:
; X86: # %bb.0: # %entry		; X86: # %bb.0: # %entry
; X86-NEXT: movb {{[0-9]+}}(%esp), %al		; X86-NEXT: movb {{[0-9]+}}(%esp), %al
		; X86-NEXT: vpand %ymm0, %ymm1, %ymm0
; X86-NEXT: kmovw %eax, %k1		; X86-NEXT: kmovw %eax, %k1
; X86-NEXT: vptestnmd %ymm0, %ymm1, %k0 {%k1}		; X86-NEXT: vptestnmd %ymm0, %ymm0, %k0 {%k1}
; X86-NEXT: kmovw %k0, %eax		; X86-NEXT: kmovw %k0, %eax
; X86-NEXT: movzbl %al, %eax		; X86-NEXT: movzbl %al, %eax
; X86-NEXT: vzeroupper		; X86-NEXT: vzeroupper
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: test_mm256_mask_testn_epi32_mask:		; X64-LABEL: test_mm256_mask_testn_epi32_mask:
; X64: # %bb.0: # %entry		; X64: # %bb.0: # %entry
		; X64-NEXT: vpand %ymm0, %ymm1, %ymm0
; X64-NEXT: kmovw %edi, %k1		; X64-NEXT: kmovw %edi, %k1
; X64-NEXT: vptestnmd %ymm0, %ymm1, %k0 {%k1}		; X64-NEXT: vptestnmd %ymm0, %ymm0, %k0 {%k1}
; X64-NEXT: kmovw %k0, %eax		; X64-NEXT: kmovw %k0, %eax
; X64-NEXT: movzbl %al, %eax		; X64-NEXT: movzbl %al, %eax
; X64-NEXT: vzeroupper		; X64-NEXT: vzeroupper
; X64-NEXT: retq		; X64-NEXT: retq
entry:		entry:
%and.i.i = and <4 x i64> %__B, %__A		%and.i.i = and <4 x i64> %__B, %__A
%0 = bitcast <4 x i64> %and.i.i to <8 x i32>		%0 = bitcast <4 x i64> %and.i.i to <8 x i32>
%1 = icmp eq <8 x i32> %0, zeroinitializer		%1 = icmp eq <8 x i32> %0, zeroinitializer
▲ Show 20 Lines • Show All 5,869 Lines • Show Last 20 Lines

test/CodeGen/X86/avx512vl-logic.ll

Show First 20 Lines • Show All 216 Lines • ▼ Show 20 Lines	entry:
%x = xor <2 x i64> %a2, %b		%x = xor <2 x i64> %a2, %b
ret <2 x i64> %x		ret <2 x i64> %x
}		}


define <4 x double> @test_mm256_mask_andnot_pd(<4 x double> %__W, i8 zeroext %__U, <4 x double> %__A, <4 x double> %__B) {		define <4 x double> @test_mm256_mask_andnot_pd(<4 x double> %__W, i8 zeroext %__U, <4 x double> %__A, <4 x double> %__B) {
; KNL-LABEL: test_mm256_mask_andnot_pd:		; KNL-LABEL: test_mm256_mask_andnot_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vandnpd %ymm2, %ymm1, %ymm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandnq %ymm2, %ymm1, %ymm0 {%k1}		; KNL-NEXT: vmovapd %ymm1, %ymm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm256_mask_andnot_pd:		; SKX-LABEL: test_mm256_mask_andnot_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandnpd %ymm2, %ymm1, %ymm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandnpd %ymm2, %ymm1, %ymm0 {%k1}		; SKX-NEXT: vmovapd %ymm1, %ymm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <4 x double> %__A to <4 x i64>		%0 = bitcast <4 x double> %__A to <4 x i64>
%neg.i.i = xor <4 x i64> %0, <i64 -1, i64 -1, i64 -1, i64 -1>		%neg.i.i = xor <4 x i64> %0, <i64 -1, i64 -1, i64 -1, i64 -1>
%1 = bitcast <4 x double> %__B to <4 x i64>		%1 = bitcast <4 x double> %__B to <4 x i64>
%and.i.i = and <4 x i64> %1, %neg.i.i		%and.i.i = and <4 x i64> %1, %neg.i.i
%2 = bitcast <4 x i64> %and.i.i to <4 x double>		%2 = bitcast <4 x i64> %and.i.i to <4 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%4 = select <4 x i1> %extract.i, <4 x double> %2, <4 x double> %__W		%4 = select <4 x i1> %extract.i, <4 x double> %2, <4 x double> %__W
ret <4 x double> %4		ret <4 x double> %4
}		}

define <4 x double> @test_mm256_maskz_andnot_pd(i8 zeroext %__U, <4 x double> %__A, <4 x double> %__B) {		define <4 x double> @test_mm256_maskz_andnot_pd(i8 zeroext %__U, <4 x double> %__A, <4 x double> %__B) {
; KNL-LABEL: test_mm256_maskz_andnot_pd:		; KNL-LABEL: test_mm256_maskz_andnot_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vandnpd %ymm1, %ymm0, %ymm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandnq %ymm1, %ymm0, %ymm0 {%k1} {z}		; KNL-NEXT: vmovapd %ymm0, %ymm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm256_maskz_andnot_pd:		; SKX-LABEL: test_mm256_maskz_andnot_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandnpd %ymm1, %ymm0, %ymm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandnpd %ymm1, %ymm0, %ymm0 {%k1} {z}		; SKX-NEXT: vmovapd %ymm0, %ymm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <4 x double> %__A to <4 x i64>		%0 = bitcast <4 x double> %__A to <4 x i64>
%neg.i.i = xor <4 x i64> %0, <i64 -1, i64 -1, i64 -1, i64 -1>		%neg.i.i = xor <4 x i64> %0, <i64 -1, i64 -1, i64 -1, i64 -1>
%1 = bitcast <4 x double> %__B to <4 x i64>		%1 = bitcast <4 x double> %__B to <4 x i64>
%and.i.i = and <4 x i64> %1, %neg.i.i		%and.i.i = and <4 x i64> %1, %neg.i.i
%2 = bitcast <4 x i64> %and.i.i to <4 x double>		%2 = bitcast <4 x i64> %and.i.i to <4 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%4 = select <4 x i1> %extract.i, <4 x double> %2, <4 x double> zeroinitializer		%4 = select <4 x i1> %extract.i, <4 x double> %2, <4 x double> zeroinitializer
ret <4 x double> %4		ret <4 x double> %4
}		}

define <2 x double> @test_mm_mask_andnot_pd(<2 x double> %__W, i8 zeroext %__U, <2 x double> %__A, <2 x double> %__B) {		define <2 x double> @test_mm_mask_andnot_pd(<2 x double> %__W, i8 zeroext %__U, <2 x double> %__A, <2 x double> %__B) {
; KNL-LABEL: test_mm_mask_andnot_pd:		; KNL-LABEL: test_mm_mask_andnot_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vandnpd %xmm2, %xmm1, %xmm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandnq %xmm2, %xmm1, %xmm0 {%k1}		; KNL-NEXT: vmovapd %xmm1, %xmm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm_mask_andnot_pd:		; SKX-LABEL: test_mm_mask_andnot_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandnpd %xmm2, %xmm1, %xmm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandnpd %xmm2, %xmm1, %xmm0 {%k1}		; SKX-NEXT: vmovapd %xmm1, %xmm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <2 x double> %__A to <2 x i64>		%0 = bitcast <2 x double> %__A to <2 x i64>
%neg.i.i = xor <2 x i64> %0, <i64 -1, i64 -1>		%neg.i.i = xor <2 x i64> %0, <i64 -1, i64 -1>
%1 = bitcast <2 x double> %__B to <2 x i64>		%1 = bitcast <2 x double> %__B to <2 x i64>
%and.i.i = and <2 x i64> %1, %neg.i.i		%and.i.i = and <2 x i64> %1, %neg.i.i
%2 = bitcast <2 x i64> %and.i.i to <2 x double>		%2 = bitcast <2 x i64> %and.i.i to <2 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <2 x i32> <i32 0, i32 1>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <2 x i32> <i32 0, i32 1>
%4 = select <2 x i1> %extract.i, <2 x double> %2, <2 x double> %__W		%4 = select <2 x i1> %extract.i, <2 x double> %2, <2 x double> %__W
ret <2 x double> %4		ret <2 x double> %4
}		}

define <2 x double> @test_mm_maskz_andnot_pd(i8 zeroext %__U, <2 x double> %__A, <2 x double> %__B) {		define <2 x double> @test_mm_maskz_andnot_pd(i8 zeroext %__U, <2 x double> %__A, <2 x double> %__B) {
; KNL-LABEL: test_mm_maskz_andnot_pd:		; KNL-LABEL: test_mm_maskz_andnot_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vandnpd %xmm1, %xmm0, %xmm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandnq %xmm1, %xmm0, %xmm0 {%k1} {z}		; KNL-NEXT: vmovapd %xmm0, %xmm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm_maskz_andnot_pd:		; SKX-LABEL: test_mm_maskz_andnot_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandnpd %xmm1, %xmm0, %xmm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandnpd %xmm1, %xmm0, %xmm0 {%k1} {z}		; SKX-NEXT: vmovapd %xmm0, %xmm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <2 x double> %__A to <2 x i64>		%0 = bitcast <2 x double> %__A to <2 x i64>
%neg.i.i = xor <2 x i64> %0, <i64 -1, i64 -1>		%neg.i.i = xor <2 x i64> %0, <i64 -1, i64 -1>
%1 = bitcast <2 x double> %__B to <2 x i64>		%1 = bitcast <2 x double> %__B to <2 x i64>
%and.i.i = and <2 x i64> %1, %neg.i.i		%and.i.i = and <2 x i64> %1, %neg.i.i
%2 = bitcast <2 x i64> %and.i.i to <2 x double>		%2 = bitcast <2 x i64> %and.i.i to <2 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <2 x i32> <i32 0, i32 1>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <2 x i32> <i32 0, i32 1>
%4 = select <2 x i1> %extract.i, <2 x double> %2, <2 x double> zeroinitializer		%4 = select <2 x i1> %extract.i, <2 x double> %2, <2 x double> zeroinitializer
ret <2 x double> %4		ret <2 x double> %4
}		}

define <8 x float> @test_mm256_mask_andnot_ps(<8 x float> %__W, i8 zeroext %__U, <8 x float> %__A, <8 x float> %__B) {		define <8 x float> @test_mm256_mask_andnot_ps(<8 x float> %__W, i8 zeroext %__U, <8 x float> %__A, <8 x float> %__B) {
; KNL-LABEL: test_mm256_mask_andnot_ps:		; KNL-LABEL: test_mm256_mask_andnot_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vandnps %ymm2, %ymm1, %ymm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandnd %ymm2, %ymm1, %ymm0 {%k1}		; KNL-NEXT: vmovaps %ymm1, %ymm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm256_mask_andnot_ps:		; SKX-LABEL: test_mm256_mask_andnot_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandnps %ymm2, %ymm1, %ymm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandnps %ymm2, %ymm1, %ymm0 {%k1}		; SKX-NEXT: vmovaps %ymm1, %ymm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <8 x float> %__A to <8 x i32>		%0 = bitcast <8 x float> %__A to <8 x i32>
%neg.i.i = xor <8 x i32> %0, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>		%neg.i.i = xor <8 x i32> %0, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>
%1 = bitcast <8 x float> %__B to <8 x i32>		%1 = bitcast <8 x float> %__B to <8 x i32>
%and.i.i = and <8 x i32> %1, %neg.i.i		%and.i.i = and <8 x i32> %1, %neg.i.i
%2 = bitcast <8 x i32> %and.i.i to <8 x float>		%2 = bitcast <8 x i32> %and.i.i to <8 x float>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x float> %2, <8 x float> %__W		%4 = select <8 x i1> %3, <8 x float> %2, <8 x float> %__W
ret <8 x float> %4		ret <8 x float> %4
}		}

define <8 x float> @test_mm256_maskz_andnot_ps(i8 zeroext %__U, <8 x float> %__A, <8 x float> %__B) {		define <8 x float> @test_mm256_maskz_andnot_ps(i8 zeroext %__U, <8 x float> %__A, <8 x float> %__B) {
; KNL-LABEL: test_mm256_maskz_andnot_ps:		; KNL-LABEL: test_mm256_maskz_andnot_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vandnps %ymm1, %ymm0, %ymm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandnd %ymm1, %ymm0, %ymm0 {%k1} {z}		; KNL-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm256_maskz_andnot_ps:		; SKX-LABEL: test_mm256_maskz_andnot_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandnps %ymm1, %ymm0, %ymm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandnps %ymm1, %ymm0, %ymm0 {%k1} {z}		; SKX-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <8 x float> %__A to <8 x i32>		%0 = bitcast <8 x float> %__A to <8 x i32>
%neg.i.i = xor <8 x i32> %0, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>		%neg.i.i = xor <8 x i32> %0, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>
%1 = bitcast <8 x float> %__B to <8 x i32>		%1 = bitcast <8 x float> %__B to <8 x i32>
%and.i.i = and <8 x i32> %1, %neg.i.i		%and.i.i = and <8 x i32> %1, %neg.i.i
%2 = bitcast <8 x i32> %and.i.i to <8 x float>		%2 = bitcast <8 x i32> %and.i.i to <8 x float>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x float> %2, <8 x float> zeroinitializer		%4 = select <8 x i1> %3, <8 x float> %2, <8 x float> zeroinitializer
ret <8 x float> %4		ret <8 x float> %4
}		}

define <4 x float> @test_mm_mask_andnot_ps(<4 x float> %__W, i8 zeroext %__U, <4 x float> %__A, <4 x float> %__B) {		define <4 x float> @test_mm_mask_andnot_ps(<4 x float> %__W, i8 zeroext %__U, <4 x float> %__A, <4 x float> %__B) {
; KNL-LABEL: test_mm_mask_andnot_ps:		; KNL-LABEL: test_mm_mask_andnot_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vandnps %xmm2, %xmm1, %xmm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandnd %xmm2, %xmm1, %xmm0 {%k1}		; KNL-NEXT: vmovaps %xmm1, %xmm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm_mask_andnot_ps:		; SKX-LABEL: test_mm_mask_andnot_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandnps %xmm2, %xmm1, %xmm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandnps %xmm2, %xmm1, %xmm0 {%k1}		; SKX-NEXT: vmovaps %xmm1, %xmm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <4 x float> %__A to <4 x i32>		%0 = bitcast <4 x float> %__A to <4 x i32>
%neg.i.i = xor <4 x i32> %0, <i32 -1, i32 -1, i32 -1, i32 -1>		%neg.i.i = xor <4 x i32> %0, <i32 -1, i32 -1, i32 -1, i32 -1>
%1 = bitcast <4 x float> %__B to <4 x i32>		%1 = bitcast <4 x float> %__B to <4 x i32>
%and.i.i = and <4 x i32> %1, %neg.i.i		%and.i.i = and <4 x i32> %1, %neg.i.i
%2 = bitcast <4 x i32> %and.i.i to <4 x float>		%2 = bitcast <4 x i32> %and.i.i to <4 x float>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%4 = select <4 x i1> %extract.i, <4 x float> %2, <4 x float> %__W		%4 = select <4 x i1> %extract.i, <4 x float> %2, <4 x float> %__W
ret <4 x float> %4		ret <4 x float> %4
}		}

define <4 x float> @test_mm_maskz_andnot_ps(i8 zeroext %__U, <4 x float> %__A, <4 x float> %__B) {		define <4 x float> @test_mm_maskz_andnot_ps(i8 zeroext %__U, <4 x float> %__A, <4 x float> %__B) {
; KNL-LABEL: test_mm_maskz_andnot_ps:		; KNL-LABEL: test_mm_maskz_andnot_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vandnps %xmm1, %xmm0, %xmm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandnd %xmm1, %xmm0, %xmm0 {%k1} {z}		; KNL-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm_maskz_andnot_ps:		; SKX-LABEL: test_mm_maskz_andnot_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandnps %xmm1, %xmm0, %xmm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandnps %xmm1, %xmm0, %xmm0 {%k1} {z}		; SKX-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <4 x float> %__A to <4 x i32>		%0 = bitcast <4 x float> %__A to <4 x i32>
%neg.i.i = xor <4 x i32> %0, <i32 -1, i32 -1, i32 -1, i32 -1>		%neg.i.i = xor <4 x i32> %0, <i32 -1, i32 -1, i32 -1, i32 -1>
%1 = bitcast <4 x float> %__B to <4 x i32>		%1 = bitcast <4 x float> %__B to <4 x i32>
%and.i.i = and <4 x i32> %1, %neg.i.i		%and.i.i = and <4 x i32> %1, %neg.i.i
%2 = bitcast <4 x i32> %and.i.i to <4 x float>		%2 = bitcast <4 x i32> %and.i.i to <4 x float>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%4 = select <4 x i1> %extract.i, <4 x float> %2, <4 x float> zeroinitializer		%4 = select <4 x i1> %extract.i, <4 x float> %2, <4 x float> zeroinitializer
ret <4 x float> %4		ret <4 x float> %4
}		}

define <4 x double> @test_mm256_mask_and_pd(<4 x double> %__W, i8 zeroext %__U, <4 x double> %__A, <4 x double> %__B) {		define <4 x double> @test_mm256_mask_and_pd(<4 x double> %__W, i8 zeroext %__U, <4 x double> %__A, <4 x double> %__B) {
; KNL-LABEL: test_mm256_mask_and_pd:		; KNL-LABEL: test_mm256_mask_and_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vandpd %ymm1, %ymm2, %ymm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandq %ymm1, %ymm2, %ymm0 {%k1}		; KNL-NEXT: vmovapd %ymm1, %ymm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm256_mask_and_pd:		; SKX-LABEL: test_mm256_mask_and_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandpd %ymm1, %ymm2, %ymm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandpd %ymm1, %ymm2, %ymm0 {%k1}		; SKX-NEXT: vmovapd %ymm1, %ymm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <4 x double> %__A to <4 x i64>		%0 = bitcast <4 x double> %__A to <4 x i64>
%1 = bitcast <4 x double> %__B to <4 x i64>		%1 = bitcast <4 x double> %__B to <4 x i64>
%and.i.i = and <4 x i64> %1, %0		%and.i.i = and <4 x i64> %1, %0
%2 = bitcast <4 x i64> %and.i.i to <4 x double>		%2 = bitcast <4 x i64> %and.i.i to <4 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%4 = select <4 x i1> %extract.i, <4 x double> %2, <4 x double> %__W		%4 = select <4 x i1> %extract.i, <4 x double> %2, <4 x double> %__W
ret <4 x double> %4		ret <4 x double> %4
}		}

define <4 x double> @test_mm256_maskz_and_pd(i8 zeroext %__U, <4 x double> %__A, <4 x double> %__B) {		define <4 x double> @test_mm256_maskz_and_pd(i8 zeroext %__U, <4 x double> %__A, <4 x double> %__B) {
; KNL-LABEL: test_mm256_maskz_and_pd:		; KNL-LABEL: test_mm256_maskz_and_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vandpd %ymm0, %ymm1, %ymm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandq %ymm0, %ymm1, %ymm0 {%k1} {z}		; KNL-NEXT: vmovapd %ymm0, %ymm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm256_maskz_and_pd:		; SKX-LABEL: test_mm256_maskz_and_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandpd %ymm0, %ymm1, %ymm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandpd %ymm0, %ymm1, %ymm0 {%k1} {z}		; SKX-NEXT: vmovapd %ymm0, %ymm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <4 x double> %__A to <4 x i64>		%0 = bitcast <4 x double> %__A to <4 x i64>
%1 = bitcast <4 x double> %__B to <4 x i64>		%1 = bitcast <4 x double> %__B to <4 x i64>
%and.i.i = and <4 x i64> %1, %0		%and.i.i = and <4 x i64> %1, %0
%2 = bitcast <4 x i64> %and.i.i to <4 x double>		%2 = bitcast <4 x i64> %and.i.i to <4 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%4 = select <4 x i1> %extract.i, <4 x double> %2, <4 x double> zeroinitializer		%4 = select <4 x i1> %extract.i, <4 x double> %2, <4 x double> zeroinitializer
ret <4 x double> %4		ret <4 x double> %4
}		}

define <2 x double> @test_mm_mask_and_pd(<2 x double> %__W, i8 zeroext %__U, <2 x double> %__A, <2 x double> %__B) {		define <2 x double> @test_mm_mask_and_pd(<2 x double> %__W, i8 zeroext %__U, <2 x double> %__A, <2 x double> %__B) {
; KNL-LABEL: test_mm_mask_and_pd:		; KNL-LABEL: test_mm_mask_and_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vandpd %xmm1, %xmm2, %xmm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandq %xmm1, %xmm2, %xmm0 {%k1}		; KNL-NEXT: vmovapd %xmm1, %xmm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm_mask_and_pd:		; SKX-LABEL: test_mm_mask_and_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandpd %xmm1, %xmm2, %xmm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandpd %xmm1, %xmm2, %xmm0 {%k1}		; SKX-NEXT: vmovapd %xmm1, %xmm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <2 x double> %__A to <2 x i64>		%0 = bitcast <2 x double> %__A to <2 x i64>
%1 = bitcast <2 x double> %__B to <2 x i64>		%1 = bitcast <2 x double> %__B to <2 x i64>
%and.i.i = and <2 x i64> %1, %0		%and.i.i = and <2 x i64> %1, %0
%2 = bitcast <2 x i64> %and.i.i to <2 x double>		%2 = bitcast <2 x i64> %and.i.i to <2 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <2 x i32> <i32 0, i32 1>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <2 x i32> <i32 0, i32 1>
%4 = select <2 x i1> %extract.i, <2 x double> %2, <2 x double> %__W		%4 = select <2 x i1> %extract.i, <2 x double> %2, <2 x double> %__W
ret <2 x double> %4		ret <2 x double> %4
}		}

define <2 x double> @test_mm_maskz_and_pd(i8 zeroext %__U, <2 x double> %__A, <2 x double> %__B) {		define <2 x double> @test_mm_maskz_and_pd(i8 zeroext %__U, <2 x double> %__A, <2 x double> %__B) {
; KNL-LABEL: test_mm_maskz_and_pd:		; KNL-LABEL: test_mm_maskz_and_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vandpd %xmm0, %xmm1, %xmm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandq %xmm0, %xmm1, %xmm0 {%k1} {z}		; KNL-NEXT: vmovapd %xmm0, %xmm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm_maskz_and_pd:		; SKX-LABEL: test_mm_maskz_and_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandpd %xmm0, %xmm1, %xmm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandpd %xmm0, %xmm1, %xmm0 {%k1} {z}		; SKX-NEXT: vmovapd %xmm0, %xmm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <2 x double> %__A to <2 x i64>		%0 = bitcast <2 x double> %__A to <2 x i64>
%1 = bitcast <2 x double> %__B to <2 x i64>		%1 = bitcast <2 x double> %__B to <2 x i64>
%and.i.i = and <2 x i64> %1, %0		%and.i.i = and <2 x i64> %1, %0
%2 = bitcast <2 x i64> %and.i.i to <2 x double>		%2 = bitcast <2 x i64> %and.i.i to <2 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <2 x i32> <i32 0, i32 1>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <2 x i32> <i32 0, i32 1>
%4 = select <2 x i1> %extract.i, <2 x double> %2, <2 x double> zeroinitializer		%4 = select <2 x i1> %extract.i, <2 x double> %2, <2 x double> zeroinitializer
ret <2 x double> %4		ret <2 x double> %4
}		}

define <8 x float> @test_mm256_mask_and_ps(<8 x float> %__W, i8 zeroext %__U, <8 x float> %__A, <8 x float> %__B) {		define <8 x float> @test_mm256_mask_and_ps(<8 x float> %__W, i8 zeroext %__U, <8 x float> %__A, <8 x float> %__B) {
; KNL-LABEL: test_mm256_mask_and_ps:		; KNL-LABEL: test_mm256_mask_and_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vandps %ymm1, %ymm2, %ymm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandd %ymm1, %ymm2, %ymm0 {%k1}		; KNL-NEXT: vmovaps %ymm1, %ymm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm256_mask_and_ps:		; SKX-LABEL: test_mm256_mask_and_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandps %ymm1, %ymm2, %ymm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandps %ymm1, %ymm2, %ymm0 {%k1}		; SKX-NEXT: vmovaps %ymm1, %ymm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <8 x float> %__A to <8 x i32>		%0 = bitcast <8 x float> %__A to <8 x i32>
%1 = bitcast <8 x float> %__B to <8 x i32>		%1 = bitcast <8 x float> %__B to <8 x i32>
%and.i.i = and <8 x i32> %1, %0		%and.i.i = and <8 x i32> %1, %0
%2 = bitcast <8 x i32> %and.i.i to <8 x float>		%2 = bitcast <8 x i32> %and.i.i to <8 x float>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x float> %2, <8 x float> %__W		%4 = select <8 x i1> %3, <8 x float> %2, <8 x float> %__W
ret <8 x float> %4		ret <8 x float> %4
}		}

define <8 x float> @test_mm256_maskz_and_ps(i8 zeroext %__U, <8 x float> %__A, <8 x float> %__B) {		define <8 x float> @test_mm256_maskz_and_ps(i8 zeroext %__U, <8 x float> %__A, <8 x float> %__B) {
; KNL-LABEL: test_mm256_maskz_and_ps:		; KNL-LABEL: test_mm256_maskz_and_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vandps %ymm0, %ymm1, %ymm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandd %ymm0, %ymm1, %ymm0 {%k1} {z}		; KNL-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm256_maskz_and_ps:		; SKX-LABEL: test_mm256_maskz_and_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandps %ymm0, %ymm1, %ymm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandps %ymm0, %ymm1, %ymm0 {%k1} {z}		; SKX-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <8 x float> %__A to <8 x i32>		%0 = bitcast <8 x float> %__A to <8 x i32>
%1 = bitcast <8 x float> %__B to <8 x i32>		%1 = bitcast <8 x float> %__B to <8 x i32>
%and.i.i = and <8 x i32> %1, %0		%and.i.i = and <8 x i32> %1, %0
%2 = bitcast <8 x i32> %and.i.i to <8 x float>		%2 = bitcast <8 x i32> %and.i.i to <8 x float>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x float> %2, <8 x float> zeroinitializer		%4 = select <8 x i1> %3, <8 x float> %2, <8 x float> zeroinitializer
ret <8 x float> %4		ret <8 x float> %4
}		}

define <4 x float> @test_mm_mask_and_ps(<4 x float> %__W, i8 zeroext %__U, <4 x float> %__A, <4 x float> %__B) {		define <4 x float> @test_mm_mask_and_ps(<4 x float> %__W, i8 zeroext %__U, <4 x float> %__A, <4 x float> %__B) {
; KNL-LABEL: test_mm_mask_and_ps:		; KNL-LABEL: test_mm_mask_and_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vandps %xmm1, %xmm2, %xmm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandd %xmm1, %xmm2, %xmm0 {%k1}		; KNL-NEXT: vmovaps %xmm1, %xmm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm_mask_and_ps:		; SKX-LABEL: test_mm_mask_and_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandps %xmm1, %xmm2, %xmm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandps %xmm1, %xmm2, %xmm0 {%k1}		; SKX-NEXT: vmovaps %xmm1, %xmm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <4 x float> %__A to <4 x i32>		%0 = bitcast <4 x float> %__A to <4 x i32>
%1 = bitcast <4 x float> %__B to <4 x i32>		%1 = bitcast <4 x float> %__B to <4 x i32>
%and.i.i = and <4 x i32> %1, %0		%and.i.i = and <4 x i32> %1, %0
%2 = bitcast <4 x i32> %and.i.i to <4 x float>		%2 = bitcast <4 x i32> %and.i.i to <4 x float>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%4 = select <4 x i1> %extract.i, <4 x float> %2, <4 x float> %__W		%4 = select <4 x i1> %extract.i, <4 x float> %2, <4 x float> %__W
ret <4 x float> %4		ret <4 x float> %4
}		}

define <4 x float> @test_mm_maskz_and_ps(i8 zeroext %__U, <4 x float> %__A, <4 x float> %__B) {		define <4 x float> @test_mm_maskz_and_ps(i8 zeroext %__U, <4 x float> %__A, <4 x float> %__B) {
; KNL-LABEL: test_mm_maskz_and_ps:		; KNL-LABEL: test_mm_maskz_and_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vandps %xmm0, %xmm1, %xmm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpandd %xmm0, %xmm1, %xmm0 {%k1} {z}		; KNL-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm_maskz_and_ps:		; SKX-LABEL: test_mm_maskz_and_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vandps %xmm0, %xmm1, %xmm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vandps %xmm0, %xmm1, %xmm0 {%k1} {z}		; SKX-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <4 x float> %__A to <4 x i32>		%0 = bitcast <4 x float> %__A to <4 x i32>
%1 = bitcast <4 x float> %__B to <4 x i32>		%1 = bitcast <4 x float> %__B to <4 x i32>
%and.i.i = and <4 x i32> %1, %0		%and.i.i = and <4 x i32> %1, %0
%2 = bitcast <4 x i32> %and.i.i to <4 x float>		%2 = bitcast <4 x i32> %and.i.i to <4 x float>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%4 = select <4 x i1> %extract.i, <4 x float> %2, <4 x float> zeroinitializer		%4 = select <4 x i1> %extract.i, <4 x float> %2, <4 x float> zeroinitializer
ret <4 x float> %4		ret <4 x float> %4
}		}

define <4 x double> @test_mm256_mask_xor_pd(<4 x double> %__W, i8 zeroext %__U, <4 x double> %__A, <4 x double> %__B) {		define <4 x double> @test_mm256_mask_xor_pd(<4 x double> %__W, i8 zeroext %__U, <4 x double> %__A, <4 x double> %__B) {
; KNL-LABEL: test_mm256_mask_xor_pd:		; KNL-LABEL: test_mm256_mask_xor_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vxorpd %ymm2, %ymm1, %ymm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpxorq %ymm2, %ymm1, %ymm0 {%k1}		; KNL-NEXT: vmovapd %ymm1, %ymm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm256_mask_xor_pd:		; SKX-LABEL: test_mm256_mask_xor_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vxorpd %ymm2, %ymm1, %ymm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vxorpd %ymm2, %ymm1, %ymm0 {%k1}		; SKX-NEXT: vmovapd %ymm1, %ymm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <4 x double> %__A to <4 x i64>		%0 = bitcast <4 x double> %__A to <4 x i64>
%1 = bitcast <4 x double> %__B to <4 x i64>		%1 = bitcast <4 x double> %__B to <4 x i64>
%xor.i.i = xor <4 x i64> %0, %1		%xor.i.i = xor <4 x i64> %0, %1
%2 = bitcast <4 x i64> %xor.i.i to <4 x double>		%2 = bitcast <4 x i64> %xor.i.i to <4 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%4 = select <4 x i1> %extract.i, <4 x double> %2, <4 x double> %__W		%4 = select <4 x i1> %extract.i, <4 x double> %2, <4 x double> %__W
ret <4 x double> %4		ret <4 x double> %4
}		}

define <4 x double> @test_mm256_maskz_xor_pd(i8 zeroext %__U, <4 x double> %__A, <4 x double> %__B) {		define <4 x double> @test_mm256_maskz_xor_pd(i8 zeroext %__U, <4 x double> %__A, <4 x double> %__B) {
; KNL-LABEL: test_mm256_maskz_xor_pd:		; KNL-LABEL: test_mm256_maskz_xor_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vxorpd %ymm1, %ymm0, %ymm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpxorq %ymm1, %ymm0, %ymm0 {%k1} {z}		; KNL-NEXT: vmovapd %ymm0, %ymm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm256_maskz_xor_pd:		; SKX-LABEL: test_mm256_maskz_xor_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vxorpd %ymm1, %ymm0, %ymm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vxorpd %ymm1, %ymm0, %ymm0 {%k1} {z}		; SKX-NEXT: vmovapd %ymm0, %ymm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <4 x double> %__A to <4 x i64>		%0 = bitcast <4 x double> %__A to <4 x i64>
%1 = bitcast <4 x double> %__B to <4 x i64>		%1 = bitcast <4 x double> %__B to <4 x i64>
%xor.i.i = xor <4 x i64> %0, %1		%xor.i.i = xor <4 x i64> %0, %1
%2 = bitcast <4 x i64> %xor.i.i to <4 x double>		%2 = bitcast <4 x i64> %xor.i.i to <4 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%4 = select <4 x i1> %extract.i, <4 x double> %2, <4 x double> zeroinitializer		%4 = select <4 x i1> %extract.i, <4 x double> %2, <4 x double> zeroinitializer
ret <4 x double> %4		ret <4 x double> %4
}		}

define <2 x double> @test_mm_mask_xor_pd(<2 x double> %__W, i8 zeroext %__U, <2 x double> %__A, <2 x double> %__B) {		define <2 x double> @test_mm_mask_xor_pd(<2 x double> %__W, i8 zeroext %__U, <2 x double> %__A, <2 x double> %__B) {
; KNL-LABEL: test_mm_mask_xor_pd:		; KNL-LABEL: test_mm_mask_xor_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vxorpd %xmm2, %xmm1, %xmm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpxorq %xmm2, %xmm1, %xmm0 {%k1}		; KNL-NEXT: vmovapd %xmm1, %xmm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm_mask_xor_pd:		; SKX-LABEL: test_mm_mask_xor_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vxorpd %xmm2, %xmm1, %xmm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vxorpd %xmm2, %xmm1, %xmm0 {%k1}		; SKX-NEXT: vmovapd %xmm1, %xmm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <2 x double> %__A to <2 x i64>		%0 = bitcast <2 x double> %__A to <2 x i64>
%1 = bitcast <2 x double> %__B to <2 x i64>		%1 = bitcast <2 x double> %__B to <2 x i64>
%xor.i.i = xor <2 x i64> %0, %1		%xor.i.i = xor <2 x i64> %0, %1
%2 = bitcast <2 x i64> %xor.i.i to <2 x double>		%2 = bitcast <2 x i64> %xor.i.i to <2 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <2 x i32> <i32 0, i32 1>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <2 x i32> <i32 0, i32 1>
%4 = select <2 x i1> %extract.i, <2 x double> %2, <2 x double> %__W		%4 = select <2 x i1> %extract.i, <2 x double> %2, <2 x double> %__W
ret <2 x double> %4		ret <2 x double> %4
}		}

define <2 x double> @test_mm_maskz_xor_pd(i8 zeroext %__U, <2 x double> %__A, <2 x double> %__B) {		define <2 x double> @test_mm_maskz_xor_pd(i8 zeroext %__U, <2 x double> %__A, <2 x double> %__B) {
; KNL-LABEL: test_mm_maskz_xor_pd:		; KNL-LABEL: test_mm_maskz_xor_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vxorpd %xmm1, %xmm0, %xmm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpxorq %xmm1, %xmm0, %xmm0 {%k1} {z}		; KNL-NEXT: vmovapd %xmm0, %xmm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm_maskz_xor_pd:		; SKX-LABEL: test_mm_maskz_xor_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vxorpd %xmm1, %xmm0, %xmm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vxorpd %xmm1, %xmm0, %xmm0 {%k1} {z}		; SKX-NEXT: vmovapd %xmm0, %xmm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <2 x double> %__A to <2 x i64>		%0 = bitcast <2 x double> %__A to <2 x i64>
%1 = bitcast <2 x double> %__B to <2 x i64>		%1 = bitcast <2 x double> %__B to <2 x i64>
%xor.i.i = xor <2 x i64> %0, %1		%xor.i.i = xor <2 x i64> %0, %1
%2 = bitcast <2 x i64> %xor.i.i to <2 x double>		%2 = bitcast <2 x i64> %xor.i.i to <2 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <2 x i32> <i32 0, i32 1>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <2 x i32> <i32 0, i32 1>
%4 = select <2 x i1> %extract.i, <2 x double> %2, <2 x double> zeroinitializer		%4 = select <2 x i1> %extract.i, <2 x double> %2, <2 x double> zeroinitializer
ret <2 x double> %4		ret <2 x double> %4
}		}

define <8 x float> @test_mm256_mask_xor_ps(<8 x float> %__W, i8 zeroext %__U, <8 x float> %__A, <8 x float> %__B) {		define <8 x float> @test_mm256_mask_xor_ps(<8 x float> %__W, i8 zeroext %__U, <8 x float> %__A, <8 x float> %__B) {
; KNL-LABEL: test_mm256_mask_xor_ps:		; KNL-LABEL: test_mm256_mask_xor_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vxorps %ymm2, %ymm1, %ymm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpxord %ymm2, %ymm1, %ymm0 {%k1}		; KNL-NEXT: vmovaps %ymm1, %ymm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm256_mask_xor_ps:		; SKX-LABEL: test_mm256_mask_xor_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vxorps %ymm2, %ymm1, %ymm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vxorps %ymm2, %ymm1, %ymm0 {%k1}		; SKX-NEXT: vmovaps %ymm1, %ymm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <8 x float> %__A to <8 x i32>		%0 = bitcast <8 x float> %__A to <8 x i32>
%1 = bitcast <8 x float> %__B to <8 x i32>		%1 = bitcast <8 x float> %__B to <8 x i32>
%xor.i.i = xor <8 x i32> %0, %1		%xor.i.i = xor <8 x i32> %0, %1
%2 = bitcast <8 x i32> %xor.i.i to <8 x float>		%2 = bitcast <8 x i32> %xor.i.i to <8 x float>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x float> %2, <8 x float> %__W		%4 = select <8 x i1> %3, <8 x float> %2, <8 x float> %__W
ret <8 x float> %4		ret <8 x float> %4
}		}

define <8 x float> @test_mm256_maskz_xor_ps(i8 zeroext %__U, <8 x float> %__A, <8 x float> %__B) {		define <8 x float> @test_mm256_maskz_xor_ps(i8 zeroext %__U, <8 x float> %__A, <8 x float> %__B) {
; KNL-LABEL: test_mm256_maskz_xor_ps:		; KNL-LABEL: test_mm256_maskz_xor_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vxorps %ymm1, %ymm0, %ymm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpxord %ymm1, %ymm0, %ymm0 {%k1} {z}		; KNL-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm256_maskz_xor_ps:		; SKX-LABEL: test_mm256_maskz_xor_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vxorps %ymm1, %ymm0, %ymm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vxorps %ymm1, %ymm0, %ymm0 {%k1} {z}		; SKX-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <8 x float> %__A to <8 x i32>		%0 = bitcast <8 x float> %__A to <8 x i32>
%1 = bitcast <8 x float> %__B to <8 x i32>		%1 = bitcast <8 x float> %__B to <8 x i32>
%xor.i.i = xor <8 x i32> %0, %1		%xor.i.i = xor <8 x i32> %0, %1
%2 = bitcast <8 x i32> %xor.i.i to <8 x float>		%2 = bitcast <8 x i32> %xor.i.i to <8 x float>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x float> %2, <8 x float> zeroinitializer		%4 = select <8 x i1> %3, <8 x float> %2, <8 x float> zeroinitializer
ret <8 x float> %4		ret <8 x float> %4
}		}

define <4 x float> @test_mm_mask_xor_ps(<4 x float> %__W, i8 zeroext %__U, <4 x float> %__A, <4 x float> %__B) {		define <4 x float> @test_mm_mask_xor_ps(<4 x float> %__W, i8 zeroext %__U, <4 x float> %__A, <4 x float> %__B) {
; KNL-LABEL: test_mm_mask_xor_ps:		; KNL-LABEL: test_mm_mask_xor_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vxorps %xmm2, %xmm1, %xmm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpxord %xmm2, %xmm1, %xmm0 {%k1}		; KNL-NEXT: vmovaps %xmm1, %xmm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm_mask_xor_ps:		; SKX-LABEL: test_mm_mask_xor_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vxorps %xmm2, %xmm1, %xmm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vxorps %xmm2, %xmm1, %xmm0 {%k1}		; SKX-NEXT: vmovaps %xmm1, %xmm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <4 x float> %__A to <4 x i32>		%0 = bitcast <4 x float> %__A to <4 x i32>
%1 = bitcast <4 x float> %__B to <4 x i32>		%1 = bitcast <4 x float> %__B to <4 x i32>
%xor.i.i = xor <4 x i32> %0, %1		%xor.i.i = xor <4 x i32> %0, %1
%2 = bitcast <4 x i32> %xor.i.i to <4 x float>		%2 = bitcast <4 x i32> %xor.i.i to <4 x float>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%4 = select <4 x i1> %extract.i, <4 x float> %2, <4 x float> %__W		%4 = select <4 x i1> %extract.i, <4 x float> %2, <4 x float> %__W
ret <4 x float> %4		ret <4 x float> %4
}		}

define <4 x float> @test_mm_maskz_xor_ps(i8 zeroext %__U, <4 x float> %__A, <4 x float> %__B) {		define <4 x float> @test_mm_maskz_xor_ps(i8 zeroext %__U, <4 x float> %__A, <4 x float> %__B) {
; KNL-LABEL: test_mm_maskz_xor_ps:		; KNL-LABEL: test_mm_maskz_xor_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vxorps %xmm1, %xmm0, %xmm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpxord %xmm1, %xmm0, %xmm0 {%k1} {z}		; KNL-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm_maskz_xor_ps:		; SKX-LABEL: test_mm_maskz_xor_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vxorps %xmm1, %xmm0, %xmm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vxorps %xmm1, %xmm0, %xmm0 {%k1} {z}		; SKX-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <4 x float> %__A to <4 x i32>		%0 = bitcast <4 x float> %__A to <4 x i32>
%1 = bitcast <4 x float> %__B to <4 x i32>		%1 = bitcast <4 x float> %__B to <4 x i32>
%xor.i.i = xor <4 x i32> %0, %1		%xor.i.i = xor <4 x i32> %0, %1
%2 = bitcast <4 x i32> %xor.i.i to <4 x float>		%2 = bitcast <4 x i32> %xor.i.i to <4 x float>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%4 = select <4 x i1> %extract.i, <4 x float> %2, <4 x float> zeroinitializer		%4 = select <4 x i1> %extract.i, <4 x float> %2, <4 x float> zeroinitializer
ret <4 x float> %4		ret <4 x float> %4
}		}

define <4 x double> @test_mm256_mask_or_pd(<4 x double> %__W, i8 zeroext %__U, <4 x double> %__A, <4 x double> %__B) {		define <4 x double> @test_mm256_mask_or_pd(<4 x double> %__W, i8 zeroext %__U, <4 x double> %__A, <4 x double> %__B) {
; KNL-LABEL: test_mm256_mask_or_pd:		; KNL-LABEL: test_mm256_mask_or_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vorpd %ymm1, %ymm2, %ymm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vporq %ymm1, %ymm2, %ymm0 {%k1}		; KNL-NEXT: vmovapd %ymm1, %ymm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm256_mask_or_pd:		; SKX-LABEL: test_mm256_mask_or_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vorpd %ymm1, %ymm2, %ymm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vorpd %ymm1, %ymm2, %ymm0 {%k1}		; SKX-NEXT: vmovapd %ymm1, %ymm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <4 x double> %__A to <4 x i64>		%0 = bitcast <4 x double> %__A to <4 x i64>
%1 = bitcast <4 x double> %__B to <4 x i64>		%1 = bitcast <4 x double> %__B to <4 x i64>
%or.i.i = or <4 x i64> %1, %0		%or.i.i = or <4 x i64> %1, %0
%2 = bitcast <4 x i64> %or.i.i to <4 x double>		%2 = bitcast <4 x i64> %or.i.i to <4 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%4 = select <4 x i1> %extract.i, <4 x double> %2, <4 x double> %__W		%4 = select <4 x i1> %extract.i, <4 x double> %2, <4 x double> %__W
ret <4 x double> %4		ret <4 x double> %4
}		}

define <4 x double> @test_mm256_maskz_or_pd(i8 zeroext %__U, <4 x double> %__A, <4 x double> %__B) {		define <4 x double> @test_mm256_maskz_or_pd(i8 zeroext %__U, <4 x double> %__A, <4 x double> %__B) {
; KNL-LABEL: test_mm256_maskz_or_pd:		; KNL-LABEL: test_mm256_maskz_or_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vorpd %ymm0, %ymm1, %ymm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vporq %ymm0, %ymm1, %ymm0 {%k1} {z}		; KNL-NEXT: vmovapd %ymm0, %ymm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm256_maskz_or_pd:		; SKX-LABEL: test_mm256_maskz_or_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vorpd %ymm0, %ymm1, %ymm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vorpd %ymm0, %ymm1, %ymm0 {%k1} {z}		; SKX-NEXT: vmovapd %ymm0, %ymm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <4 x double> %__A to <4 x i64>		%0 = bitcast <4 x double> %__A to <4 x i64>
%1 = bitcast <4 x double> %__B to <4 x i64>		%1 = bitcast <4 x double> %__B to <4 x i64>
%or.i.i = or <4 x i64> %1, %0		%or.i.i = or <4 x i64> %1, %0
%2 = bitcast <4 x i64> %or.i.i to <4 x double>		%2 = bitcast <4 x i64> %or.i.i to <4 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%4 = select <4 x i1> %extract.i, <4 x double> %2, <4 x double> zeroinitializer		%4 = select <4 x i1> %extract.i, <4 x double> %2, <4 x double> zeroinitializer
ret <4 x double> %4		ret <4 x double> %4
}		}

define <2 x double> @test_mm_mask_or_pd(<2 x double> %__W, i8 zeroext %__U, <2 x double> %__A, <2 x double> %__B) {		define <2 x double> @test_mm_mask_or_pd(<2 x double> %__W, i8 zeroext %__U, <2 x double> %__A, <2 x double> %__B) {
; KNL-LABEL: test_mm_mask_or_pd:		; KNL-LABEL: test_mm_mask_or_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vorpd %xmm1, %xmm2, %xmm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vporq %xmm1, %xmm2, %xmm0 {%k1}		; KNL-NEXT: vmovapd %xmm1, %xmm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm_mask_or_pd:		; SKX-LABEL: test_mm_mask_or_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vorpd %xmm1, %xmm2, %xmm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vorpd %xmm1, %xmm2, %xmm0 {%k1}		; SKX-NEXT: vmovapd %xmm1, %xmm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <2 x double> %__A to <2 x i64>		%0 = bitcast <2 x double> %__A to <2 x i64>
%1 = bitcast <2 x double> %__B to <2 x i64>		%1 = bitcast <2 x double> %__B to <2 x i64>
%or.i.i = or <2 x i64> %1, %0		%or.i.i = or <2 x i64> %1, %0
%2 = bitcast <2 x i64> %or.i.i to <2 x double>		%2 = bitcast <2 x i64> %or.i.i to <2 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <2 x i32> <i32 0, i32 1>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <2 x i32> <i32 0, i32 1>
%4 = select <2 x i1> %extract.i, <2 x double> %2, <2 x double> %__W		%4 = select <2 x i1> %extract.i, <2 x double> %2, <2 x double> %__W
ret <2 x double> %4		ret <2 x double> %4
}		}

define <2 x double> @test_mm_maskz_or_pd(i8 zeroext %__U, <2 x double> %__A, <2 x double> %__B) {		define <2 x double> @test_mm_maskz_or_pd(i8 zeroext %__U, <2 x double> %__A, <2 x double> %__B) {
; KNL-LABEL: test_mm_maskz_or_pd:		; KNL-LABEL: test_mm_maskz_or_pd:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vorpd %xmm0, %xmm1, %xmm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vporq %xmm0, %xmm1, %xmm0 {%k1} {z}		; KNL-NEXT: vmovapd %xmm0, %xmm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm_maskz_or_pd:		; SKX-LABEL: test_mm_maskz_or_pd:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vorpd %xmm0, %xmm1, %xmm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vorpd %xmm0, %xmm1, %xmm0 {%k1} {z}		; SKX-NEXT: vmovapd %xmm0, %xmm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <2 x double> %__A to <2 x i64>		%0 = bitcast <2 x double> %__A to <2 x i64>
%1 = bitcast <2 x double> %__B to <2 x i64>		%1 = bitcast <2 x double> %__B to <2 x i64>
%or.i.i = or <2 x i64> %1, %0		%or.i.i = or <2 x i64> %1, %0
%2 = bitcast <2 x i64> %or.i.i to <2 x double>		%2 = bitcast <2 x i64> %or.i.i to <2 x double>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <2 x i32> <i32 0, i32 1>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <2 x i32> <i32 0, i32 1>
%4 = select <2 x i1> %extract.i, <2 x double> %2, <2 x double> zeroinitializer		%4 = select <2 x i1> %extract.i, <2 x double> %2, <2 x double> zeroinitializer
ret <2 x double> %4		ret <2 x double> %4
}		}

define <8 x float> @test_mm256_mask_or_ps(<8 x float> %__W, i8 zeroext %__U, <8 x float> %__A, <8 x float> %__B) {		define <8 x float> @test_mm256_mask_or_ps(<8 x float> %__W, i8 zeroext %__U, <8 x float> %__A, <8 x float> %__B) {
; KNL-LABEL: test_mm256_mask_or_ps:		; KNL-LABEL: test_mm256_mask_or_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vorps %ymm1, %ymm2, %ymm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpord %ymm1, %ymm2, %ymm0 {%k1}		; KNL-NEXT: vmovaps %ymm1, %ymm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm256_mask_or_ps:		; SKX-LABEL: test_mm256_mask_or_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vorps %ymm1, %ymm2, %ymm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vorps %ymm1, %ymm2, %ymm0 {%k1}		; SKX-NEXT: vmovaps %ymm1, %ymm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <8 x float> %__A to <8 x i32>		%0 = bitcast <8 x float> %__A to <8 x i32>
%1 = bitcast <8 x float> %__B to <8 x i32>		%1 = bitcast <8 x float> %__B to <8 x i32>
%or.i.i = or <8 x i32> %1, %0		%or.i.i = or <8 x i32> %1, %0
%2 = bitcast <8 x i32> %or.i.i to <8 x float>		%2 = bitcast <8 x i32> %or.i.i to <8 x float>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x float> %2, <8 x float> %__W		%4 = select <8 x i1> %3, <8 x float> %2, <8 x float> %__W
ret <8 x float> %4		ret <8 x float> %4
}		}

define <8 x float> @test_mm256_maskz_or_ps(i8 zeroext %__U, <8 x float> %__A, <8 x float> %__B) {		define <8 x float> @test_mm256_maskz_or_ps(i8 zeroext %__U, <8 x float> %__A, <8 x float> %__B) {
; KNL-LABEL: test_mm256_maskz_or_ps:		; KNL-LABEL: test_mm256_maskz_or_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vorps %ymm0, %ymm1, %ymm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpord %ymm0, %ymm1, %ymm0 {%k1} {z}		; KNL-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm256_maskz_or_ps:		; SKX-LABEL: test_mm256_maskz_or_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vorps %ymm0, %ymm1, %ymm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vorps %ymm0, %ymm1, %ymm0 {%k1} {z}		; SKX-NEXT: vmovaps %ymm0, %ymm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <8 x float> %__A to <8 x i32>		%0 = bitcast <8 x float> %__A to <8 x i32>
%1 = bitcast <8 x float> %__B to <8 x i32>		%1 = bitcast <8 x float> %__B to <8 x i32>
%or.i.i = or <8 x i32> %1, %0		%or.i.i = or <8 x i32> %1, %0
%2 = bitcast <8 x i32> %or.i.i to <8 x float>		%2 = bitcast <8 x i32> %or.i.i to <8 x float>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%4 = select <8 x i1> %3, <8 x float> %2, <8 x float> zeroinitializer		%4 = select <8 x i1> %3, <8 x float> %2, <8 x float> zeroinitializer
ret <8 x float> %4		ret <8 x float> %4
}		}

define <4 x float> @test_mm_mask_or_ps(<4 x float> %__W, i8 zeroext %__U, <4 x float> %__A, <4 x float> %__B) {		define <4 x float> @test_mm_mask_or_ps(<4 x float> %__W, i8 zeroext %__U, <4 x float> %__A, <4 x float> %__B) {
; KNL-LABEL: test_mm_mask_or_ps:		; KNL-LABEL: test_mm_mask_or_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vorps %xmm1, %xmm2, %xmm1
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpord %xmm1, %xmm2, %xmm0 {%k1}		; KNL-NEXT: vmovaps %xmm1, %xmm0 {%k1}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm_mask_or_ps:		; SKX-LABEL: test_mm_mask_or_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vorps %xmm1, %xmm2, %xmm1
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vorps %xmm1, %xmm2, %xmm0 {%k1}		; SKX-NEXT: vmovaps %xmm1, %xmm0 {%k1}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <4 x float> %__A to <4 x i32>		%0 = bitcast <4 x float> %__A to <4 x i32>
%1 = bitcast <4 x float> %__B to <4 x i32>		%1 = bitcast <4 x float> %__B to <4 x i32>
%or.i.i = or <4 x i32> %1, %0		%or.i.i = or <4 x i32> %1, %0
%2 = bitcast <4 x i32> %or.i.i to <4 x float>		%2 = bitcast <4 x i32> %or.i.i to <4 x float>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%4 = select <4 x i1> %extract.i, <4 x float> %2, <4 x float> %__W		%4 = select <4 x i1> %extract.i, <4 x float> %2, <4 x float> %__W
ret <4 x float> %4		ret <4 x float> %4
}		}

define <4 x float> @test_mm_maskz_or_ps(i8 zeroext %__U, <4 x float> %__A, <4 x float> %__B) {		define <4 x float> @test_mm_maskz_or_ps(i8 zeroext %__U, <4 x float> %__A, <4 x float> %__B) {
; KNL-LABEL: test_mm_maskz_or_ps:		; KNL-LABEL: test_mm_maskz_or_ps:
; KNL: ## %bb.0: ## %entry		; KNL: ## %bb.0: ## %entry
		; KNL-NEXT: vorps %xmm0, %xmm1, %xmm0
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vpord %xmm0, %xmm1, %xmm0 {%k1} {z}		; KNL-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z}
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: test_mm_maskz_or_ps:		; SKX-LABEL: test_mm_maskz_or_ps:
; SKX: ## %bb.0: ## %entry		; SKX: ## %bb.0: ## %entry
		; SKX-NEXT: vorps %xmm0, %xmm1, %xmm0
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vorps %xmm0, %xmm1, %xmm0 {%k1} {z}		; SKX-NEXT: vmovaps %xmm0, %xmm0 {%k1} {z}
; SKX-NEXT: retq		; SKX-NEXT: retq
entry:		entry:
%0 = bitcast <4 x float> %__A to <4 x i32>		%0 = bitcast <4 x float> %__A to <4 x i32>
%1 = bitcast <4 x float> %__B to <4 x i32>		%1 = bitcast <4 x float> %__B to <4 x i32>
%or.i.i = or <4 x i32> %1, %0		%or.i.i = or <4 x i32> %1, %0
%2 = bitcast <4 x i32> %or.i.i to <4 x float>		%2 = bitcast <4 x i32> %or.i.i to <4 x float>
%3 = bitcast i8 %__U to <8 x i1>		%3 = bitcast i8 %__U to <8 x i1>
%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%extract.i = shufflevector <8 x i1> %3, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%4 = select <4 x i1> %extract.i, <4 x float> %2, <4 x float> zeroinitializer		%4 = select <4 x i1> %extract.i, <4 x float> %2, <4 x float> zeroinitializer
ret <4 x float> %4		ret <4 x float> %4
}		}

test/CodeGen/X86/avx512vl-vec-test-testn.ll

Show All 23 Lines	entry:
%2 = bitcast <8 x i1> %1 to i8		%2 = bitcast <8 x i1> %1 to i8
ret i8 %2		ret i8 %2
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define zeroext i8 @TEST_mm_test_epi32_mask(<2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {		define zeroext i8 @TEST_mm_test_epi32_mask(<2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {
; X86_64-LABEL: TEST_mm_test_epi32_mask:		; X86_64-LABEL: TEST_mm_test_epi32_mask:
; X86_64: # %bb.0: # %entry		; X86_64: # %bb.0: # %entry
; X86_64-NEXT: vptestmd %xmm0, %xmm1, %k0		; X86_64-NEXT: vpand %xmm0, %xmm1, %xmm0
		; X86_64-NEXT: vptestmd %xmm0, %xmm0, %k0
; X86_64-NEXT: kmovw %k0, %eax		; X86_64-NEXT: kmovw %k0, %eax
; X86_64-NEXT: # kill: def $al killed $al killed $eax		; X86_64-NEXT: # kill: def $al killed $al killed $eax
; X86_64-NEXT: retq		; X86_64-NEXT: retq
;		;
; I386-LABEL: TEST_mm_test_epi32_mask:		; I386-LABEL: TEST_mm_test_epi32_mask:
; I386: # %bb.0: # %entry		; I386: # %bb.0: # %entry
; I386-NEXT: vptestmd %xmm0, %xmm1, %k0		; I386-NEXT: vpand %xmm0, %xmm1, %xmm0
		; I386-NEXT: vptestmd %xmm0, %xmm0, %k0
; I386-NEXT: kmovw %k0, %eax		; I386-NEXT: kmovw %k0, %eax
; I386-NEXT: # kill: def $al killed $al killed $eax		; I386-NEXT: # kill: def $al killed $al killed $eax
; I386-NEXT: retl		; I386-NEXT: retl
entry:		entry:
%and.i.i = and <2 x i64> %__B, %__A		%and.i.i = and <2 x i64> %__B, %__A
%0 = bitcast <2 x i64> %and.i.i to <4 x i32>		%0 = bitcast <2 x i64> %and.i.i to <4 x i32>
%1 = icmp ne <4 x i32> %0, zeroinitializer		%1 = icmp ne <4 x i32> %0, zeroinitializer
%2 = shufflevector <4 x i1> %1, <4 x i1> zeroinitializer, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>		%2 = shufflevector <4 x i1> %1, <4 x i1> zeroinitializer, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
Show All 25 Lines	entry:
%2 = bitcast <8 x i1> %1 to i8		%2 = bitcast <8 x i1> %1 to i8
ret i8 %2		ret i8 %2
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define zeroext i8 @TEST_mm256_test_epi32_mask(<4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {		define zeroext i8 @TEST_mm256_test_epi32_mask(<4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {
; X86_64-LABEL: TEST_mm256_test_epi32_mask:		; X86_64-LABEL: TEST_mm256_test_epi32_mask:
; X86_64: # %bb.0: # %entry		; X86_64: # %bb.0: # %entry
; X86_64-NEXT: vptestmd %ymm0, %ymm1, %k0		; X86_64-NEXT: vpand %ymm0, %ymm1, %ymm0
		; X86_64-NEXT: vptestmd %ymm0, %ymm0, %k0
; X86_64-NEXT: kmovw %k0, %eax		; X86_64-NEXT: kmovw %k0, %eax
; X86_64-NEXT: # kill: def $al killed $al killed $eax		; X86_64-NEXT: # kill: def $al killed $al killed $eax
; X86_64-NEXT: vzeroupper		; X86_64-NEXT: vzeroupper
; X86_64-NEXT: retq		; X86_64-NEXT: retq
;		;
; I386-LABEL: TEST_mm256_test_epi32_mask:		; I386-LABEL: TEST_mm256_test_epi32_mask:
; I386: # %bb.0: # %entry		; I386: # %bb.0: # %entry
; I386-NEXT: vptestmd %ymm0, %ymm1, %k0		; I386-NEXT: vpand %ymm0, %ymm1, %ymm0
		; I386-NEXT: vptestmd %ymm0, %ymm0, %k0
; I386-NEXT: kmovw %k0, %eax		; I386-NEXT: kmovw %k0, %eax
; I386-NEXT: # kill: def $al killed $al killed $eax		; I386-NEXT: # kill: def $al killed $al killed $eax
; I386-NEXT: vzeroupper		; I386-NEXT: vzeroupper
; I386-NEXT: retl		; I386-NEXT: retl
entry:		entry:
%and.i.i = and <4 x i64> %__B, %__A		%and.i.i = and <4 x i64> %__B, %__A
%0 = bitcast <4 x i64> %and.i.i to <8 x i32>		%0 = bitcast <4 x i64> %and.i.i to <8 x i32>
%1 = icmp ne <8 x i32> %0, zeroinitializer		%1 = icmp ne <8 x i32> %0, zeroinitializer
Show All 29 Lines	entry:
%5 = bitcast <8 x i1> %4 to i8		%5 = bitcast <8 x i1> %4 to i8
ret i8 %5		ret i8 %5
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define zeroext i8 @TEST_mm_mask_test_epi32_mask(i8 %__U, <2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {		define zeroext i8 @TEST_mm_mask_test_epi32_mask(i8 %__U, <2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {
; X86_64-LABEL: TEST_mm_mask_test_epi32_mask:		; X86_64-LABEL: TEST_mm_mask_test_epi32_mask:
; X86_64: # %bb.0: # %entry		; X86_64: # %bb.0: # %entry
		; X86_64-NEXT: vpand %xmm0, %xmm1, %xmm0
; X86_64-NEXT: kmovw %edi, %k1		; X86_64-NEXT: kmovw %edi, %k1
; X86_64-NEXT: vptestmd %xmm0, %xmm1, %k0 {%k1}		; X86_64-NEXT: vptestmd %xmm0, %xmm0, %k0 {%k1}
; X86_64-NEXT: kmovw %k0, %eax		; X86_64-NEXT: kmovw %k0, %eax
; X86_64-NEXT: # kill: def $al killed $al killed $eax		; X86_64-NEXT: # kill: def $al killed $al killed $eax
; X86_64-NEXT: retq		; X86_64-NEXT: retq
;		;
; I386-LABEL: TEST_mm_mask_test_epi32_mask:		; I386-LABEL: TEST_mm_mask_test_epi32_mask:
; I386: # %bb.0: # %entry		; I386: # %bb.0: # %entry
		; I386-NEXT: vpand %xmm0, %xmm1, %xmm0
; I386-NEXT: movzbl {{[0-9]+}}(%esp), %eax		; I386-NEXT: movzbl {{[0-9]+}}(%esp), %eax
; I386-NEXT: kmovw %eax, %k1		; I386-NEXT: kmovw %eax, %k1
; I386-NEXT: vptestmd %xmm0, %xmm1, %k0 {%k1}		; I386-NEXT: vptestmd %xmm0, %xmm0, %k0 {%k1}
; I386-NEXT: kmovw %k0, %eax		; I386-NEXT: kmovw %k0, %eax
; I386-NEXT: # kill: def $al killed $al killed $eax		; I386-NEXT: # kill: def $al killed $al killed $eax
; I386-NEXT: retl		; I386-NEXT: retl
entry:		entry:
%and.i.i = and <2 x i64> %__B, %__A		%and.i.i = and <2 x i64> %__B, %__A
%0 = bitcast <2 x i64> %and.i.i to <4 x i32>		%0 = bitcast <2 x i64> %and.i.i to <4 x i32>
%1 = icmp ne <4 x i32> %0, zeroinitializer		%1 = icmp ne <4 x i32> %0, zeroinitializer
%2 = bitcast i8 %__U to <8 x i1>		%2 = bitcast i8 %__U to <8 x i1>
Show All 35 Lines	entry:
%5 = bitcast <8 x i1> %4 to i8		%5 = bitcast <8 x i1> %4 to i8
ret i8 %5		ret i8 %5
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define zeroext i8 @TEST_mm256_mask_test_epi32_mask(i8 %__U, <4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {		define zeroext i8 @TEST_mm256_mask_test_epi32_mask(i8 %__U, <4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {
; X86_64-LABEL: TEST_mm256_mask_test_epi32_mask:		; X86_64-LABEL: TEST_mm256_mask_test_epi32_mask:
; X86_64: # %bb.0: # %entry		; X86_64: # %bb.0: # %entry
; X86_64-NEXT: vptestmd %ymm0, %ymm1, %k0		; X86_64-NEXT: vpand %ymm0, %ymm1, %ymm0
		; X86_64-NEXT: vptestmd %ymm0, %ymm0, %k0
; X86_64-NEXT: kmovw %k0, %eax		; X86_64-NEXT: kmovw %k0, %eax
; X86_64-NEXT: andb %dil, %al		; X86_64-NEXT: andb %dil, %al
; X86_64-NEXT: # kill: def $al killed $al killed $eax		; X86_64-NEXT: # kill: def $al killed $al killed $eax
; X86_64-NEXT: vzeroupper		; X86_64-NEXT: vzeroupper
; X86_64-NEXT: retq		; X86_64-NEXT: retq
;		;
; I386-LABEL: TEST_mm256_mask_test_epi32_mask:		; I386-LABEL: TEST_mm256_mask_test_epi32_mask:
; I386: # %bb.0: # %entry		; I386: # %bb.0: # %entry
; I386-NEXT: vptestmd %ymm0, %ymm1, %k0		; I386-NEXT: vpand %ymm0, %ymm1, %ymm0
		; I386-NEXT: vptestmd %ymm0, %ymm0, %k0
; I386-NEXT: kmovw %k0, %eax		; I386-NEXT: kmovw %k0, %eax
; I386-NEXT: andb {{[0-9]+}}(%esp), %al		; I386-NEXT: andb {{[0-9]+}}(%esp), %al
; I386-NEXT: # kill: def $al killed $al killed $eax		; I386-NEXT: # kill: def $al killed $al killed $eax
; I386-NEXT: vzeroupper		; I386-NEXT: vzeroupper
; I386-NEXT: retl		; I386-NEXT: retl
entry:		entry:
%and.i.i = and <4 x i64> %__B, %__A		%and.i.i = and <4 x i64> %__B, %__A
%0 = bitcast <4 x i64> %and.i.i to <8 x i32>		%0 = bitcast <4 x i64> %and.i.i to <8 x i32>
Show All 26 Lines	entry:
%2 = bitcast <8 x i1> %1 to i8		%2 = bitcast <8 x i1> %1 to i8
ret i8 %2		ret i8 %2
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define zeroext i8 @TEST_mm_testn_epi32_mask(<2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {		define zeroext i8 @TEST_mm_testn_epi32_mask(<2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {
; X86_64-LABEL: TEST_mm_testn_epi32_mask:		; X86_64-LABEL: TEST_mm_testn_epi32_mask:
; X86_64: # %bb.0: # %entry		; X86_64: # %bb.0: # %entry
; X86_64-NEXT: vptestnmd %xmm0, %xmm1, %k0		; X86_64-NEXT: vpand %xmm0, %xmm1, %xmm0
		; X86_64-NEXT: vptestnmd %xmm0, %xmm0, %k0
; X86_64-NEXT: kmovw %k0, %eax		; X86_64-NEXT: kmovw %k0, %eax
; X86_64-NEXT: # kill: def $al killed $al killed $eax		; X86_64-NEXT: # kill: def $al killed $al killed $eax
; X86_64-NEXT: retq		; X86_64-NEXT: retq
;		;
; I386-LABEL: TEST_mm_testn_epi32_mask:		; I386-LABEL: TEST_mm_testn_epi32_mask:
; I386: # %bb.0: # %entry		; I386: # %bb.0: # %entry
; I386-NEXT: vptestnmd %xmm0, %xmm1, %k0		; I386-NEXT: vpand %xmm0, %xmm1, %xmm0
		; I386-NEXT: vptestnmd %xmm0, %xmm0, %k0
; I386-NEXT: kmovw %k0, %eax		; I386-NEXT: kmovw %k0, %eax
; I386-NEXT: # kill: def $al killed $al killed $eax		; I386-NEXT: # kill: def $al killed $al killed $eax
; I386-NEXT: retl		; I386-NEXT: retl
entry:		entry:
%and.i.i = and <2 x i64> %__B, %__A		%and.i.i = and <2 x i64> %__B, %__A
%0 = bitcast <2 x i64> %and.i.i to <4 x i32>		%0 = bitcast <2 x i64> %and.i.i to <4 x i32>
%1 = icmp eq <4 x i32> %0, zeroinitializer		%1 = icmp eq <4 x i32> %0, zeroinitializer
%2 = shufflevector <4 x i1> %1, <4 x i1> zeroinitializer, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>		%2 = shufflevector <4 x i1> %1, <4 x i1> zeroinitializer, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
Show All 25 Lines	entry:
%2 = bitcast <8 x i1> %1 to i8		%2 = bitcast <8 x i1> %1 to i8
ret i8 %2		ret i8 %2
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define zeroext i8 @TEST_mm256_testn_epi32_mask(<4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {		define zeroext i8 @TEST_mm256_testn_epi32_mask(<4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {
; X86_64-LABEL: TEST_mm256_testn_epi32_mask:		; X86_64-LABEL: TEST_mm256_testn_epi32_mask:
; X86_64: # %bb.0: # %entry		; X86_64: # %bb.0: # %entry
; X86_64-NEXT: vptestnmd %ymm0, %ymm1, %k0		; X86_64-NEXT: vpand %ymm0, %ymm1, %ymm0
		; X86_64-NEXT: vptestnmd %ymm0, %ymm0, %k0
; X86_64-NEXT: kmovw %k0, %eax		; X86_64-NEXT: kmovw %k0, %eax
; X86_64-NEXT: # kill: def $al killed $al killed $eax		; X86_64-NEXT: # kill: def $al killed $al killed $eax
; X86_64-NEXT: vzeroupper		; X86_64-NEXT: vzeroupper
; X86_64-NEXT: retq		; X86_64-NEXT: retq
;		;
; I386-LABEL: TEST_mm256_testn_epi32_mask:		; I386-LABEL: TEST_mm256_testn_epi32_mask:
; I386: # %bb.0: # %entry		; I386: # %bb.0: # %entry
; I386-NEXT: vptestnmd %ymm0, %ymm1, %k0		; I386-NEXT: vpand %ymm0, %ymm1, %ymm0
		; I386-NEXT: vptestnmd %ymm0, %ymm0, %k0
; I386-NEXT: kmovw %k0, %eax		; I386-NEXT: kmovw %k0, %eax
; I386-NEXT: # kill: def $al killed $al killed $eax		; I386-NEXT: # kill: def $al killed $al killed $eax
; I386-NEXT: vzeroupper		; I386-NEXT: vzeroupper
; I386-NEXT: retl		; I386-NEXT: retl
entry:		entry:
%and.i.i = and <4 x i64> %__B, %__A		%and.i.i = and <4 x i64> %__B, %__A
%0 = bitcast <4 x i64> %and.i.i to <8 x i32>		%0 = bitcast <4 x i64> %and.i.i to <8 x i32>
%1 = icmp eq <8 x i32> %0, zeroinitializer		%1 = icmp eq <8 x i32> %0, zeroinitializer
Show All 29 Lines	entry:
%5 = bitcast <8 x i1> %4 to i8		%5 = bitcast <8 x i1> %4 to i8
ret i8 %5		ret i8 %5
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define zeroext i8 @TEST_mm_mask_testn_epi32_mask(i8 %__U, <2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {		define zeroext i8 @TEST_mm_mask_testn_epi32_mask(i8 %__U, <2 x i64> %__A, <2 x i64> %__B) local_unnamed_addr #0 {
; X86_64-LABEL: TEST_mm_mask_testn_epi32_mask:		; X86_64-LABEL: TEST_mm_mask_testn_epi32_mask:
; X86_64: # %bb.0: # %entry		; X86_64: # %bb.0: # %entry
		; X86_64-NEXT: vpand %xmm0, %xmm1, %xmm0
; X86_64-NEXT: kmovw %edi, %k1		; X86_64-NEXT: kmovw %edi, %k1
; X86_64-NEXT: vptestnmd %xmm0, %xmm1, %k0 {%k1}		; X86_64-NEXT: vptestnmd %xmm0, %xmm0, %k0 {%k1}
; X86_64-NEXT: kmovw %k0, %eax		; X86_64-NEXT: kmovw %k0, %eax
; X86_64-NEXT: # kill: def $al killed $al killed $eax		; X86_64-NEXT: # kill: def $al killed $al killed $eax
; X86_64-NEXT: retq		; X86_64-NEXT: retq
;		;
; I386-LABEL: TEST_mm_mask_testn_epi32_mask:		; I386-LABEL: TEST_mm_mask_testn_epi32_mask:
; I386: # %bb.0: # %entry		; I386: # %bb.0: # %entry
		; I386-NEXT: vpand %xmm0, %xmm1, %xmm0
; I386-NEXT: movzbl {{[0-9]+}}(%esp), %eax		; I386-NEXT: movzbl {{[0-9]+}}(%esp), %eax
; I386-NEXT: kmovw %eax, %k1		; I386-NEXT: kmovw %eax, %k1
; I386-NEXT: vptestnmd %xmm0, %xmm1, %k0 {%k1}		; I386-NEXT: vptestnmd %xmm0, %xmm0, %k0 {%k1}
; I386-NEXT: kmovw %k0, %eax		; I386-NEXT: kmovw %k0, %eax
; I386-NEXT: # kill: def $al killed $al killed $eax		; I386-NEXT: # kill: def $al killed $al killed $eax
; I386-NEXT: retl		; I386-NEXT: retl
entry:		entry:
%and.i.i = and <2 x i64> %__B, %__A		%and.i.i = and <2 x i64> %__B, %__A
%0 = bitcast <2 x i64> %and.i.i to <4 x i32>		%0 = bitcast <2 x i64> %and.i.i to <4 x i32>
%1 = icmp eq <4 x i32> %0, zeroinitializer		%1 = icmp eq <4 x i32> %0, zeroinitializer
%2 = bitcast i8 %__U to <8 x i1>		%2 = bitcast i8 %__U to <8 x i1>
Show All 35 Lines	entry:
%5 = bitcast <8 x i1> %4 to i8		%5 = bitcast <8 x i1> %4 to i8
ret i8 %5		ret i8 %5
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define zeroext i8 @TEST_mm256_mask_testn_epi32_mask(i8 %__U, <4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {		define zeroext i8 @TEST_mm256_mask_testn_epi32_mask(i8 %__U, <4 x i64> %__A, <4 x i64> %__B) local_unnamed_addr #0 {
; X86_64-LABEL: TEST_mm256_mask_testn_epi32_mask:		; X86_64-LABEL: TEST_mm256_mask_testn_epi32_mask:
; X86_64: # %bb.0: # %entry		; X86_64: # %bb.0: # %entry
; X86_64-NEXT: vptestnmd %ymm0, %ymm1, %k0		; X86_64-NEXT: vpand %ymm0, %ymm1, %ymm0
		; X86_64-NEXT: vptestnmd %ymm0, %ymm0, %k0
; X86_64-NEXT: kmovw %k0, %eax		; X86_64-NEXT: kmovw %k0, %eax
; X86_64-NEXT: andb %dil, %al		; X86_64-NEXT: andb %dil, %al
; X86_64-NEXT: # kill: def $al killed $al killed $eax		; X86_64-NEXT: # kill: def $al killed $al killed $eax
; X86_64-NEXT: vzeroupper		; X86_64-NEXT: vzeroupper
; X86_64-NEXT: retq		; X86_64-NEXT: retq
;		;
; I386-LABEL: TEST_mm256_mask_testn_epi32_mask:		; I386-LABEL: TEST_mm256_mask_testn_epi32_mask:
; I386: # %bb.0: # %entry		; I386: # %bb.0: # %entry
; I386-NEXT: vptestnmd %ymm0, %ymm1, %k0		; I386-NEXT: vpand %ymm0, %ymm1, %ymm0
		; I386-NEXT: vptestnmd %ymm0, %ymm0, %k0
; I386-NEXT: kmovw %k0, %eax		; I386-NEXT: kmovw %k0, %eax
; I386-NEXT: andb {{[0-9]+}}(%esp), %al		; I386-NEXT: andb {{[0-9]+}}(%esp), %al
; I386-NEXT: # kill: def $al killed $al killed $eax		; I386-NEXT: # kill: def $al killed $al killed $eax
; I386-NEXT: vzeroupper		; I386-NEXT: vzeroupper
; I386-NEXT: retl		; I386-NEXT: retl
entry:		entry:
%and.i.i = and <4 x i64> %__B, %__A		%and.i.i = and <4 x i64> %__B, %__A
%0 = bitcast <4 x i64> %and.i.i to <8 x i32>		%0 = bitcast <4 x i64> %and.i.i to <8 x i32>
%1 = icmp eq <8 x i32> %0, zeroinitializer		%1 = icmp eq <8 x i32> %0, zeroinitializer
%2 = bitcast i8 %__U to <8 x i1>		%2 = bitcast i8 %__U to <8 x i1>
%3 = and <8 x i1> %1, %2		%3 = and <8 x i1> %1, %2
%4 = bitcast <8 x i1> %3 to i8		%4 = bitcast <8 x i1> %3 to i8
ret i8 %4		ret i8 %4
}		}

test/CodeGen/X86/bitcast-int-to-vector-bool-sext.ll

	Show First 20 Lines • Show All 667 Lines • ▼ Show 20 Lines
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovq %rdi, %xmm0			; AVX1-NEXT: vmovq %rdi, %xmm0
	; AVX1-NEXT: vpunpcklbw {{.*#+}} xmm1 = xmm0[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]			; AVX1-NEXT: vpunpcklbw {{.*#+}} xmm1 = xmm0[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
	; AVX1-NEXT: vpshuflw {{.*#+}} xmm0 = xmm1[0,0,1,1,4,5,6,7]			; AVX1-NEXT: vpshuflw {{.*#+}} xmm0 = xmm1[0,0,1,1,4,5,6,7]
	; AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,0,1,1]			; AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,0,1,1]
	; AVX1-NEXT: vpshuflw {{.*#+}} xmm2 = xmm1[2,2,3,3,4,5,6,7]			; AVX1-NEXT: vpshuflw {{.*#+}} xmm2 = xmm1[2,2,3,3,4,5,6,7]
	; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm2[0,0,1,1]			; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm2[0,0,1,1]
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: vmovaps {{.*#+}} ymm2 = [1,2,4,8,16,32,64,128,1,2,4,8,16,32,64,128,1,2,4,8,16,32,64,128,1,2,4,8,16,32,64,128]			; AVX1-NEXT: vbroadcastsd {{.*#+}} ymm2 = [-1.7939930131212661E-307,-1.7939930131212661E-307,-1.7939930131212661E-307,-1.7939930131212661E-307]
	; AVX1-NEXT: vandps %ymm2, %ymm0, %ymm0			; AVX1-NEXT: vandps %ymm2, %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX1-NEXT: vpcmpeqb %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqb %xmm4, %xmm3, %xmm3
	; AVX1-NEXT: vpcmpeqd %xmm5, %xmm5, %xmm5			; AVX1-NEXT: vpcmpeqd %xmm5, %xmm5, %xmm5
	; AVX1-NEXT: vpxor %xmm5, %xmm3, %xmm3			; AVX1-NEXT: vpxor %xmm5, %xmm3, %xmm3
	; AVX1-NEXT: vpcmpeqb %xmm4, %xmm0, %xmm0			; AVX1-NEXT: vpcmpeqb %xmm4, %xmm0, %xmm0
	; AVX1-NEXT: vpxor %xmm5, %xmm0, %xmm0			; AVX1-NEXT: vpxor %xmm5, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 62 Lines • Show Last 20 Lines

test/CodeGen/X86/bitcast-int-to-vector-bool-zext.ll

	Show First 20 Lines • Show All 857 Lines • ▼ Show 20 Lines
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovq %rdi, %xmm0			; AVX1-NEXT: vmovq %rdi, %xmm0
	; AVX1-NEXT: vpunpcklbw {{.*#+}} xmm1 = xmm0[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]			; AVX1-NEXT: vpunpcklbw {{.*#+}} xmm1 = xmm0[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
	; AVX1-NEXT: vpshuflw {{.*#+}} xmm0 = xmm1[0,0,1,1,4,5,6,7]			; AVX1-NEXT: vpshuflw {{.*#+}} xmm0 = xmm1[0,0,1,1,4,5,6,7]
	; AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,0,1,1]			; AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,0,1,1]
	; AVX1-NEXT: vpshuflw {{.*#+}} xmm2 = xmm1[2,2,3,3,4,5,6,7]			; AVX1-NEXT: vpshuflw {{.*#+}} xmm2 = xmm1[2,2,3,3,4,5,6,7]
	; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm2[0,0,1,1]			; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm2[0,0,1,1]
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: vmovaps {{.*#+}} ymm2 = [1,2,4,8,16,32,64,128,1,2,4,8,16,32,64,128,1,2,4,8,16,32,64,128,1,2,4,8,16,32,64,128]			; AVX1-NEXT: vbroadcastsd {{.*#+}} ymm2 = [-1.7939930131212661E-307,-1.7939930131212661E-307,-1.7939930131212661E-307,-1.7939930131212661E-307]
	; AVX1-NEXT: vandps %ymm2, %ymm0, %ymm0			; AVX1-NEXT: vandps %ymm2, %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX1-NEXT: vpcmpeqb %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqb %xmm4, %xmm3, %xmm3
	; AVX1-NEXT: vpcmpeqd %xmm5, %xmm5, %xmm5			; AVX1-NEXT: vpcmpeqd %xmm5, %xmm5, %xmm5
	; AVX1-NEXT: vpxor %xmm5, %xmm3, %xmm3			; AVX1-NEXT: vpxor %xmm5, %xmm3, %xmm3
	; AVX1-NEXT: vpsrlw $7, %xmm3, %xmm3			; AVX1-NEXT: vpsrlw $7, %xmm3, %xmm3
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]
	▲ Show 20 Lines • Show All 106 Lines • Show Last 20 Lines

test/CodeGen/X86/bitcast-setcc-128.ll

	Show First 20 Lines • Show All 702 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: orq %rcx, %rax			; AVX1-NEXT: orq %rcx, %rax
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: v16i8_widened_with_ones:			; AVX2-LABEL: v16i8_widened_with_ones:
	; AVX2: # %bb.0: # %entry			; AVX2: # %bb.0: # %entry
	; AVX2-NEXT: vpcmpeqb %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpcmpeqb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vinserti128 $1, {{.*}}(%rip), %ymm0, %ymm0			; AVX2-NEXT: vinserti128 $1, {{.*}}(%rip), %ymm0, %ymm0
	; AVX2-NEXT: vpsllw $7, %ymm0, %ymm0			; AVX2-NEXT: vpsllw $7, %ymm0, %ymm0
	; AVX2-NEXT: vpand {{.*}}(%rip), %ymm0, %ymm0
	; AVX2-NEXT: vpmovmskb %ymm0, %ecx			; AVX2-NEXT: vpmovmskb %ymm0, %ecx
	; AVX2-NEXT: movabsq $-4294967296, %rax # imm = 0xFFFFFFFF00000000			; AVX2-NEXT: movabsq $-4294967296, %rax # imm = 0xFFFFFFFF00000000
	; AVX2-NEXT: orq %rcx, %rax			; AVX2-NEXT: orq %rcx, %rax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: v16i8_widened_with_ones:			; AVX512F-LABEL: v16i8_widened_with_ones:
	; AVX512F: # %bb.0: # %entry			; AVX512F: # %bb.0: # %entry
	Show All 25 Lines

test/CodeGen/X86/broadcast-elm-cross-splat-vec.ll

Show First 20 Lines • Show All 353 Lines • ▼ Show 20 Lines	; AVX512BW-64-NEXT: retq
ret <64 x i8> %res2		ret <64 x i8> %res2
}		}


define <64 x i8> @f64i8_i32(<64 x i8> %a) {		define <64 x i8> @f64i8_i32(<64 x i8> %a) {
; AVX-LABEL: f64i8_i32:		; AVX-LABEL: f64i8_i32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX-NEXT: vextractf128 $1, %ymm1, %xmm2
; AVX-NEXT: vbroadcastss {{.*#+}} xmm3 = [3.82047143E-37,3.82047143E-37,3.82047143E-37,3.82047143E-37]		; AVX-NEXT: vmovd {{.*#+}} xmm3 = mem[0],zero,zero,zero
		; AVX-NEXT: vpshufd {{.*#+}} xmm3 = xmm3[0,0,0,0]
; AVX-NEXT: vpaddb %xmm3, %xmm2, %xmm2		; AVX-NEXT: vpaddb %xmm3, %xmm2, %xmm2
; AVX-NEXT: vpaddb %xmm3, %xmm1, %xmm1		; AVX-NEXT: vpaddb %xmm3, %xmm1, %xmm1
; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1		; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX-NEXT: vpaddb %xmm3, %xmm2, %xmm2		; AVX-NEXT: vpaddb %xmm3, %xmm2, %xmm2
; AVX-NEXT: vpaddb %xmm3, %xmm0, %xmm0		; AVX-NEXT: vpaddb %xmm3, %xmm0, %xmm0
; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX-NEXT: vmovaps {{.*#+}} ymm2 = [0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3]		; AVX-NEXT: vinsertf128 $1, %xmm3, %ymm3, %ymm2
; AVX-NEXT: vandps %ymm2, %ymm0, %ymm0		; AVX-NEXT: vandps %ymm2, %ymm0, %ymm0
; AVX-NEXT: vandps %ymm2, %ymm1, %ymm1		; AVX-NEXT: vandps %ymm2, %ymm1, %ymm1
; AVX-NEXT: retl		; AVX-NEXT: retl
;		;
; NO-AVX512BW-LABEL: f64i8_i32:		; NO-AVX512BW-LABEL: f64i8_i32:
; NO-AVX512BW: # %bb.0:		; NO-AVX512BW: # %bb.0:
; NO-AVX512BW-NEXT: vpbroadcastd {{.*#+}} ymm2 = [50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976]		; NO-AVX512BW-NEXT: vpbroadcastd {{.*#+}} ymm2 = [50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976]
; NO-AVX512BW-NEXT: vpaddb %ymm2, %ymm1, %ymm1		; NO-AVX512BW-NEXT: vpaddb %ymm2, %ymm1, %ymm1
; NO-AVX512BW-NEXT: vpaddb %ymm2, %ymm0, %ymm0		; NO-AVX512BW-NEXT: vpaddb %ymm2, %ymm0, %ymm0
; NO-AVX512BW-NEXT: vpand %ymm2, %ymm0, %ymm0		; NO-AVX512BW-NEXT: vpand %ymm2, %ymm0, %ymm0
; NO-AVX512BW-NEXT: vpand %ymm2, %ymm1, %ymm1		; NO-AVX512BW-NEXT: vpand %ymm2, %ymm1, %ymm1
; NO-AVX512BW-NEXT: retl		; NO-AVX512BW-NEXT: retl
;		;
; AVX512BW-LABEL: f64i8_i32:		; AVX512BW-LABEL: f64i8_i32:
; AVX512BW: # %bb.0:		; AVX512BW: # %bb.0:
; AVX512BW-NEXT: vpbroadcastd {{.*#+}} zmm1 = [50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976]		; AVX512BW-NEXT: vpbroadcastd {{.*#+}} zmm1 = [50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976]
; AVX512BW-NEXT: vpaddb %zmm1, %zmm0, %zmm0		; AVX512BW-NEXT: vpaddb %zmm1, %zmm0, %zmm0
; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm0		; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm0
; AVX512BW-NEXT: retl		; AVX512BW-NEXT: retl
;		;
; AVX-64-LABEL: f64i8_i32:		; AVX-64-LABEL: f64i8_i32:
; AVX-64: # %bb.0:		; AVX-64: # %bb.0:
; AVX-64-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX-64-NEXT: vextractf128 $1, %ymm1, %xmm2
; AVX-64-NEXT: vbroadcastss {{.*#+}} xmm3 = [3.82047143E-37,3.82047143E-37,3.82047143E-37,3.82047143E-37]		; AVX-64-NEXT: vmovd {{.*#+}} xmm3 = mem[0],zero,zero,zero
		; AVX-64-NEXT: vpshufd {{.*#+}} xmm3 = xmm3[0,0,0,0]
; AVX-64-NEXT: vpaddb %xmm3, %xmm2, %xmm2		; AVX-64-NEXT: vpaddb %xmm3, %xmm2, %xmm2
; AVX-64-NEXT: vpaddb %xmm3, %xmm1, %xmm1		; AVX-64-NEXT: vpaddb %xmm3, %xmm1, %xmm1
; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1		; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
; AVX-64-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX-64-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX-64-NEXT: vpaddb %xmm3, %xmm2, %xmm2		; AVX-64-NEXT: vpaddb %xmm3, %xmm2, %xmm2
; AVX-64-NEXT: vpaddb %xmm3, %xmm0, %xmm0		; AVX-64-NEXT: vpaddb %xmm3, %xmm0, %xmm0
; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX-64-NEXT: vmovaps {{.*#+}} ymm2 = [0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3]		; AVX-64-NEXT: vinsertf128 $1, %xmm3, %ymm3, %ymm2
; AVX-64-NEXT: vandps %ymm2, %ymm0, %ymm0		; AVX-64-NEXT: vandps %ymm2, %ymm0, %ymm0
; AVX-64-NEXT: vandps %ymm2, %ymm1, %ymm1		; AVX-64-NEXT: vandps %ymm2, %ymm1, %ymm1
; AVX-64-NEXT: retq		; AVX-64-NEXT: retq
;		;
; NO-AVX512BW-64-LABEL: f64i8_i32:		; NO-AVX512BW-64-LABEL: f64i8_i32:
; NO-AVX512BW-64: # %bb.0:		; NO-AVX512BW-64: # %bb.0:
; NO-AVX512BW-64-NEXT: vpbroadcastd {{.*#+}} ymm2 = [50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976]		; NO-AVX512BW-64-NEXT: vpbroadcastd {{.*#+}} ymm2 = [50462976,50462976,50462976,50462976,50462976,50462976,50462976,50462976]
; NO-AVX512BW-64-NEXT: vpaddb %ymm2, %ymm1, %ymm1		; NO-AVX512BW-64-NEXT: vpaddb %ymm2, %ymm1, %ymm1
Show All 13 Lines	; AVX512BW-64-NEXT: retq
ret <64 x i8> %res2		ret <64 x i8> %res2
}		}


define <64 x i8> @f64xi8_i64(<64 x i8> %a) {		define <64 x i8> @f64xi8_i64(<64 x i8> %a) {
; AVX-LABEL: f64xi8_i64:		; AVX-LABEL: f64xi8_i64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX-NEXT: vextractf128 $1, %ymm1, %xmm2
; AVX-NEXT: vmovddup {{.*#+}} xmm3 = [7.9499288951273625E-275,7.9499288951273625E-275]		; AVX-NEXT: vmovsd {{.*#+}} xmm3 = mem[0],zero
; AVX-NEXT: # xmm3 = mem[0,0]		; AVX-NEXT: vmovddup {{.*#+}} xmm3 = xmm3[0,0]
		craig.topperAuthorUnsubmitted Not Done Reply Inline Actions Here we have a 128-bit and a 256-bit broadcast going into isel. They both use the same load. But we don't have a broadcast f64->v4f64 instruction in AVX1 so isel emits a VMOVDDUP and an insert. This CSEs with the VMOVDDUP emitted for the f64->v2f64 broadcast. But it was too late to satisfy the one use check for the load folding. We probably need to split f64->v4f64 broadcasts during lowering/DAG combine instead of isel so it will CSE earlier. craig.topper: Here we have a 128-bit and a 256-bit broadcast going into isel. They both use the same load.
		RKSimonUnsubmitted Not Done Reply Inline Actions I can't find the PR covering this - please raise a bug if it doesn't already exist and add a TODO comment here referencing the PR. RKSimon: I can't find the PR covering this - please raise a bug if it doesn't already exist and add a…
; AVX-NEXT: vpaddb %xmm3, %xmm2, %xmm2		; AVX-NEXT: vpaddb %xmm3, %xmm2, %xmm2
; AVX-NEXT: vpaddb %xmm3, %xmm1, %xmm1		; AVX-NEXT: vpaddb %xmm3, %xmm1, %xmm1
; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1		; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX-NEXT: vpaddb %xmm3, %xmm2, %xmm2		; AVX-NEXT: vpaddb %xmm3, %xmm2, %xmm2
; AVX-NEXT: vpaddb %xmm3, %xmm0, %xmm0		; AVX-NEXT: vpaddb %xmm3, %xmm0, %xmm0
; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX-NEXT: vmovaps {{.*#+}} ymm2 = [0,1,2,3,4,5,6,7,0,1,2,3,4,5,6,7,0,1,2,3,4,5,6,7,0,1,2,3,4,5,6,7]		; AVX-NEXT: vinsertf128 $1, %xmm3, %ymm3, %ymm2
; AVX-NEXT: vandps %ymm2, %ymm0, %ymm0		; AVX-NEXT: vandps %ymm2, %ymm0, %ymm0
; AVX-NEXT: vandps %ymm2, %ymm1, %ymm1		; AVX-NEXT: vandps %ymm2, %ymm1, %ymm1
; AVX-NEXT: retl		; AVX-NEXT: retl
;		;
; NO-AVX512BW-LABEL: f64xi8_i64:		; NO-AVX512BW-LABEL: f64xi8_i64:
; NO-AVX512BW: # %bb.0:		; NO-AVX512BW: # %bb.0:
; NO-AVX512BW-NEXT: vpbroadcastq {{.*#+}} ymm2 = [7.9499288951273625E-275,7.9499288951273625E-275,7.9499288951273625E-275,7.9499288951273625E-275]		; NO-AVX512BW-NEXT: vpbroadcastq {{.*#+}} ymm2 = [7.9499288951273625E-275,7.9499288951273625E-275,7.9499288951273625E-275,7.9499288951273625E-275]
; NO-AVX512BW-NEXT: vpaddb %ymm2, %ymm1, %ymm1		; NO-AVX512BW-NEXT: vpaddb %ymm2, %ymm1, %ymm1
; NO-AVX512BW-NEXT: vpaddb %ymm2, %ymm0, %ymm0		; NO-AVX512BW-NEXT: vpaddb %ymm2, %ymm0, %ymm0
; NO-AVX512BW-NEXT: vpand %ymm2, %ymm0, %ymm0		; NO-AVX512BW-NEXT: vpand %ymm2, %ymm0, %ymm0
; NO-AVX512BW-NEXT: vpand %ymm2, %ymm1, %ymm1		; NO-AVX512BW-NEXT: vpand %ymm2, %ymm1, %ymm1
; NO-AVX512BW-NEXT: retl		; NO-AVX512BW-NEXT: retl
;		;
; AVX512BW-LABEL: f64xi8_i64:		; AVX512BW-LABEL: f64xi8_i64:
; AVX512BW: # %bb.0:		; AVX512BW: # %bb.0:
; AVX512BW-NEXT: vpbroadcastq {{.*#+}} zmm1 = [7.9499288951273625E-275,7.9499288951273625E-275,7.9499288951273625E-275,7.9499288951273625E-275,7.9499288951273625E-275,7.9499288951273625E-275,7.9499288951273625E-275,7.9499288951273625E-275]		; AVX512BW-NEXT: vpbroadcastq {{.*#+}} zmm1 = [7.9499288951273625E-275,7.9499288951273625E-275,7.9499288951273625E-275,7.9499288951273625E-275,7.9499288951273625E-275,7.9499288951273625E-275,7.9499288951273625E-275,7.9499288951273625E-275]
; AVX512BW-NEXT: vpaddb %zmm1, %zmm0, %zmm0		; AVX512BW-NEXT: vpaddb %zmm1, %zmm0, %zmm0
; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm0		; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm0
; AVX512BW-NEXT: retl		; AVX512BW-NEXT: retl
;		;
; AVX-64-LABEL: f64xi8_i64:		; AVX-64-LABEL: f64xi8_i64:
; AVX-64: # %bb.0:		; AVX-64: # %bb.0:
; AVX-64-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX-64-NEXT: vextractf128 $1, %ymm1, %xmm2
; AVX-64-NEXT: vmovddup {{.*#+}} xmm3 = [7.9499288951273625E-275,7.9499288951273625E-275]		; AVX-64-NEXT: vmovsd {{.*#+}} xmm3 = mem[0],zero
; AVX-64-NEXT: # xmm3 = mem[0,0]		; AVX-64-NEXT: vmovddup {{.*#+}} xmm3 = xmm3[0,0]
; AVX-64-NEXT: vpaddb %xmm3, %xmm2, %xmm2		; AVX-64-NEXT: vpaddb %xmm3, %xmm2, %xmm2
; AVX-64-NEXT: vpaddb %xmm3, %xmm1, %xmm1		; AVX-64-NEXT: vpaddb %xmm3, %xmm1, %xmm1
; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1		; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
; AVX-64-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX-64-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX-64-NEXT: vpaddb %xmm3, %xmm2, %xmm2		; AVX-64-NEXT: vpaddb %xmm3, %xmm2, %xmm2
; AVX-64-NEXT: vpaddb %xmm3, %xmm0, %xmm0		; AVX-64-NEXT: vpaddb %xmm3, %xmm0, %xmm0
; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX-64-NEXT: vmovaps {{.*#+}} ymm2 = [0,1,2,3,4,5,6,7,0,1,2,3,4,5,6,7,0,1,2,3,4,5,6,7,0,1,2,3,4,5,6,7]		; AVX-64-NEXT: vinsertf128 $1, %xmm3, %ymm3, %ymm2
; AVX-64-NEXT: vandps %ymm2, %ymm0, %ymm0		; AVX-64-NEXT: vandps %ymm2, %ymm0, %ymm0
; AVX-64-NEXT: vandps %ymm2, %ymm1, %ymm1		; AVX-64-NEXT: vandps %ymm2, %ymm1, %ymm1
; AVX-64-NEXT: retq		; AVX-64-NEXT: retq
;		;
; NO-AVX512BW-64-LABEL: f64xi8_i64:		; NO-AVX512BW-64-LABEL: f64xi8_i64:
; NO-AVX512BW-64: # %bb.0:		; NO-AVX512BW-64: # %bb.0:
; NO-AVX512BW-64-NEXT: vpbroadcastq {{.*#+}} ymm2 = [506097522914230528,506097522914230528,506097522914230528,506097522914230528]		; NO-AVX512BW-64-NEXT: vpbroadcastq {{.*#+}} ymm2 = [506097522914230528,506097522914230528,506097522914230528,506097522914230528]
; NO-AVX512BW-64-NEXT: vpaddb %ymm2, %ymm1, %ymm1		; NO-AVX512BW-64-NEXT: vpaddb %ymm2, %ymm1, %ymm1
Show All 21 Lines
; AVX-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15]		; AVX-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
; AVX-NEXT: vpaddb %xmm3, %xmm2, %xmm2		; AVX-NEXT: vpaddb %xmm3, %xmm2, %xmm2
; AVX-NEXT: vpaddb %xmm3, %xmm1, %xmm1		; AVX-NEXT: vpaddb %xmm3, %xmm1, %xmm1
; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1		; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX-NEXT: vpaddb %xmm3, %xmm2, %xmm2		; AVX-NEXT: vpaddb %xmm3, %xmm2, %xmm2
; AVX-NEXT: vpaddb %xmm3, %xmm0, %xmm0		; AVX-NEXT: vpaddb %xmm3, %xmm0, %xmm0
; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX-NEXT: vmovaps {{.*#+}} ymm2 = [0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15]		; AVX-NEXT: vinsertf128 $1, %xmm3, %ymm3, %ymm2
; AVX-NEXT: vandps %ymm2, %ymm0, %ymm0		; AVX-NEXT: vandps %ymm2, %ymm0, %ymm0
; AVX-NEXT: vandps %ymm2, %ymm1, %ymm1		; AVX-NEXT: vandps %ymm2, %ymm1, %ymm1
; AVX-NEXT: retl		; AVX-NEXT: retl
;		;
; NO-AVX512BW-LABEL: f64xi8_i128:		; NO-AVX512BW-LABEL: f64xi8_i128:
; NO-AVX512BW: # %bb.0:		; NO-AVX512BW: # %bb.0:
; NO-AVX512BW-NEXT: vbroadcasti128 {{.*#+}} ymm2 = [0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15]		; NO-AVX512BW-NEXT: vbroadcasti128 {{.*#+}} ymm2 = [0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
; NO-AVX512BW-NEXT: # ymm2 = mem[0,1,0,1]		; NO-AVX512BW-NEXT: # ymm2 = mem[0,1,0,1]
Show All 17 Lines
; AVX-64-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15]		; AVX-64-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
; AVX-64-NEXT: vpaddb %xmm3, %xmm2, %xmm2		; AVX-64-NEXT: vpaddb %xmm3, %xmm2, %xmm2
; AVX-64-NEXT: vpaddb %xmm3, %xmm1, %xmm1		; AVX-64-NEXT: vpaddb %xmm3, %xmm1, %xmm1
; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1		; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
; AVX-64-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX-64-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX-64-NEXT: vpaddb %xmm3, %xmm2, %xmm2		; AVX-64-NEXT: vpaddb %xmm3, %xmm2, %xmm2
; AVX-64-NEXT: vpaddb %xmm3, %xmm0, %xmm0		; AVX-64-NEXT: vpaddb %xmm3, %xmm0, %xmm0
; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX-64-NEXT: vmovaps {{.*#+}} ymm2 = [0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15]		; AVX-64-NEXT: vinsertf128 $1, %xmm3, %ymm3, %ymm2
; AVX-64-NEXT: vandps %ymm2, %ymm0, %ymm0		; AVX-64-NEXT: vandps %ymm2, %ymm0, %ymm0
; AVX-64-NEXT: vandps %ymm2, %ymm1, %ymm1		; AVX-64-NEXT: vandps %ymm2, %ymm1, %ymm1
; AVX-64-NEXT: retq		; AVX-64-NEXT: retq
;		;
; NO-AVX512BW-64-LABEL: f64xi8_i128:		; NO-AVX512BW-64-LABEL: f64xi8_i128:
; NO-AVX512BW-64: # %bb.0:		; NO-AVX512BW-64: # %bb.0:
; NO-AVX512BW-64-NEXT: vbroadcasti128 {{.*#+}} ymm2 = [0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15]		; NO-AVX512BW-64-NEXT: vbroadcasti128 {{.*#+}} ymm2 = [0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
; NO-AVX512BW-64-NEXT: # ymm2 = mem[0,1,0,1]		; NO-AVX512BW-64-NEXT: # ymm2 = mem[0,1,0,1]
▲ Show 20 Lines • Show All 284 Lines • ▼ Show 20 Lines	; ALL64-NEXT: retq
ret <16 x i16> %res2		ret <16 x i16> %res2
}		}


define <32 x i16> @f32xi16_i32(<32 x i16> %a) {		define <32 x i16> @f32xi16_i32(<32 x i16> %a) {
; AVX-LABEL: f32xi16_i32:		; AVX-LABEL: f32xi16_i32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX-NEXT: vextractf128 $1, %ymm1, %xmm2
; AVX-NEXT: vbroadcastss {{.*#+}} xmm3 = [9.18354962E-41,9.18354962E-41,9.18354962E-41,9.18354962E-41]		; AVX-NEXT: vmovd {{.*#+}} xmm3 = mem[0],zero,zero,zero
		; AVX-NEXT: vpshufd {{.*#+}} xmm3 = xmm3[0,0,0,0]
; AVX-NEXT: vpaddw %xmm3, %xmm2, %xmm2		; AVX-NEXT: vpaddw %xmm3, %xmm2, %xmm2
; AVX-NEXT: vpaddw %xmm3, %xmm1, %xmm1		; AVX-NEXT: vpaddw %xmm3, %xmm1, %xmm1
; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1		; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX-NEXT: vpaddw %xmm3, %xmm2, %xmm2		; AVX-NEXT: vpaddw %xmm3, %xmm2, %xmm2
; AVX-NEXT: vpaddw %xmm3, %xmm0, %xmm0		; AVX-NEXT: vpaddw %xmm3, %xmm0, %xmm0
; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX-NEXT: vmovaps {{.*#+}} ymm2 = [0,1,0,1,0,1,0,1,0,1,0,1,0,1,0,1]		; AVX-NEXT: vinsertf128 $1, %xmm3, %ymm3, %ymm2
; AVX-NEXT: vandps %ymm2, %ymm0, %ymm0		; AVX-NEXT: vandps %ymm2, %ymm0, %ymm0
; AVX-NEXT: vandps %ymm2, %ymm1, %ymm1		; AVX-NEXT: vandps %ymm2, %ymm1, %ymm1
; AVX-NEXT: retl		; AVX-NEXT: retl
;		;
; NO-AVX512BW-LABEL: f32xi16_i32:		; NO-AVX512BW-LABEL: f32xi16_i32:
; NO-AVX512BW: # %bb.0:		; NO-AVX512BW: # %bb.0:
; NO-AVX512BW-NEXT: vpbroadcastd {{.*#+}} ymm2 = [65536,65536,65536,65536,65536,65536,65536,65536]		; NO-AVX512BW-NEXT: vpbroadcastd {{.*#+}} ymm2 = [65536,65536,65536,65536,65536,65536,65536,65536]
; NO-AVX512BW-NEXT: vpaddw %ymm2, %ymm1, %ymm1		; NO-AVX512BW-NEXT: vpaddw %ymm2, %ymm1, %ymm1
; NO-AVX512BW-NEXT: vpaddw %ymm2, %ymm0, %ymm0		; NO-AVX512BW-NEXT: vpaddw %ymm2, %ymm0, %ymm0
; NO-AVX512BW-NEXT: vpand %ymm2, %ymm0, %ymm0		; NO-AVX512BW-NEXT: vpand %ymm2, %ymm0, %ymm0
; NO-AVX512BW-NEXT: vpand %ymm2, %ymm1, %ymm1		; NO-AVX512BW-NEXT: vpand %ymm2, %ymm1, %ymm1
; NO-AVX512BW-NEXT: retl		; NO-AVX512BW-NEXT: retl
;		;
; AVX512BW-LABEL: f32xi16_i32:		; AVX512BW-LABEL: f32xi16_i32:
; AVX512BW: # %bb.0:		; AVX512BW: # %bb.0:
; AVX512BW-NEXT: vpbroadcastd {{.*#+}} zmm1 = [65536,65536,65536,65536,65536,65536,65536,65536,65536,65536,65536,65536,65536,65536,65536,65536]		; AVX512BW-NEXT: vpbroadcastd {{.*#+}} zmm1 = [65536,65536,65536,65536,65536,65536,65536,65536,65536,65536,65536,65536,65536,65536,65536,65536]
; AVX512BW-NEXT: vpaddw %zmm1, %zmm0, %zmm0		; AVX512BW-NEXT: vpaddw %zmm1, %zmm0, %zmm0
; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm0		; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm0
; AVX512BW-NEXT: retl		; AVX512BW-NEXT: retl
;		;
; AVX-64-LABEL: f32xi16_i32:		; AVX-64-LABEL: f32xi16_i32:
; AVX-64: # %bb.0:		; AVX-64: # %bb.0:
; AVX-64-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX-64-NEXT: vextractf128 $1, %ymm1, %xmm2
; AVX-64-NEXT: vbroadcastss {{.*#+}} xmm3 = [9.18354962E-41,9.18354962E-41,9.18354962E-41,9.18354962E-41]		; AVX-64-NEXT: vmovd {{.*#+}} xmm3 = mem[0],zero,zero,zero
		; AVX-64-NEXT: vpshufd {{.*#+}} xmm3 = xmm3[0,0,0,0]
; AVX-64-NEXT: vpaddw %xmm3, %xmm2, %xmm2		; AVX-64-NEXT: vpaddw %xmm3, %xmm2, %xmm2
; AVX-64-NEXT: vpaddw %xmm3, %xmm1, %xmm1		; AVX-64-NEXT: vpaddw %xmm3, %xmm1, %xmm1
; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1		; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
; AVX-64-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX-64-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX-64-NEXT: vpaddw %xmm3, %xmm2, %xmm2		; AVX-64-NEXT: vpaddw %xmm3, %xmm2, %xmm2
; AVX-64-NEXT: vpaddw %xmm3, %xmm0, %xmm0		; AVX-64-NEXT: vpaddw %xmm3, %xmm0, %xmm0
; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX-64-NEXT: vmovaps {{.*#+}} ymm2 = [0,1,0,1,0,1,0,1,0,1,0,1,0,1,0,1]		; AVX-64-NEXT: vinsertf128 $1, %xmm3, %ymm3, %ymm2
; AVX-64-NEXT: vandps %ymm2, %ymm0, %ymm0		; AVX-64-NEXT: vandps %ymm2, %ymm0, %ymm0
; AVX-64-NEXT: vandps %ymm2, %ymm1, %ymm1		; AVX-64-NEXT: vandps %ymm2, %ymm1, %ymm1
; AVX-64-NEXT: retq		; AVX-64-NEXT: retq
;		;
; NO-AVX512BW-64-LABEL: f32xi16_i32:		; NO-AVX512BW-64-LABEL: f32xi16_i32:
; NO-AVX512BW-64: # %bb.0:		; NO-AVX512BW-64: # %bb.0:
; NO-AVX512BW-64-NEXT: vpbroadcastd {{.*#+}} ymm2 = [65536,65536,65536,65536,65536,65536,65536,65536]		; NO-AVX512BW-64-NEXT: vpbroadcastd {{.*#+}} ymm2 = [65536,65536,65536,65536,65536,65536,65536,65536]
; NO-AVX512BW-64-NEXT: vpaddw %ymm2, %ymm1, %ymm1		; NO-AVX512BW-64-NEXT: vpaddw %ymm2, %ymm1, %ymm1
Show All 13 Lines	; AVX512BW-64-NEXT: retq
ret <32 x i16> %res2		ret <32 x i16> %res2
}		}


define <32 x i16> @f32xi16_i64(<32 x i16> %a) {		define <32 x i16> @f32xi16_i64(<32 x i16> %a) {
; AVX-LABEL: f32xi16_i64:		; AVX-LABEL: f32xi16_i64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX-NEXT: vextractf128 $1, %ymm1, %xmm2
; AVX-NEXT: vmovddup {{.*#+}} xmm3 = [4.1720559249406128E-309,4.1720559249406128E-309]		; AVX-NEXT: vmovsd {{.*#+}} xmm3 = mem[0],zero
; AVX-NEXT: # xmm3 = mem[0,0]		; AVX-NEXT: vmovddup {{.*#+}} xmm3 = xmm3[0,0]
; AVX-NEXT: vpaddw %xmm3, %xmm2, %xmm2		; AVX-NEXT: vpaddw %xmm3, %xmm2, %xmm2
; AVX-NEXT: vpaddw %xmm3, %xmm1, %xmm1		; AVX-NEXT: vpaddw %xmm3, %xmm1, %xmm1
; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1		; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX-NEXT: vpaddw %xmm3, %xmm2, %xmm2		; AVX-NEXT: vpaddw %xmm3, %xmm2, %xmm2
; AVX-NEXT: vpaddw %xmm3, %xmm0, %xmm0		; AVX-NEXT: vpaddw %xmm3, %xmm0, %xmm0
; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX-NEXT: vmovaps {{.*#+}} ymm2 = [0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3]		; AVX-NEXT: vinsertf128 $1, %xmm3, %ymm3, %ymm2
; AVX-NEXT: vandps %ymm2, %ymm0, %ymm0		; AVX-NEXT: vandps %ymm2, %ymm0, %ymm0
; AVX-NEXT: vandps %ymm2, %ymm1, %ymm1		; AVX-NEXT: vandps %ymm2, %ymm1, %ymm1
; AVX-NEXT: retl		; AVX-NEXT: retl
;		;
; NO-AVX512BW-LABEL: f32xi16_i64:		; NO-AVX512BW-LABEL: f32xi16_i64:
; NO-AVX512BW: # %bb.0:		; NO-AVX512BW: # %bb.0:
; NO-AVX512BW-NEXT: vpbroadcastq {{.*#+}} ymm2 = [4.1720559249406128E-309,4.1720559249406128E-309,4.1720559249406128E-309,4.1720559249406128E-309]		; NO-AVX512BW-NEXT: vpbroadcastq {{.*#+}} ymm2 = [4.1720559249406128E-309,4.1720559249406128E-309,4.1720559249406128E-309,4.1720559249406128E-309]
; NO-AVX512BW-NEXT: vpaddw %ymm2, %ymm1, %ymm1		; NO-AVX512BW-NEXT: vpaddw %ymm2, %ymm1, %ymm1
; NO-AVX512BW-NEXT: vpaddw %ymm2, %ymm0, %ymm0		; NO-AVX512BW-NEXT: vpaddw %ymm2, %ymm0, %ymm0
; NO-AVX512BW-NEXT: vpand %ymm2, %ymm0, %ymm0		; NO-AVX512BW-NEXT: vpand %ymm2, %ymm0, %ymm0
; NO-AVX512BW-NEXT: vpand %ymm2, %ymm1, %ymm1		; NO-AVX512BW-NEXT: vpand %ymm2, %ymm1, %ymm1
; NO-AVX512BW-NEXT: retl		; NO-AVX512BW-NEXT: retl
;		;
; AVX512BW-LABEL: f32xi16_i64:		; AVX512BW-LABEL: f32xi16_i64:
; AVX512BW: # %bb.0:		; AVX512BW: # %bb.0:
; AVX512BW-NEXT: vpbroadcastq {{.*#+}} zmm1 = [4.1720559249406128E-309,4.1720559249406128E-309,4.1720559249406128E-309,4.1720559249406128E-309,4.1720559249406128E-309,4.1720559249406128E-309,4.1720559249406128E-309,4.1720559249406128E-309]		; AVX512BW-NEXT: vpbroadcastq {{.*#+}} zmm1 = [4.1720559249406128E-309,4.1720559249406128E-309,4.1720559249406128E-309,4.1720559249406128E-309,4.1720559249406128E-309,4.1720559249406128E-309,4.1720559249406128E-309,4.1720559249406128E-309]
; AVX512BW-NEXT: vpaddw %zmm1, %zmm0, %zmm0		; AVX512BW-NEXT: vpaddw %zmm1, %zmm0, %zmm0
; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm0		; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm0
; AVX512BW-NEXT: retl		; AVX512BW-NEXT: retl
;		;
; AVX-64-LABEL: f32xi16_i64:		; AVX-64-LABEL: f32xi16_i64:
; AVX-64: # %bb.0:		; AVX-64: # %bb.0:
; AVX-64-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX-64-NEXT: vextractf128 $1, %ymm1, %xmm2
; AVX-64-NEXT: vmovddup {{.*#+}} xmm3 = [4.1720559249406128E-309,4.1720559249406128E-309]		; AVX-64-NEXT: vmovsd {{.*#+}} xmm3 = mem[0],zero
; AVX-64-NEXT: # xmm3 = mem[0,0]		; AVX-64-NEXT: vmovddup {{.*#+}} xmm3 = xmm3[0,0]
; AVX-64-NEXT: vpaddw %xmm3, %xmm2, %xmm2		; AVX-64-NEXT: vpaddw %xmm3, %xmm2, %xmm2
; AVX-64-NEXT: vpaddw %xmm3, %xmm1, %xmm1		; AVX-64-NEXT: vpaddw %xmm3, %xmm1, %xmm1
; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1		; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
; AVX-64-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX-64-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX-64-NEXT: vpaddw %xmm3, %xmm2, %xmm2		; AVX-64-NEXT: vpaddw %xmm3, %xmm2, %xmm2
; AVX-64-NEXT: vpaddw %xmm3, %xmm0, %xmm0		; AVX-64-NEXT: vpaddw %xmm3, %xmm0, %xmm0
; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX-64-NEXT: vmovaps {{.*#+}} ymm2 = [0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3]		; AVX-64-NEXT: vinsertf128 $1, %xmm3, %ymm3, %ymm2
; AVX-64-NEXT: vandps %ymm2, %ymm0, %ymm0		; AVX-64-NEXT: vandps %ymm2, %ymm0, %ymm0
; AVX-64-NEXT: vandps %ymm2, %ymm1, %ymm1		; AVX-64-NEXT: vandps %ymm2, %ymm1, %ymm1
; AVX-64-NEXT: retq		; AVX-64-NEXT: retq
;		;
; NO-AVX512BW-64-LABEL: f32xi16_i64:		; NO-AVX512BW-64-LABEL: f32xi16_i64:
; NO-AVX512BW-64: # %bb.0:		; NO-AVX512BW-64: # %bb.0:
; NO-AVX512BW-64-NEXT: vpbroadcastq {{.*#+}} ymm2 = [844433520132096,844433520132096,844433520132096,844433520132096]		; NO-AVX512BW-64-NEXT: vpbroadcastq {{.*#+}} ymm2 = [844433520132096,844433520132096,844433520132096,844433520132096]
; NO-AVX512BW-64-NEXT: vpaddw %ymm2, %ymm1, %ymm1		; NO-AVX512BW-64-NEXT: vpaddw %ymm2, %ymm1, %ymm1
Show All 21 Lines
; AVX-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,2,3,4,5,6,7]		; AVX-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,2,3,4,5,6,7]
; AVX-NEXT: vpaddw %xmm3, %xmm2, %xmm2		; AVX-NEXT: vpaddw %xmm3, %xmm2, %xmm2
; AVX-NEXT: vpaddw %xmm3, %xmm1, %xmm1		; AVX-NEXT: vpaddw %xmm3, %xmm1, %xmm1
; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1		; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX-NEXT: vpaddw %xmm3, %xmm2, %xmm2		; AVX-NEXT: vpaddw %xmm3, %xmm2, %xmm2
; AVX-NEXT: vpaddw %xmm3, %xmm0, %xmm0		; AVX-NEXT: vpaddw %xmm3, %xmm0, %xmm0
; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX-NEXT: vmovaps {{.*#+}} ymm2 = [0,1,2,3,4,5,6,7,0,1,2,3,4,5,6,7]		; AVX-NEXT: vinsertf128 $1, %xmm3, %ymm3, %ymm2
; AVX-NEXT: vandps %ymm2, %ymm0, %ymm0		; AVX-NEXT: vandps %ymm2, %ymm0, %ymm0
; AVX-NEXT: vandps %ymm2, %ymm1, %ymm1		; AVX-NEXT: vandps %ymm2, %ymm1, %ymm1
; AVX-NEXT: retl		; AVX-NEXT: retl
;		;
; NO-AVX512BW-LABEL: f32xi16_i128:		; NO-AVX512BW-LABEL: f32xi16_i128:
; NO-AVX512BW: # %bb.0:		; NO-AVX512BW: # %bb.0:
; NO-AVX512BW-NEXT: vbroadcasti128 {{.*#+}} ymm2 = [0,1,2,3,4,5,6,7,0,1,2,3,4,5,6,7]		; NO-AVX512BW-NEXT: vbroadcasti128 {{.*#+}} ymm2 = [0,1,2,3,4,5,6,7,0,1,2,3,4,5,6,7]
; NO-AVX512BW-NEXT: # ymm2 = mem[0,1,0,1]		; NO-AVX512BW-NEXT: # ymm2 = mem[0,1,0,1]
Show All 17 Lines
; AVX-64-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,2,3,4,5,6,7]		; AVX-64-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,2,3,4,5,6,7]
; AVX-64-NEXT: vpaddw %xmm3, %xmm2, %xmm2		; AVX-64-NEXT: vpaddw %xmm3, %xmm2, %xmm2
; AVX-64-NEXT: vpaddw %xmm3, %xmm1, %xmm1		; AVX-64-NEXT: vpaddw %xmm3, %xmm1, %xmm1
; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1		; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
; AVX-64-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX-64-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX-64-NEXT: vpaddw %xmm3, %xmm2, %xmm2		; AVX-64-NEXT: vpaddw %xmm3, %xmm2, %xmm2
; AVX-64-NEXT: vpaddw %xmm3, %xmm0, %xmm0		; AVX-64-NEXT: vpaddw %xmm3, %xmm0, %xmm0
; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX-64-NEXT: vmovaps {{.*#+}} ymm2 = [0,1,2,3,4,5,6,7,0,1,2,3,4,5,6,7]		; AVX-64-NEXT: vinsertf128 $1, %xmm3, %ymm3, %ymm2
; AVX-64-NEXT: vandps %ymm2, %ymm0, %ymm0		; AVX-64-NEXT: vandps %ymm2, %ymm0, %ymm0
; AVX-64-NEXT: vandps %ymm2, %ymm1, %ymm1		; AVX-64-NEXT: vandps %ymm2, %ymm1, %ymm1
; AVX-64-NEXT: retq		; AVX-64-NEXT: retq
;		;
; NO-AVX512BW-64-LABEL: f32xi16_i128:		; NO-AVX512BW-64-LABEL: f32xi16_i128:
; NO-AVX512BW-64: # %bb.0:		; NO-AVX512BW-64: # %bb.0:
; NO-AVX512BW-64-NEXT: vbroadcasti128 {{.*#+}} ymm2 = [0,1,2,3,4,5,6,7,0,1,2,3,4,5,6,7]		; NO-AVX512BW-64-NEXT: vbroadcasti128 {{.*#+}} ymm2 = [0,1,2,3,4,5,6,7,0,1,2,3,4,5,6,7]
; NO-AVX512BW-64-NEXT: # ymm2 = mem[0,1,0,1]		; NO-AVX512BW-64-NEXT: # ymm2 = mem[0,1,0,1]
▲ Show 20 Lines • Show All 211 Lines • ▼ Show 20 Lines	; ALL64-NEXT: retq
ret <8 x i32> %res2		ret <8 x i32> %res2
}		}


define <16 x i32> @f16xi32_i64(<16 x i32> %a) {		define <16 x i32> @f16xi32_i64(<16 x i32> %a) {
; AVX-LABEL: f16xi32_i64:		; AVX-LABEL: f16xi32_i64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX-NEXT: vextractf128 $1, %ymm1, %xmm2
; AVX-NEXT: vmovddup {{.*#+}} xmm3 = [2.1219957909652723E-314,2.1219957909652723E-314]		; AVX-NEXT: vmovsd {{.*#+}} xmm3 = mem[0],zero
; AVX-NEXT: # xmm3 = mem[0,0]		; AVX-NEXT: vmovddup {{.*#+}} xmm3 = xmm3[0,0]
; AVX-NEXT: vpaddd %xmm3, %xmm2, %xmm2		; AVX-NEXT: vpaddd %xmm3, %xmm2, %xmm2
; AVX-NEXT: vpaddd %xmm3, %xmm1, %xmm1		; AVX-NEXT: vpaddd %xmm3, %xmm1, %xmm1
; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1		; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX-NEXT: vpaddd %xmm3, %xmm2, %xmm2		; AVX-NEXT: vpaddd %xmm3, %xmm2, %xmm2
; AVX-NEXT: vpaddd %xmm3, %xmm0, %xmm0		; AVX-NEXT: vpaddd %xmm3, %xmm0, %xmm0
; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX-NEXT: vmovaps {{.*#+}} ymm2 = [0,1,0,1,0,1,0,1]		; AVX-NEXT: vinsertf128 $1, %xmm3, %ymm3, %ymm2
; AVX-NEXT: vandps %ymm2, %ymm0, %ymm0		; AVX-NEXT: vandps %ymm2, %ymm0, %ymm0
; AVX-NEXT: vandps %ymm2, %ymm1, %ymm1		; AVX-NEXT: vandps %ymm2, %ymm1, %ymm1
; AVX-NEXT: retl		; AVX-NEXT: retl
;		;
; AVX2-LABEL: f16xi32_i64:		; AVX2-LABEL: f16xi32_i64:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [2.1219957909652723E-314,2.1219957909652723E-314,2.1219957909652723E-314,2.1219957909652723E-314]		; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [2.1219957909652723E-314,2.1219957909652723E-314,2.1219957909652723E-314,2.1219957909652723E-314]
; AVX2-NEXT: vpaddd %ymm2, %ymm1, %ymm1		; AVX2-NEXT: vpaddd %ymm2, %ymm1, %ymm1
; AVX2-NEXT: vpaddd %ymm2, %ymm0, %ymm0		; AVX2-NEXT: vpaddd %ymm2, %ymm0, %ymm0
; AVX2-NEXT: vpand %ymm2, %ymm0, %ymm0		; AVX2-NEXT: vpand %ymm2, %ymm0, %ymm0
; AVX2-NEXT: vpand %ymm2, %ymm1, %ymm1		; AVX2-NEXT: vpand %ymm2, %ymm1, %ymm1
; AVX2-NEXT: retl		; AVX2-NEXT: retl
;		;
; AVX512-LABEL: f16xi32_i64:		; AVX512-LABEL: f16xi32_i64:
; AVX512: # %bb.0:		; AVX512: # %bb.0:
; AVX512-NEXT: vpbroadcastq {{.*#+}} zmm1 = [2.1219957909652723E-314,2.1219957909652723E-314,2.1219957909652723E-314,2.1219957909652723E-314,2.1219957909652723E-314,2.1219957909652723E-314,2.1219957909652723E-314,2.1219957909652723E-314]		; AVX512-NEXT: vpbroadcastq {{.*#+}} zmm1 = [2.1219957909652723E-314,2.1219957909652723E-314,2.1219957909652723E-314,2.1219957909652723E-314,2.1219957909652723E-314,2.1219957909652723E-314,2.1219957909652723E-314,2.1219957909652723E-314]
; AVX512-NEXT: vpaddd %zmm1, %zmm0, %zmm0		; AVX512-NEXT: vpaddd %zmm1, %zmm0, %zmm0
; AVX512-NEXT: vpandq %zmm1, %zmm0, %zmm0		; AVX512-NEXT: vpandd %zmm1, %zmm0, %zmm0
; AVX512-NEXT: retl		; AVX512-NEXT: retl
;		;
; AVX-64-LABEL: f16xi32_i64:		; AVX-64-LABEL: f16xi32_i64:
; AVX-64: # %bb.0:		; AVX-64: # %bb.0:
; AVX-64-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX-64-NEXT: vextractf128 $1, %ymm1, %xmm2
; AVX-64-NEXT: vmovddup {{.*#+}} xmm3 = [2.1219957909652723E-314,2.1219957909652723E-314]		; AVX-64-NEXT: vmovsd {{.*#+}} xmm3 = mem[0],zero
; AVX-64-NEXT: # xmm3 = mem[0,0]		; AVX-64-NEXT: vmovddup {{.*#+}} xmm3 = xmm3[0,0]
; AVX-64-NEXT: vpaddd %xmm3, %xmm2, %xmm2		; AVX-64-NEXT: vpaddd %xmm3, %xmm2, %xmm2
; AVX-64-NEXT: vpaddd %xmm3, %xmm1, %xmm1		; AVX-64-NEXT: vpaddd %xmm3, %xmm1, %xmm1
; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1		; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
; AVX-64-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX-64-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX-64-NEXT: vpaddd %xmm3, %xmm2, %xmm2		; AVX-64-NEXT: vpaddd %xmm3, %xmm2, %xmm2
; AVX-64-NEXT: vpaddd %xmm3, %xmm0, %xmm0		; AVX-64-NEXT: vpaddd %xmm3, %xmm0, %xmm0
; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX-64-NEXT: vmovaps {{.*#+}} ymm2 = [0,1,0,1,0,1,0,1]		; AVX-64-NEXT: vinsertf128 $1, %xmm3, %ymm3, %ymm2
; AVX-64-NEXT: vandps %ymm2, %ymm0, %ymm0		; AVX-64-NEXT: vandps %ymm2, %ymm0, %ymm0
; AVX-64-NEXT: vandps %ymm2, %ymm1, %ymm1		; AVX-64-NEXT: vandps %ymm2, %ymm1, %ymm1
; AVX-64-NEXT: retq		; AVX-64-NEXT: retq
;		;
; AVX2-64-LABEL: f16xi32_i64:		; AVX2-64-LABEL: f16xi32_i64:
; AVX2-64: # %bb.0:		; AVX2-64: # %bb.0:
; AVX2-64-NEXT: vpbroadcastq {{.*#+}} ymm2 = [4294967296,4294967296,4294967296,4294967296]		; AVX2-64-NEXT: vpbroadcastq {{.*#+}} ymm2 = [4294967296,4294967296,4294967296,4294967296]
; AVX2-64-NEXT: vpaddd %ymm2, %ymm1, %ymm1		; AVX2-64-NEXT: vpaddd %ymm2, %ymm1, %ymm1
; AVX2-64-NEXT: vpaddd %ymm2, %ymm0, %ymm0		; AVX2-64-NEXT: vpaddd %ymm2, %ymm0, %ymm0
; AVX2-64-NEXT: vpand %ymm2, %ymm0, %ymm0		; AVX2-64-NEXT: vpand %ymm2, %ymm0, %ymm0
; AVX2-64-NEXT: vpand %ymm2, %ymm1, %ymm1		; AVX2-64-NEXT: vpand %ymm2, %ymm1, %ymm1
; AVX2-64-NEXT: retq		; AVX2-64-NEXT: retq
;		;
; AVX512F-64-LABEL: f16xi32_i64:		; AVX512F-64-LABEL: f16xi32_i64:
; AVX512F-64: # %bb.0:		; AVX512F-64: # %bb.0:
; AVX512F-64-NEXT: vpbroadcastq {{.*#+}} zmm1 = [4294967296,4294967296,4294967296,4294967296,4294967296,4294967296,4294967296,4294967296]		; AVX512F-64-NEXT: vpbroadcastq {{.*#+}} zmm1 = [4294967296,4294967296,4294967296,4294967296,4294967296,4294967296,4294967296,4294967296]
; AVX512F-64-NEXT: vpaddd %zmm1, %zmm0, %zmm0		; AVX512F-64-NEXT: vpaddd %zmm1, %zmm0, %zmm0
; AVX512F-64-NEXT: vpandq %zmm1, %zmm0, %zmm0		; AVX512F-64-NEXT: vpandd %zmm1, %zmm0, %zmm0
; AVX512F-64-NEXT: retq		; AVX512F-64-NEXT: retq
%res1 = add <16 x i32> <i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1>, %a		%res1 = add <16 x i32> <i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1>, %a
%res2 = and <16 x i32> <i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1>, %res1		%res2 = and <16 x i32> <i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1>, %res1
ret <16 x i32> %res2		ret <16 x i32> %res2
}		}


define <16 x i32> @f16xi32_i128(<16 x i32> %a) {		define <16 x i32> @f16xi32_i128(<16 x i32> %a) {
; AVX-LABEL: f16xi32_i128:		; AVX-LABEL: f16xi32_i128:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX-NEXT: vextractf128 $1, %ymm1, %xmm2
; AVX-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,2,3]		; AVX-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,2,3]
; AVX-NEXT: vpaddd %xmm3, %xmm2, %xmm2		; AVX-NEXT: vpaddd %xmm3, %xmm2, %xmm2
; AVX-NEXT: vpaddd %xmm3, %xmm1, %xmm1		; AVX-NEXT: vpaddd %xmm3, %xmm1, %xmm1
; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1		; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX-NEXT: vpaddd %xmm3, %xmm2, %xmm2		; AVX-NEXT: vpaddd %xmm3, %xmm2, %xmm2
; AVX-NEXT: vpaddd %xmm3, %xmm0, %xmm0		; AVX-NEXT: vpaddd %xmm3, %xmm0, %xmm0
; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; AVX-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX-NEXT: vmovaps {{.*#+}} ymm2 = [0,1,2,3,0,1,2,3]		; AVX-NEXT: vinsertf128 $1, %xmm3, %ymm3, %ymm2
; AVX-NEXT: vandps %ymm2, %ymm0, %ymm0		; AVX-NEXT: vandps %ymm2, %ymm0, %ymm0
; AVX-NEXT: vandps %ymm2, %ymm1, %ymm1		; AVX-NEXT: vandps %ymm2, %ymm1, %ymm1
; AVX-NEXT: retl		; AVX-NEXT: retl
;		;
; AVX2-LABEL: f16xi32_i128:		; AVX2-LABEL: f16xi32_i128:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vbroadcasti128 {{.*#+}} ymm2 = [0,1,2,3,0,1,2,3]		; AVX2-NEXT: vbroadcasti128 {{.*#+}} ymm2 = [0,1,2,3,0,1,2,3]
; AVX2-NEXT: # ymm2 = mem[0,1,0,1]		; AVX2-NEXT: # ymm2 = mem[0,1,0,1]
; AVX2-NEXT: vpaddd %ymm2, %ymm1, %ymm1		; AVX2-NEXT: vpaddd %ymm2, %ymm1, %ymm1
; AVX2-NEXT: vpaddd %ymm2, %ymm0, %ymm0		; AVX2-NEXT: vpaddd %ymm2, %ymm0, %ymm0
; AVX2-NEXT: vpand %ymm2, %ymm0, %ymm0		; AVX2-NEXT: vpand %ymm2, %ymm0, %ymm0
; AVX2-NEXT: vpand %ymm2, %ymm1, %ymm1		; AVX2-NEXT: vpand %ymm2, %ymm1, %ymm1
; AVX2-NEXT: retl		; AVX2-NEXT: retl
;		;
; AVX512-LABEL: f16xi32_i128:		; AVX512-LABEL: f16xi32_i128:
; AVX512: # %bb.0:		; AVX512: # %bb.0:
; AVX512-NEXT: vbroadcasti32x4 {{.*#+}} zmm1 = [0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3]		; AVX512-NEXT: vbroadcasti32x4 {{.*#+}} zmm1 = [0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3]
; AVX512-NEXT: # zmm1 = mem[0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3]		; AVX512-NEXT: # zmm1 = mem[0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3]
; AVX512-NEXT: vpaddd %zmm1, %zmm0, %zmm0		; AVX512-NEXT: vpaddd %zmm1, %zmm0, %zmm0
; AVX512-NEXT: vpandq %zmm1, %zmm0, %zmm0		; AVX512-NEXT: vpandd %zmm1, %zmm0, %zmm0
; AVX512-NEXT: retl		; AVX512-NEXT: retl
;		;
; AVX-64-LABEL: f16xi32_i128:		; AVX-64-LABEL: f16xi32_i128:
; AVX-64: # %bb.0:		; AVX-64: # %bb.0:
; AVX-64-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX-64-NEXT: vextractf128 $1, %ymm1, %xmm2
; AVX-64-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,2,3]		; AVX-64-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,2,3]
; AVX-64-NEXT: vpaddd %xmm3, %xmm2, %xmm2		; AVX-64-NEXT: vpaddd %xmm3, %xmm2, %xmm2
; AVX-64-NEXT: vpaddd %xmm3, %xmm1, %xmm1		; AVX-64-NEXT: vpaddd %xmm3, %xmm1, %xmm1
; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1		; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm1, %ymm1
; AVX-64-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX-64-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX-64-NEXT: vpaddd %xmm3, %xmm2, %xmm2		; AVX-64-NEXT: vpaddd %xmm3, %xmm2, %xmm2
; AVX-64-NEXT: vpaddd %xmm3, %xmm0, %xmm0		; AVX-64-NEXT: vpaddd %xmm3, %xmm0, %xmm0
; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; AVX-64-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX-64-NEXT: vmovaps {{.*#+}} ymm2 = [0,1,2,3,0,1,2,3]		; AVX-64-NEXT: vinsertf128 $1, %xmm3, %ymm3, %ymm2
; AVX-64-NEXT: vandps %ymm2, %ymm0, %ymm0		; AVX-64-NEXT: vandps %ymm2, %ymm0, %ymm0
; AVX-64-NEXT: vandps %ymm2, %ymm1, %ymm1		; AVX-64-NEXT: vandps %ymm2, %ymm1, %ymm1
; AVX-64-NEXT: retq		; AVX-64-NEXT: retq
;		;
; AVX2-64-LABEL: f16xi32_i128:		; AVX2-64-LABEL: f16xi32_i128:
; AVX2-64: # %bb.0:		; AVX2-64: # %bb.0:
; AVX2-64-NEXT: vbroadcasti128 {{.*#+}} ymm2 = [0,1,2,3,0,1,2,3]		; AVX2-64-NEXT: vbroadcasti128 {{.*#+}} ymm2 = [0,1,2,3,0,1,2,3]
; AVX2-64-NEXT: # ymm2 = mem[0,1,0,1]		; AVX2-64-NEXT: # ymm2 = mem[0,1,0,1]
; AVX2-64-NEXT: vpaddd %ymm2, %ymm1, %ymm1		; AVX2-64-NEXT: vpaddd %ymm2, %ymm1, %ymm1
; AVX2-64-NEXT: vpaddd %ymm2, %ymm0, %ymm0		; AVX2-64-NEXT: vpaddd %ymm2, %ymm0, %ymm0
; AVX2-64-NEXT: vpand %ymm2, %ymm0, %ymm0		; AVX2-64-NEXT: vpand %ymm2, %ymm0, %ymm0
; AVX2-64-NEXT: vpand %ymm2, %ymm1, %ymm1		; AVX2-64-NEXT: vpand %ymm2, %ymm1, %ymm1
; AVX2-64-NEXT: retq		; AVX2-64-NEXT: retq
;		;
; AVX512F-64-LABEL: f16xi32_i128:		; AVX512F-64-LABEL: f16xi32_i128:
; AVX512F-64: # %bb.0:		; AVX512F-64: # %bb.0:
; AVX512F-64-NEXT: vbroadcasti32x4 {{.*#+}} zmm1 = [0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3]		; AVX512F-64-NEXT: vbroadcasti32x4 {{.*#+}} zmm1 = [0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3]
; AVX512F-64-NEXT: # zmm1 = mem[0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3]		; AVX512F-64-NEXT: # zmm1 = mem[0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3]
; AVX512F-64-NEXT: vpaddd %zmm1, %zmm0, %zmm0		; AVX512F-64-NEXT: vpaddd %zmm1, %zmm0, %zmm0
; AVX512F-64-NEXT: vpandq %zmm1, %zmm0, %zmm0		; AVX512F-64-NEXT: vpandd %zmm1, %zmm0, %zmm0
; AVX512F-64-NEXT: retq		; AVX512F-64-NEXT: retq
%res1 = add <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3>, %a		%res1 = add <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3>, %a
%res2 = and <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3>, %res1		%res2 = and <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3>, %res1
ret <16 x i32> %res2		ret <16 x i32> %res2
}		}


define <4 x i64> @f4xi64_i128(<4 x i64> %a) {		define <4 x i64> @f4xi64_i128(<4 x i64> %a) {
▲ Show 20 Lines • Show All 675 Lines • Show Last 20 Lines

test/CodeGen/X86/fma-fneg-combine.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc < %s -mtriple=x86_64-unknown-linux-gnu -mattr=+avx512bw -mattr=+avx512vl -mattr=+avx512dq \| FileCheck %s --check-prefix=CHECK --check-prefix=SKX		; RUN: llc < %s -mtriple=x86_64-unknown-linux-gnu -mattr=+avx512bw -mattr=+avx512vl -mattr=+avx512dq \| FileCheck %s --check-prefix=CHECK --check-prefix=SKX
; RUN: llc < %s -mtriple=x86_64-unknown-linux-gnu -mattr=+avx512f -mattr=+fma \| FileCheck %s --check-prefix=CHECK --check-prefix=KNL		; RUN: llc < %s -mtriple=x86_64-unknown-linux-gnu -mattr=+avx512f -mattr=+fma \| FileCheck %s --check-prefix=CHECK --check-prefix=KNL

; This test checks combinations of FNEG and FMA intrinsics on AVX-512 target		; This test checks combinations of FNEG and FMA intrinsics on AVX-512 target
; PR28892		; PR28892

define <16 x float> @test1(<16 x float> %a, <16 x float> %b, <16 x float> %c) {		define <16 x float> @test1(<16 x float> %a, <16 x float> %b, <16 x float> %c) {
; CHECK-LABEL: test1:		; CHECK-LABEL: test1:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vfmsub213ps %zmm2, %zmm1, %zmm0		; CHECK-NEXT: vfmsub213ps {{.#+}} zmm0 = (zmm1 zmm0) - zmm2
; CHECK-NEXT: retq		; CHECK-NEXT: retq
entry:		entry:
%sub.i = fsub <16 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %c		%sub.i = fsub <16 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %c
%0 = tail call <16 x float> @llvm.x86.avx512.vfmadd.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %sub.i, i32 4) #2		%0 = tail call <16 x float> @llvm.x86.avx512.vfmadd.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %sub.i, i32 4) #2
ret <16 x float> %0		ret <16 x float> %0
}		}

declare <16 x float> @llvm.x86.avx512.vfmadd.ps.512(<16 x float>, <16 x float>, <16 x float>, i32)		declare <16 x float> @llvm.x86.avx512.vfmadd.ps.512(<16 x float>, <16 x float>, <16 x float>, i32)
declare <16 x float> @llvm.x86.avx512.mask.vfnmadd.ps.512(<16 x float>, <16 x float>, <16 x float>, i16, i32)		declare <16 x float> @llvm.x86.avx512.mask.vfnmadd.ps.512(<16 x float>, <16 x float>, <16 x float>, i16, i32)
declare <16 x float> @llvm.x86.avx512.mask.vfnmsub.ps.512(<16 x float>, <16 x float>, <16 x float>, i16, i32)		declare <16 x float> @llvm.x86.avx512.mask.vfnmsub.ps.512(<16 x float>, <16 x float>, <16 x float>, i16, i32)


define <16 x float> @test2(<16 x float> %a, <16 x float> %b, <16 x float> %c) {		define <16 x float> @test2(<16 x float> %a, <16 x float> %b, <16 x float> %c) {
; CHECK-LABEL: test2:		; CHECK-LABEL: test2:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vfnmsub213ps %zmm2, %zmm1, %zmm0		; CHECK-NEXT: vfnmsub213ps {{.#+}} zmm0 = -(zmm1 zmm0) - zmm2
; CHECK-NEXT: retq		; CHECK-NEXT: retq
entry:		entry:
%0 = tail call <16 x float> @llvm.x86.avx512.vfmadd.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %c, i32 4) #2		%0 = tail call <16 x float> @llvm.x86.avx512.vfmadd.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %c, i32 4) #2
%sub.i = fsub <16 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %0		%sub.i = fsub <16 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %0
ret <16 x float> %sub.i		ret <16 x float> %sub.i
}		}

define <16 x float> @test3(<16 x float> %a, <16 x float> %b, <16 x float> %c) {		define <16 x float> @test3(<16 x float> %a, <16 x float> %b, <16 x float> %c) {
; CHECK-LABEL: test3:		; CHECK-LABEL: test3:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vfmsub213ps %zmm2, %zmm1, %zmm0		; CHECK-NEXT: vfmsub213ps {{.#+}} zmm0 = (zmm1 zmm0) - zmm2
; CHECK-NEXT: retq		; CHECK-NEXT: retq
entry:		entry:
%0 = tail call <16 x float> @llvm.x86.avx512.mask.vfnmadd.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %c, i16 -1, i32 4) #2		%0 = tail call <16 x float> @llvm.x86.avx512.mask.vfnmadd.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %c, i16 -1, i32 4) #2
%sub.i = fsub <16 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %0		%sub.i = fsub <16 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %0
ret <16 x float> %sub.i		ret <16 x float> %sub.i
}		}

define <16 x float> @test4(<16 x float> %a, <16 x float> %b, <16 x float> %c) {		define <16 x float> @test4(<16 x float> %a, <16 x float> %b, <16 x float> %c) {
; CHECK-LABEL: test4:		; CHECK-LABEL: test4:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vfmadd213ps %zmm2, %zmm1, %zmm0		; CHECK-NEXT: vfmadd213ps {{.#+}} zmm0 = (zmm1 zmm0) + zmm2
; CHECK-NEXT: retq		; CHECK-NEXT: retq
entry:		entry:
%0 = tail call <16 x float> @llvm.x86.avx512.mask.vfnmsub.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %c, i16 -1, i32 4) #2		%0 = tail call <16 x float> @llvm.x86.avx512.mask.vfnmsub.ps.512(<16 x float> %a, <16 x float> %b, <16 x float> %c, i16 -1, i32 4) #2
%sub.i = fsub <16 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %0		%sub.i = fsub <16 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %0
ret <16 x float> %sub.i		ret <16 x float> %sub.i
}		}

define <16 x float> @test5(<16 x float> %a, <16 x float> %b, <16 x float> %c) {		define <16 x float> @test5(<16 x float> %a, <16 x float> %b, <16 x float> %c) {
▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
}		}

declare <8 x float> @llvm.x86.fma.vfmsub.ps.256(<8 x float>, <8 x float>, <8 x float>)		declare <8 x float> @llvm.x86.fma.vfmsub.ps.256(<8 x float>, <8 x float>, <8 x float>)


define <8 x double> @test9(<8 x double> %a, <8 x double> %b, <8 x double> %c) {		define <8 x double> @test9(<8 x double> %a, <8 x double> %b, <8 x double> %c) {
; CHECK-LABEL: test9:		; CHECK-LABEL: test9:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vfnmsub213pd %zmm2, %zmm1, %zmm0		; CHECK-NEXT: vfnmsub213pd {{.#+}} zmm0 = -(zmm1 zmm0) - zmm2
; CHECK-NEXT: retq		; CHECK-NEXT: retq
entry:		entry:
%0 = tail call <8 x double> @llvm.x86.avx512.vfmadd.pd.512(<8 x double> %a, <8 x double> %b, <8 x double> %c, i32 4) #2		%0 = tail call <8 x double> @llvm.x86.avx512.vfmadd.pd.512(<8 x double> %a, <8 x double> %b, <8 x double> %c, i32 4) #2
%sub.i = fsub <8 x double> <double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00>, %0		%sub.i = fsub <8 x double> <double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00>, %0
ret <8 x double> %sub.i		ret <8 x double> %sub.i
}		}

declare <8 x double> @llvm.x86.avx512.vfmadd.pd.512(<8 x double> %a, <8 x double> %b, <8 x double> %c, i32)		declare <8 x double> @llvm.x86.avx512.vfmadd.pd.512(<8 x double> %a, <8 x double> %b, <8 x double> %c, i32)

define <2 x double> @test10(<2 x double> %a, <2 x double> %b, <2 x double> %c) {		define <2 x double> @test10(<2 x double> %a, <2 x double> %b, <2 x double> %c) {
; CHECK-LABEL: test10:		; CHECK-LABEL: test10:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vfmadd213sd %xmm2, %xmm1, %xmm0		; CHECK-NEXT: vfmadd213sd {{.#+}} xmm0 = (xmm1 xmm0) + xmm2
; CHECK-NEXT: vxorpd {{.*}}(%rip), %xmm0, %xmm0		; CHECK-NEXT: vxorpd {{.*}}(%rip), %xmm0, %xmm0
; CHECK-NEXT: retq		; CHECK-NEXT: retq
entry:		entry:
%0 = tail call <2 x double> @llvm.x86.avx512.mask.vfmadd.sd(<2 x double> %a, <2 x double> %b, <2 x double> %c, i8 -1, i32 4) #2		%0 = tail call <2 x double> @llvm.x86.avx512.mask.vfmadd.sd(<2 x double> %a, <2 x double> %b, <2 x double> %c, i8 -1, i32 4) #2
%sub.i = fsub <2 x double> <double -0.000000e+00, double -0.000000e+00>, %0		%sub.i = fsub <2 x double> <double -0.000000e+00, double -0.000000e+00>, %0
ret <2 x double> %sub.i		ret <2 x double> %sub.i
}		}

Show All 25 Lines
}		}

declare <4 x float> @llvm.x86.avx512.mask3.vfmadd.ss(<4 x float>, <4 x float>, <4 x float>, i8, i32)		declare <4 x float> @llvm.x86.avx512.mask3.vfmadd.ss(<4 x float>, <4 x float>, <4 x float>, i8, i32)

define <4 x float> @test11b(<4 x float> %a, <4 x float> %b, <4 x float> %c, i8 zeroext %mask) local_unnamed_addr #0 {		define <4 x float> @test11b(<4 x float> %a, <4 x float> %b, <4 x float> %c, i8 zeroext %mask) local_unnamed_addr #0 {
; SKX-LABEL: test11b:		; SKX-LABEL: test11b:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vfmsub213ss %xmm2, %xmm1, %xmm0 {%k1}		; SKX-NEXT: vfmsub213ss {{.#+}} xmm0 = (xmm1 xmm0) - xmm2
; SKX-NEXT: retq		; SKX-NEXT: retq
;		;
; KNL-LABEL: test11b:		; KNL-LABEL: test11b:
; KNL: # %bb.0: # %entry		; KNL: # %bb.0: # %entry
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vfmsub213ss %xmm2, %xmm1, %xmm0 {%k1}		; KNL-NEXT: vfmsub213ss {{.#+}} xmm0 = (xmm1 xmm0) - xmm2
; KNL-NEXT: retq		; KNL-NEXT: retq
entry:		entry:
%sub.i = fsub <4 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %c		%sub.i = fsub <4 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %c
%0 = tail call <4 x float> @llvm.x86.avx512.mask.vfmadd.ss(<4 x float> %a, <4 x float> %b, <4 x float> %sub.i, i8 %mask, i32 4) #10		%0 = tail call <4 x float> @llvm.x86.avx512.mask.vfmadd.ss(<4 x float> %a, <4 x float> %b, <4 x float> %sub.i, i8 %mask, i32 4) #10
ret <4 x float> %0		ret <4 x float> %0
}		}

declare <4 x float> @llvm.x86.avx512.mask.vfmadd.ss(<4 x float>, <4 x float>, <4 x float>, i8, i32)		declare <4 x float> @llvm.x86.avx512.mask.vfmadd.ss(<4 x float>, <4 x float>, <4 x float>, i8, i32)

define <8 x double> @test12(<8 x double> %a, <8 x double> %b, <8 x double> %c, i8 %mask) {		define <8 x double> @test12(<8 x double> %a, <8 x double> %b, <8 x double> %c, i8 %mask) {
; SKX-LABEL: test12:		; SKX-LABEL: test12:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vfmadd132pd %zmm1, %zmm2, %zmm0 {%k1}		; SKX-NEXT: vfmadd132pd {{.#+}} zmm0 = (zmm0 zmm1) + zmm2
; SKX-NEXT: vxorpd {{.*}}(%rip){1to8}, %zmm0, %zmm0		; SKX-NEXT: vxorpd {{.*}}(%rip){1to8}, %zmm0, %zmm0
; SKX-NEXT: retq		; SKX-NEXT: retq
;		;
; KNL-LABEL: test12:		; KNL-LABEL: test12:
; KNL: # %bb.0: # %entry		; KNL: # %bb.0: # %entry
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vfmadd132pd %zmm1, %zmm2, %zmm0 {%k1}		; KNL-NEXT: vfmadd132pd {{.#+}} zmm0 = (zmm0 zmm1) + zmm2
; KNL-NEXT: vpxorq {{.*}}(%rip){1to8}, %zmm0, %zmm0		; KNL-NEXT: vpxorq {{.*}}(%rip){1to8}, %zmm0, %zmm0
; KNL-NEXT: retq		; KNL-NEXT: retq
entry:		entry:
%0 = tail call <8 x double> @llvm.x86.avx512.vfmadd.pd.512(<8 x double> %a, <8 x double> %b, <8 x double> %c, i32 4) #2		%0 = tail call <8 x double> @llvm.x86.avx512.vfmadd.pd.512(<8 x double> %a, <8 x double> %b, <8 x double> %c, i32 4) #2
%bc = bitcast i8 %mask to <8 x i1>		%bc = bitcast i8 %mask to <8 x i1>
%sel = select <8 x i1> %bc, <8 x double> %0, <8 x double> %a		%sel = select <8 x i1> %bc, <8 x double> %0, <8 x double> %a
%sub.i = fsub <8 x double> <double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00>, %sel		%sub.i = fsub <8 x double> <double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00>, %sel
ret <8 x double> %sub.i		ret <8 x double> %sub.i
▲ Show 20 Lines • Show All 93 Lines • ▼ Show 20 Lines	; KNL-NEXT: retq
ret <16 x float> %sel		ret <16 x float> %sel
}		}
declare <16 x float> @llvm.x86.avx512.vfmaddsub.ps.512(<16 x float>, <16 x float>, <16 x float>, i32)		declare <16 x float> @llvm.x86.avx512.vfmaddsub.ps.512(<16 x float>, <16 x float>, <16 x float>, i32)

define <8 x double> @test17(<8 x double> %a, <8 x double> %b, <8 x double> %c, i8 %mask) {		define <8 x double> @test17(<8 x double> %a, <8 x double> %b, <8 x double> %c, i8 %mask) {
; SKX-LABEL: test17:		; SKX-LABEL: test17:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vfmsubadd132pd %zmm1, %zmm2, %zmm0 {%k1}		; SKX-NEXT: vfmsubadd132pd {{.#+}} zmm0 = (zmm0 zmm1) -/+ zmm2
; SKX-NEXT: retq		; SKX-NEXT: retq
;		;
; KNL-LABEL: test17:		; KNL-LABEL: test17:
; KNL: # %bb.0:		; KNL: # %bb.0:
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vfmsubadd132pd %zmm1, %zmm2, %zmm0 {%k1}		; KNL-NEXT: vfmsubadd132pd {{.#+}} zmm0 = (zmm0 zmm1) -/+ zmm2
; KNL-NEXT: retq		; KNL-NEXT: retq
%sub.i = fsub <8 x double> <double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00>, %c		%sub.i = fsub <8 x double> <double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00>, %c
%res = call <8 x double> @llvm.x86.avx512.vfmaddsub.pd.512(<8 x double> %a, <8 x double> %b, <8 x double> %sub.i, i32 4)		%res = call <8 x double> @llvm.x86.avx512.vfmaddsub.pd.512(<8 x double> %a, <8 x double> %b, <8 x double> %sub.i, i32 4)
%bc = bitcast i8 %mask to <8 x i1>		%bc = bitcast i8 %mask to <8 x i1>
%sel = select <8 x i1> %bc, <8 x double> %res, <8 x double> %a		%sel = select <8 x i1> %bc, <8 x double> %res, <8 x double> %a
ret <8 x double> %sel		ret <8 x double> %sel
}		}
declare <8 x double> @llvm.x86.avx512.vfmaddsub.pd.512(<8 x double>, <8 x double>, <8 x double>, i32)		declare <8 x double> @llvm.x86.avx512.vfmaddsub.pd.512(<8 x double>, <8 x double>, <8 x double>, i32)

define <4 x float> @test18(<4 x float> %a, <4 x float> %b, <4 x float> %c, i8 zeroext %mask) local_unnamed_addr #0 {		define <4 x float> @test18(<4 x float> %a, <4 x float> %b, <4 x float> %c, i8 zeroext %mask) local_unnamed_addr #0 {
; SKX-LABEL: test18:		; SKX-LABEL: test18:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vfnmadd213ss %xmm2, %xmm1, %xmm0 {%k1}		; SKX-NEXT: vfnmadd213ss {{.#+}} xmm0 = -(xmm1 xmm0) + xmm2
; SKX-NEXT: retq		; SKX-NEXT: retq
;		;
; KNL-LABEL: test18:		; KNL-LABEL: test18:
; KNL: # %bb.0: # %entry		; KNL: # %bb.0: # %entry
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vfnmadd213ss %xmm2, %xmm1, %xmm0 {%k1}		; KNL-NEXT: vfnmadd213ss {{.#+}} xmm0 = -(xmm1 xmm0) + xmm2
; KNL-NEXT: retq		; KNL-NEXT: retq
entry:		entry:
%sub.i = fsub <4 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %b		%sub.i = fsub <4 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %b
%0 = tail call <4 x float> @llvm.x86.avx512.mask.vfmadd.ss(<4 x float> %a, <4 x float> %sub.i, <4 x float> %c, i8 %mask, i32 4) #10		%0 = tail call <4 x float> @llvm.x86.avx512.mask.vfmadd.ss(<4 x float> %a, <4 x float> %sub.i, <4 x float> %c, i8 %mask, i32 4) #10
ret <4 x float> %0		ret <4 x float> %0
}		}

define <4 x float> @test19(<4 x float> %a, <4 x float> %b, <4 x float> %c, i8 zeroext %mask) local_unnamed_addr #0 {		define <4 x float> @test19(<4 x float> %a, <4 x float> %b, <4 x float> %c, i8 zeroext %mask) local_unnamed_addr #0 {
; SKX-LABEL: test19:		; SKX-LABEL: test19:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vfnmsub213ss %xmm2, %xmm1, %xmm0 {%k1}		; SKX-NEXT: vfnmsub213ss {{.#+}} xmm0 = -(xmm1 xmm0) - xmm2
; SKX-NEXT: retq		; SKX-NEXT: retq
;		;
; KNL-LABEL: test19:		; KNL-LABEL: test19:
; KNL: # %bb.0: # %entry		; KNL: # %bb.0: # %entry
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vfnmsub213ss %xmm2, %xmm1, %xmm0 {%k1}		; KNL-NEXT: vfnmsub213ss {{.#+}} xmm0 = -(xmm1 xmm0) - xmm2
; KNL-NEXT: retq		; KNL-NEXT: retq
entry:		entry:
%sub.i = fsub <4 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %b		%sub.i = fsub <4 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %b
%sub.i.2 = fsub <4 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %c		%sub.i.2 = fsub <4 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %c
%0 = tail call <4 x float> @llvm.x86.avx512.mask.vfmadd.ss(<4 x float> %a, <4 x float> %sub.i, <4 x float> %sub.i.2, i8 %mask, i32 4) #10		%0 = tail call <4 x float> @llvm.x86.avx512.mask.vfmadd.ss(<4 x float> %a, <4 x float> %sub.i, <4 x float> %sub.i.2, i8 %mask, i32 4) #10
ret <4 x float> %0		ret <4 x float> %0
}		}

define <4 x float> @test20(<4 x float> %a, <4 x float> %b, <4 x float> %c, i8 zeroext %mask) local_unnamed_addr #0 {		define <4 x float> @test20(<4 x float> %a, <4 x float> %b, <4 x float> %c, i8 zeroext %mask) local_unnamed_addr #0 {
; SKX-LABEL: test20:		; SKX-LABEL: test20:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: kmovd %edi, %k1		; SKX-NEXT: kmovd %edi, %k1
; SKX-NEXT: vfnmadd231ss %xmm1, %xmm0, %xmm2 {%k1}		; SKX-NEXT: vfnmadd231ss {{.#+}} xmm2 = -(xmm0 xmm1) + xmm2
; SKX-NEXT: vmovaps %xmm2, %xmm0		; SKX-NEXT: vmovaps %xmm2, %xmm0
; SKX-NEXT: retq		; SKX-NEXT: retq
;		;
; KNL-LABEL: test20:		; KNL-LABEL: test20:
; KNL: # %bb.0: # %entry		; KNL: # %bb.0: # %entry
; KNL-NEXT: kmovw %edi, %k1		; KNL-NEXT: kmovw %edi, %k1
; KNL-NEXT: vfnmadd231ss %xmm1, %xmm0, %xmm2 {%k1}		; KNL-NEXT: vfnmadd231ss {{.#+}} xmm2 = -(xmm0 xmm1) + xmm2
; KNL-NEXT: vmovaps %xmm2, %xmm0		; KNL-NEXT: vmovaps %xmm2, %xmm0
; KNL-NEXT: retq		; KNL-NEXT: retq
entry:		entry:
%sub.i = fsub <4 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %b		%sub.i = fsub <4 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %b
%0 = tail call <4 x float> @llvm.x86.avx512.mask3.vfmadd.ss(<4 x float> %a, <4 x float> %sub.i, <4 x float> %c, i8 %mask, i32 4) #10		%0 = tail call <4 x float> @llvm.x86.avx512.mask3.vfmadd.ss(<4 x float> %a, <4 x float> %sub.i, <4 x float> %c, i8 %mask, i32 4) #10
ret <4 x float> %0		ret <4 x float> %0
}		}

▲ Show 20 Lines • Show All 86 Lines • Show Last 20 Lines

test/CodeGen/X86/horizontal-reduce-umax.ll

	Show First 20 Lines • Show All 403 Lines • ▼ Show 20 Lines
	; X64-SSE42-NEXT: psrlw $8, %xmm2			; X64-SSE42-NEXT: psrlw $8, %xmm2
	; X64-SSE42-NEXT: pminub %xmm0, %xmm2			; X64-SSE42-NEXT: pminub %xmm0, %xmm2
	; X64-SSE42-NEXT: phminposuw %xmm2, %xmm0			; X64-SSE42-NEXT: phminposuw %xmm2, %xmm0
	; X64-SSE42-NEXT: pxor %xmm1, %xmm0			; X64-SSE42-NEXT: pxor %xmm1, %xmm0
	; X64-SSE42-NEXT: pextrb $0, %xmm0, %eax			; X64-SSE42-NEXT: pextrb $0, %xmm0, %eax
	; X64-SSE42-NEXT: ## kill: def $al killed $al killed $eax			; X64-SSE42-NEXT: ## kill: def $al killed $al killed $eax
	; X64-SSE42-NEXT: retq			; X64-SSE42-NEXT: retq
	;			;
	; X64-AVX1-LABEL: test_reduce_v16i8:			; X64-AVX-LABEL: test_reduce_v16i8:
	; X64-AVX1: ## %bb.0:			; X64-AVX: ## %bb.0:
	; X64-AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; X64-AVX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; X64-AVX1-NEXT: vpxor %xmm1, %xmm0, %xmm0			; X64-AVX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; X64-AVX1-NEXT: vpsrlw $8, %xmm0, %xmm2			; X64-AVX-NEXT: vpsrlw $8, %xmm0, %xmm2
	; X64-AVX1-NEXT: vpminub %xmm2, %xmm0, %xmm0			; X64-AVX-NEXT: vpminub %xmm2, %xmm0, %xmm0
	; X64-AVX1-NEXT: vphminposuw %xmm0, %xmm0			; X64-AVX-NEXT: vphminposuw %xmm0, %xmm0
	; X64-AVX1-NEXT: vpxor %xmm1, %xmm0, %xmm0			; X64-AVX-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; X64-AVX1-NEXT: vpextrb $0, %xmm0, %eax			; X64-AVX-NEXT: vpextrb $0, %xmm0, %eax
	; X64-AVX1-NEXT: ## kill: def $al killed $al killed $eax			; X64-AVX-NEXT: ## kill: def $al killed $al killed $eax
	; X64-AVX1-NEXT: retq			; X64-AVX-NEXT: retq
	;
	; X64-AVX2-LABEL: test_reduce_v16i8:
	; X64-AVX2: ## %bb.0:
	; X64-AVX2-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; X64-AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; X64-AVX2-NEXT: vpsrlw $8, %xmm0, %xmm2
	; X64-AVX2-NEXT: vpminub %xmm2, %xmm0, %xmm0
	; X64-AVX2-NEXT: vphminposuw %xmm0, %xmm0
	; X64-AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; X64-AVX2-NEXT: vpextrb $0, %xmm0, %eax
	; X64-AVX2-NEXT: ## kill: def $al killed $al killed $eax
	; X64-AVX2-NEXT: retq
	;
	; X64-AVX512-LABEL: test_reduce_v16i8:
	; X64-AVX512: ## %bb.0:
	; X64-AVX512-NEXT: vpternlogq $15, %xmm0, %xmm0, %xmm0
	; X64-AVX512-NEXT: vpsrlw $8, %xmm0, %xmm1
	; X64-AVX512-NEXT: vpminub %xmm1, %xmm0, %xmm0
	; X64-AVX512-NEXT: vphminposuw %xmm0, %xmm0
	; X64-AVX512-NEXT: vpternlogq $15, %xmm0, %xmm0, %xmm0
	; X64-AVX512-NEXT: vpextrb $0, %xmm0, %eax
	; X64-AVX512-NEXT: ## kill: def $al killed $al killed $eax
	; X64-AVX512-NEXT: retq
	%1 = shufflevector <16 x i8> %a0, <16 x i8> undef, <16 x i32> <i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>			%1 = shufflevector <16 x i8> %a0, <16 x i8> undef, <16 x i32> <i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
	%2 = icmp ugt <16 x i8> %a0, %1			%2 = icmp ugt <16 x i8> %a0, %1
	%3 = select <16 x i1> %2, <16 x i8> %a0, <16 x i8> %1			%3 = select <16 x i1> %2, <16 x i8> %a0, <16 x i8> %1
	%4 = shufflevector <16 x i8> %3, <16 x i8> undef, <16 x i32> <i32 4, i32 5, i32 6, i32 7, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>			%4 = shufflevector <16 x i8> %3, <16 x i8> undef, <16 x i32> <i32 4, i32 5, i32 6, i32 7, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
	%5 = icmp ugt <16 x i8> %3, %4			%5 = icmp ugt <16 x i8> %3, %4
	%6 = select <16 x i1> %5, <16 x i8> %3, <16 x i8> %4			%6 = select <16 x i1> %5, <16 x i8> %3, <16 x i8> %4
	%7 = shufflevector <16 x i8> %6, <16 x i8> undef, <16 x i32> <i32 2, i32 3, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>			%7 = shufflevector <16 x i8> %6, <16 x i8> undef, <16 x i32> <i32 2, i32 3, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
	%8 = icmp ugt <16 x i8> %6, %7			%8 = icmp ugt <16 x i8> %6, %7
	▲ Show 20 Lines • Show All 645 Lines • ▼ Show 20 Lines
	; X64-AVX2-NEXT: ## kill: def $al killed $al killed $eax			; X64-AVX2-NEXT: ## kill: def $al killed $al killed $eax
	; X64-AVX2-NEXT: vzeroupper			; X64-AVX2-NEXT: vzeroupper
	; X64-AVX2-NEXT: retq			; X64-AVX2-NEXT: retq
	;			;
	; X64-AVX512-LABEL: test_reduce_v32i8:			; X64-AVX512-LABEL: test_reduce_v32i8:
	; X64-AVX512: ## %bb.0:			; X64-AVX512: ## %bb.0:
	; X64-AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; X64-AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1
	; X64-AVX512-NEXT: vpmaxub %xmm1, %xmm0, %xmm0			; X64-AVX512-NEXT: vpmaxub %xmm1, %xmm0, %xmm0
	; X64-AVX512-NEXT: vpternlogq $15, %xmm0, %xmm0, %xmm0			; X64-AVX512-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; X64-AVX512-NEXT: vpsrlw $8, %xmm0, %xmm1			; X64-AVX512-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; X64-AVX512-NEXT: vpminub %xmm1, %xmm0, %xmm0			; X64-AVX512-NEXT: vpsrlw $8, %xmm0, %xmm2
				; X64-AVX512-NEXT: vpminub %xmm2, %xmm0, %xmm0
	; X64-AVX512-NEXT: vphminposuw %xmm0, %xmm0			; X64-AVX512-NEXT: vphminposuw %xmm0, %xmm0
	; X64-AVX512-NEXT: vpternlogq $15, %xmm0, %xmm0, %xmm0			; X64-AVX512-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; X64-AVX512-NEXT: vpextrb $0, %xmm0, %eax			; X64-AVX512-NEXT: vpextrb $0, %xmm0, %eax
	; X64-AVX512-NEXT: ## kill: def $al killed $al killed $eax			; X64-AVX512-NEXT: ## kill: def $al killed $al killed $eax
	; X64-AVX512-NEXT: vzeroupper			; X64-AVX512-NEXT: vzeroupper
	; X64-AVX512-NEXT: retq			; X64-AVX512-NEXT: retq
	%1 = shufflevector <32 x i8> %a0, <32 x i8> undef, <32 x i32> <i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>			%1 = shufflevector <32 x i8> %a0, <32 x i8> undef, <32 x i32> <i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
	%2 = icmp ugt <32 x i8> %a0, %1			%2 = icmp ugt <32 x i8> %a0, %1
	%3 = select <32 x i1> %2, <32 x i8> %a0, <32 x i8> %1			%3 = select <32 x i1> %2, <32 x i8> %a0, <32 x i8> %1
	%4 = shufflevector <32 x i8> %3, <32 x i8> undef, <32 x i32> <i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>			%4 = shufflevector <32 x i8> %3, <32 x i8> undef, <32 x i32> <i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
	▲ Show 20 Lines • Show All 861 Lines • ▼ Show 20 Lines
	; X64-AVX2-NEXT: retq			; X64-AVX2-NEXT: retq
	;			;
	; X64-AVX512-LABEL: test_reduce_v64i8:			; X64-AVX512-LABEL: test_reduce_v64i8:
	; X64-AVX512: ## %bb.0:			; X64-AVX512: ## %bb.0:
	; X64-AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; X64-AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; X64-AVX512-NEXT: vpmaxub %ymm1, %ymm0, %ymm0			; X64-AVX512-NEXT: vpmaxub %ymm1, %ymm0, %ymm0
	; X64-AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; X64-AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1
	; X64-AVX512-NEXT: vpmaxub %xmm1, %xmm0, %xmm0			; X64-AVX512-NEXT: vpmaxub %xmm1, %xmm0, %xmm0
	; X64-AVX512-NEXT: vpternlogq $15, %xmm0, %xmm0, %xmm0			; X64-AVX512-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; X64-AVX512-NEXT: vpsrlw $8, %xmm0, %xmm1			; X64-AVX512-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; X64-AVX512-NEXT: vpminub %xmm1, %xmm0, %xmm0			; X64-AVX512-NEXT: vpsrlw $8, %xmm0, %xmm2
				; X64-AVX512-NEXT: vpminub %xmm2, %xmm0, %xmm0
	; X64-AVX512-NEXT: vphminposuw %xmm0, %xmm0			; X64-AVX512-NEXT: vphminposuw %xmm0, %xmm0
	; X64-AVX512-NEXT: vpternlogq $15, %xmm0, %xmm0, %xmm0			; X64-AVX512-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; X64-AVX512-NEXT: vpextrb $0, %xmm0, %eax			; X64-AVX512-NEXT: vpextrb $0, %xmm0, %eax
	; X64-AVX512-NEXT: ## kill: def $al killed $al killed $eax			; X64-AVX512-NEXT: ## kill: def $al killed $al killed $eax
	; X64-AVX512-NEXT: vzeroupper			; X64-AVX512-NEXT: vzeroupper
	; X64-AVX512-NEXT: retq			; X64-AVX512-NEXT: retq
	%1 = shufflevector <64 x i8> %a0, <64 x i8> undef, <64 x i32> <i32 32, i32 33, i32 34, i32 35, i32 36, i32 37, i32 38, i32 39, i32 40, i32 41, i32 42, i32 43, i32 44, i32 45, i32 46, i32 47, i32 48, i32 49, i32 50, i32 51, i32 52, i32 53, i32 54, i32 55, i32 56, i32 57, i32 58, i32 59, i32 60, i32 61, i32 62, i32 63, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>			%1 = shufflevector <64 x i8> %a0, <64 x i8> undef, <64 x i32> <i32 32, i32 33, i32 34, i32 35, i32 36, i32 37, i32 38, i32 39, i32 40, i32 41, i32 42, i32 43, i32 44, i32 45, i32 46, i32 47, i32 48, i32 49, i32 50, i32 51, i32 52, i32 53, i32 54, i32 55, i32 56, i32 57, i32 58, i32 59, i32 60, i32 61, i32 62, i32 63, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
	%2 = icmp ugt <64 x i8> %a0, %1			%2 = icmp ugt <64 x i8> %a0, %1
	%3 = select <64 x i1> %2, <64 x i8> %a0, <64 x i8> %1			%3 = select <64 x i1> %2, <64 x i8> %a0, <64 x i8> %1
	%4 = shufflevector <64 x i8> %3, <64 x i8> undef, <64 x i32> <i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>			%4 = shufflevector <64 x i8> %3, <64 x i8> undef, <64 x i32> <i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
	Show All 17 Lines

test/CodeGen/X86/movmsk-cmp.ll

	Show First 20 Lines • Show All 1,803 Lines • ▼ Show 20 Lines
	; AVX-NEXT: vpslld $31, %xmm0, %xmm0			; AVX-NEXT: vpslld $31, %xmm0, %xmm0
	; AVX-NEXT: vmovmskps %xmm0, %eax			; AVX-NEXT: vmovmskps %xmm0, %eax
	; AVX-NEXT: cmpb $15, %al			; AVX-NEXT: cmpb $15, %al
	; AVX-NEXT: sete %al			; AVX-NEXT: sete %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; SKX-LABEL: allones_v4i32_and1:			; SKX-LABEL: allones_v4i32_and1:
	; SKX: # %bb.0:			; SKX: # %bb.0:
	; SKX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [1,1,1,1]			; SKX-NEXT: vptestmd {{.*}}(%rip){1to4}, %xmm0, %k0
	; SKX-NEXT: vptestmd %xmm1, %xmm0, %k0
	; SKX-NEXT: kmovd %k0, %eax			; SKX-NEXT: kmovd %k0, %eax
	; SKX-NEXT: andb $15, %al			; SKX-NEXT: andb $15, %al
	; SKX-NEXT: cmpb $15, %al			; SKX-NEXT: cmpb $15, %al
	; SKX-NEXT: sete %al			; SKX-NEXT: sete %al
	; SKX-NEXT: retq			; SKX-NEXT: retq
	%tmp = and <4 x i32> %arg, <i32 1, i32 1, i32 1, i32 1>			%tmp = and <4 x i32> %arg, <i32 1, i32 1, i32 1, i32 1>
	%tmp1 = icmp ne <4 x i32> %tmp, zeroinitializer			%tmp1 = icmp ne <4 x i32> %tmp, zeroinitializer
	%tmp2 = bitcast <4 x i1> %tmp1 to i4			%tmp2 = bitcast <4 x i1> %tmp1 to i4
	Show All 15 Lines
	; AVX-NEXT: vpslld $31, %xmm0, %xmm0			; AVX-NEXT: vpslld $31, %xmm0, %xmm0
	; AVX-NEXT: vmovmskps %xmm0, %eax			; AVX-NEXT: vmovmskps %xmm0, %eax
	; AVX-NEXT: testb %al, %al			; AVX-NEXT: testb %al, %al
	; AVX-NEXT: sete %al			; AVX-NEXT: sete %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; SKX-LABEL: allzeros_v4i32_and1:			; SKX-LABEL: allzeros_v4i32_and1:
	; SKX: # %bb.0:			; SKX: # %bb.0:
	; SKX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [1,1,1,1]			; SKX-NEXT: vptestmd {{.*}}(%rip){1to4}, %xmm0, %k0
	; SKX-NEXT: vptestmd %xmm1, %xmm0, %k0
	; SKX-NEXT: kmovd %k0, %eax			; SKX-NEXT: kmovd %k0, %eax
	; SKX-NEXT: testb $15, %al			; SKX-NEXT: testb $15, %al
	; SKX-NEXT: sete %al			; SKX-NEXT: sete %al
	; SKX-NEXT: retq			; SKX-NEXT: retq
	%tmp = and <4 x i32> %arg, <i32 1, i32 1, i32 1, i32 1>			%tmp = and <4 x i32> %arg, <i32 1, i32 1, i32 1, i32 1>
	%tmp1 = icmp ne <4 x i32> %tmp, zeroinitializer			%tmp1 = icmp ne <4 x i32> %tmp, zeroinitializer
	%tmp2 = bitcast <4 x i1> %tmp1 to i4			%tmp2 = bitcast <4 x i1> %tmp1 to i4
	%tmp3 = icmp eq i4 %tmp2, 0			%tmp3 = icmp eq i4 %tmp2, 0
	Show All 33 Lines
	; AVX2-NEXT: vmovmskps %ymm0, %eax			; AVX2-NEXT: vmovmskps %ymm0, %eax
	; AVX2-NEXT: cmpb $-1, %al			; AVX2-NEXT: cmpb $-1, %al
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; SKX-LABEL: allones_v8i32_and1:			; SKX-LABEL: allones_v8i32_and1:
	; SKX: # %bb.0:			; SKX: # %bb.0:
	; SKX-NEXT: vpbroadcastd {{.*#+}} ymm1 = [1,1,1,1,1,1,1,1]			; SKX-NEXT: vptestmd {{.*}}(%rip){1to8}, %ymm0, %k0
	; SKX-NEXT: vptestmd %ymm1, %ymm0, %k0
	; SKX-NEXT: kortestb %k0, %k0			; SKX-NEXT: kortestb %k0, %k0
	; SKX-NEXT: setb %al			; SKX-NEXT: setb %al
	; SKX-NEXT: vzeroupper			; SKX-NEXT: vzeroupper
	; SKX-NEXT: retq			; SKX-NEXT: retq
	%tmp = and <8 x i32> %arg, <i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1>			%tmp = and <8 x i32> %arg, <i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1>
	%tmp1 = icmp ne <8 x i32> %tmp, zeroinitializer			%tmp1 = icmp ne <8 x i32> %tmp, zeroinitializer
	%tmp2 = bitcast <8 x i1> %tmp1 to i8			%tmp2 = bitcast <8 x i1> %tmp1 to i8
	%tmp3 = icmp eq i8 %tmp2, -1			%tmp3 = icmp eq i8 %tmp2, -1
	Show All 33 Lines
	; AVX2-NEXT: vmovmskps %ymm0, %eax			; AVX2-NEXT: vmovmskps %ymm0, %eax
	; AVX2-NEXT: testb %al, %al			; AVX2-NEXT: testb %al, %al
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; SKX-LABEL: allzeros_v8i32_and1:			; SKX-LABEL: allzeros_v8i32_and1:
	; SKX: # %bb.0:			; SKX: # %bb.0:
	; SKX-NEXT: vpbroadcastd {{.*#+}} ymm1 = [1,1,1,1,1,1,1,1]			; SKX-NEXT: vptestmd {{.*}}(%rip){1to8}, %ymm0, %k0
	; SKX-NEXT: vptestmd %ymm1, %ymm0, %k0
	; SKX-NEXT: kortestb %k0, %k0			; SKX-NEXT: kortestb %k0, %k0
	; SKX-NEXT: sete %al			; SKX-NEXT: sete %al
	; SKX-NEXT: vzeroupper			; SKX-NEXT: vzeroupper
	; SKX-NEXT: retq			; SKX-NEXT: retq
	%tmp = and <8 x i32> %arg, <i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1>			%tmp = and <8 x i32> %arg, <i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1>
	%tmp1 = icmp ne <8 x i32> %tmp, zeroinitializer			%tmp1 = icmp ne <8 x i32> %tmp, zeroinitializer
	%tmp2 = bitcast <8 x i1> %tmp1 to i8			%tmp2 = bitcast <8 x i1> %tmp1 to i8
	%tmp3 = icmp eq i8 %tmp2, 0			%tmp3 = icmp eq i8 %tmp2, 0
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpmovmskb %xmm0, %eax			; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: cmpw $-1, %ax			; AVX2-NEXT: cmpw $-1, %ax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; SKX-LABEL: allones_v16i32_and1:			; SKX-LABEL: allones_v16i32_and1:
	; SKX: # %bb.0:			; SKX: # %bb.0:
	; SKX-NEXT: vpbroadcastd {{.*#+}} zmm1 = [1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]			; SKX-NEXT: vptestmd {{.*}}(%rip){1to16}, %zmm0, %k0
	; SKX-NEXT: vptestmd %zmm1, %zmm0, %k0
	; SKX-NEXT: kortestw %k0, %k0			; SKX-NEXT: kortestw %k0, %k0
	; SKX-NEXT: setb %al			; SKX-NEXT: setb %al
	; SKX-NEXT: vzeroupper			; SKX-NEXT: vzeroupper
	; SKX-NEXT: retq			; SKX-NEXT: retq
	%tmp = and <16 x i32> %arg, <i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1>			%tmp = and <16 x i32> %arg, <i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1>
	%tmp1 = icmp ne <16 x i32> %tmp, zeroinitializer			%tmp1 = icmp ne <16 x i32> %tmp, zeroinitializer
	%tmp2 = bitcast <16 x i1> %tmp1 to i16			%tmp2 = bitcast <16 x i1> %tmp1 to i16
	%tmp3 = icmp eq i16 %tmp2, -1			%tmp3 = icmp eq i16 %tmp2, -1
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpmovmskb %xmm0, %eax			; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: testw %ax, %ax			; AVX2-NEXT: testw %ax, %ax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; SKX-LABEL: allzeros_v16i32_and1:			; SKX-LABEL: allzeros_v16i32_and1:
	; SKX: # %bb.0:			; SKX: # %bb.0:
	; SKX-NEXT: vpbroadcastd {{.*#+}} zmm1 = [1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]			; SKX-NEXT: vptestmd {{.*}}(%rip){1to16}, %zmm0, %k0
	; SKX-NEXT: vptestmd %zmm1, %zmm0, %k0
	; SKX-NEXT: kortestw %k0, %k0			; SKX-NEXT: kortestw %k0, %k0
	; SKX-NEXT: sete %al			; SKX-NEXT: sete %al
	; SKX-NEXT: vzeroupper			; SKX-NEXT: vzeroupper
	; SKX-NEXT: retq			; SKX-NEXT: retq
	%tmp = and <16 x i32> %arg, <i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1>			%tmp = and <16 x i32> %arg, <i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1>
	%tmp1 = icmp ne <16 x i32> %tmp, zeroinitializer			%tmp1 = icmp ne <16 x i32> %tmp, zeroinitializer
	%tmp2 = bitcast <16 x i1> %tmp1 to i16			%tmp2 = bitcast <16 x i1> %tmp1 to i16
	%tmp3 = icmp eq i16 %tmp2, 0			%tmp3 = icmp eq i16 %tmp2, 0
	▲ Show 20 Lines • Show All 1,023 Lines • ▼ Show 20 Lines
	; AVX-NEXT: vpslld $29, %xmm0, %xmm0			; AVX-NEXT: vpslld $29, %xmm0, %xmm0
	; AVX-NEXT: vmovmskps %xmm0, %eax			; AVX-NEXT: vmovmskps %xmm0, %eax
	; AVX-NEXT: cmpb $15, %al			; AVX-NEXT: cmpb $15, %al
	; AVX-NEXT: sete %al			; AVX-NEXT: sete %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; SKX-LABEL: allones_v4i32_and4:			; SKX-LABEL: allones_v4i32_and4:
	; SKX: # %bb.0:			; SKX: # %bb.0:
	; SKX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [4,4,4,4]			; SKX-NEXT: vptestmd {{.*}}(%rip){1to4}, %xmm0, %k0
	; SKX-NEXT: vptestmd %xmm1, %xmm0, %k0
	; SKX-NEXT: kmovd %k0, %eax			; SKX-NEXT: kmovd %k0, %eax
	; SKX-NEXT: andb $15, %al			; SKX-NEXT: andb $15, %al
	; SKX-NEXT: cmpb $15, %al			; SKX-NEXT: cmpb $15, %al
	; SKX-NEXT: sete %al			; SKX-NEXT: sete %al
	; SKX-NEXT: retq			; SKX-NEXT: retq
	%tmp = and <4 x i32> %arg, <i32 4, i32 4, i32 4, i32 4>			%tmp = and <4 x i32> %arg, <i32 4, i32 4, i32 4, i32 4>
	%tmp1 = icmp ne <4 x i32> %tmp, zeroinitializer			%tmp1 = icmp ne <4 x i32> %tmp, zeroinitializer
	%tmp2 = bitcast <4 x i1> %tmp1 to i4			%tmp2 = bitcast <4 x i1> %tmp1 to i4
	Show All 15 Lines
	; AVX-NEXT: vpslld $29, %xmm0, %xmm0			; AVX-NEXT: vpslld $29, %xmm0, %xmm0
	; AVX-NEXT: vmovmskps %xmm0, %eax			; AVX-NEXT: vmovmskps %xmm0, %eax
	; AVX-NEXT: testb %al, %al			; AVX-NEXT: testb %al, %al
	; AVX-NEXT: sete %al			; AVX-NEXT: sete %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; SKX-LABEL: allzeros_v4i32_and4:			; SKX-LABEL: allzeros_v4i32_and4:
	; SKX: # %bb.0:			; SKX: # %bb.0:
	; SKX-NEXT: vpbroadcastd {{.*#+}} xmm1 = [4,4,4,4]			; SKX-NEXT: vptestmd {{.*}}(%rip){1to4}, %xmm0, %k0
	; SKX-NEXT: vptestmd %xmm1, %xmm0, %k0
	; SKX-NEXT: kmovd %k0, %eax			; SKX-NEXT: kmovd %k0, %eax
	; SKX-NEXT: testb $15, %al			; SKX-NEXT: testb $15, %al
	; SKX-NEXT: sete %al			; SKX-NEXT: sete %al
	; SKX-NEXT: retq			; SKX-NEXT: retq
	%tmp = and <4 x i32> %arg, <i32 4, i32 4, i32 4, i32 4>			%tmp = and <4 x i32> %arg, <i32 4, i32 4, i32 4, i32 4>
	%tmp1 = icmp ne <4 x i32> %tmp, zeroinitializer			%tmp1 = icmp ne <4 x i32> %tmp, zeroinitializer
	%tmp2 = bitcast <4 x i1> %tmp1 to i4			%tmp2 = bitcast <4 x i1> %tmp1 to i4
	%tmp3 = icmp eq i4 %tmp2, 0			%tmp3 = icmp eq i4 %tmp2, 0
	Show All 33 Lines
	; AVX2-NEXT: vmovmskps %ymm0, %eax			; AVX2-NEXT: vmovmskps %ymm0, %eax
	; AVX2-NEXT: cmpb $-1, %al			; AVX2-NEXT: cmpb $-1, %al
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; SKX-LABEL: allones_v8i32_and4:			; SKX-LABEL: allones_v8i32_and4:
	; SKX: # %bb.0:			; SKX: # %bb.0:
	; SKX-NEXT: vpbroadcastd {{.*#+}} ymm1 = [4,4,4,4,4,4,4,4]			; SKX-NEXT: vptestmd {{.*}}(%rip){1to8}, %ymm0, %k0
	; SKX-NEXT: vptestmd %ymm1, %ymm0, %k0
	; SKX-NEXT: kortestb %k0, %k0			; SKX-NEXT: kortestb %k0, %k0
	; SKX-NEXT: setb %al			; SKX-NEXT: setb %al
	; SKX-NEXT: vzeroupper			; SKX-NEXT: vzeroupper
	; SKX-NEXT: retq			; SKX-NEXT: retq
	%tmp = and <8 x i32> %arg, <i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>			%tmp = and <8 x i32> %arg, <i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>
	%tmp1 = icmp ne <8 x i32> %tmp, zeroinitializer			%tmp1 = icmp ne <8 x i32> %tmp, zeroinitializer
	%tmp2 = bitcast <8 x i1> %tmp1 to i8			%tmp2 = bitcast <8 x i1> %tmp1 to i8
	%tmp3 = icmp eq i8 %tmp2, -1			%tmp3 = icmp eq i8 %tmp2, -1
	Show All 33 Lines
	; AVX2-NEXT: vmovmskps %ymm0, %eax			; AVX2-NEXT: vmovmskps %ymm0, %eax
	; AVX2-NEXT: testb %al, %al			; AVX2-NEXT: testb %al, %al
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; SKX-LABEL: allzeros_v8i32_and4:			; SKX-LABEL: allzeros_v8i32_and4:
	; SKX: # %bb.0:			; SKX: # %bb.0:
	; SKX-NEXT: vpbroadcastd {{.*#+}} ymm1 = [4,4,4,4,4,4,4,4]			; SKX-NEXT: vptestmd {{.*}}(%rip){1to8}, %ymm0, %k0
	; SKX-NEXT: vptestmd %ymm1, %ymm0, %k0
	; SKX-NEXT: kortestb %k0, %k0			; SKX-NEXT: kortestb %k0, %k0
	; SKX-NEXT: sete %al			; SKX-NEXT: sete %al
	; SKX-NEXT: vzeroupper			; SKX-NEXT: vzeroupper
	; SKX-NEXT: retq			; SKX-NEXT: retq
	%tmp = and <8 x i32> %arg, <i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>			%tmp = and <8 x i32> %arg, <i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>
	%tmp1 = icmp ne <8 x i32> %tmp, zeroinitializer			%tmp1 = icmp ne <8 x i32> %tmp, zeroinitializer
	%tmp2 = bitcast <8 x i1> %tmp1 to i8			%tmp2 = bitcast <8 x i1> %tmp1 to i8
	%tmp3 = icmp eq i8 %tmp2, 0			%tmp3 = icmp eq i8 %tmp2, 0
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpmovmskb %xmm0, %eax			; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: cmpw $-1, %ax			; AVX2-NEXT: cmpw $-1, %ax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; SKX-LABEL: allones_v16i32_and4:			; SKX-LABEL: allones_v16i32_and4:
	; SKX: # %bb.0:			; SKX: # %bb.0:
	; SKX-NEXT: vpbroadcastd {{.*#+}} zmm1 = [4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4]			; SKX-NEXT: vptestmd {{.*}}(%rip){1to16}, %zmm0, %k0
	; SKX-NEXT: vptestmd %zmm1, %zmm0, %k0
	; SKX-NEXT: kortestw %k0, %k0			; SKX-NEXT: kortestw %k0, %k0
	; SKX-NEXT: setb %al			; SKX-NEXT: setb %al
	; SKX-NEXT: vzeroupper			; SKX-NEXT: vzeroupper
	; SKX-NEXT: retq			; SKX-NEXT: retq
	%tmp = and <16 x i32> %arg, <i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>			%tmp = and <16 x i32> %arg, <i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>
	%tmp1 = icmp ne <16 x i32> %tmp, zeroinitializer			%tmp1 = icmp ne <16 x i32> %tmp, zeroinitializer
	%tmp2 = bitcast <16 x i1> %tmp1 to i16			%tmp2 = bitcast <16 x i1> %tmp1 to i16
	%tmp3 = icmp eq i16 %tmp2, -1			%tmp3 = icmp eq i16 %tmp2, -1
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpmovmskb %xmm0, %eax			; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: testw %ax, %ax			; AVX2-NEXT: testw %ax, %ax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; SKX-LABEL: allzeros_v16i32_and4:			; SKX-LABEL: allzeros_v16i32_and4:
	; SKX: # %bb.0:			; SKX: # %bb.0:
	; SKX-NEXT: vpbroadcastd {{.*#+}} zmm1 = [4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4]			; SKX-NEXT: vptestmd {{.*}}(%rip){1to16}, %zmm0, %k0
	; SKX-NEXT: vptestmd %zmm1, %zmm0, %k0
	; SKX-NEXT: kortestw %k0, %k0			; SKX-NEXT: kortestw %k0, %k0
	; SKX-NEXT: sete %al			; SKX-NEXT: sete %al
	; SKX-NEXT: vzeroupper			; SKX-NEXT: vzeroupper
	; SKX-NEXT: retq			; SKX-NEXT: retq
	%tmp = and <16 x i32> %arg, <i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>			%tmp = and <16 x i32> %arg, <i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>
	%tmp1 = icmp ne <16 x i32> %tmp, zeroinitializer			%tmp1 = icmp ne <16 x i32> %tmp, zeroinitializer
	%tmp2 = bitcast <16 x i1> %tmp1 to i16			%tmp2 = bitcast <16 x i1> %tmp1 to i16
	%tmp3 = icmp eq i16 %tmp2, 0			%tmp3 = icmp eq i16 %tmp2, 0
	▲ Show 20 Lines • Show All 532 Lines • Show Last 20 Lines

test/CodeGen/X86/nontemporal-loads.ll

	Show First 20 Lines • Show All 1,794 Lines • ▼ Show 20 Lines
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	%1 = load <64 x i8>, <64 x i8>* %src, align 1, !nontemporal !1			%1 = load <64 x i8>, <64 x i8>* %src, align 1, !nontemporal !1
	ret <64 x i8> %1			ret <64 x i8> %1
	}			}

	define <16 x i32> @test_masked_v16i32(i8 * %addr, <16 x i32> %old, <16 x i32> %mask1) {			define <16 x i32> @test_masked_v16i32(i8 * %addr, <16 x i32> %old, <16 x i32> %mask1) {
	; SSE2-LABEL: test_masked_v16i32:			; SSE2-LABEL: test_masked_v16i32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: pxor %xmm8, %xmm8			; SSE2-NEXT: movdqa %xmm0, %xmm10
	; SSE2-NEXT: pcmpeqd %xmm8, %xmm7			; SSE2-NEXT: pxor %xmm12, %xmm12
	; SSE2-NEXT: pcmpeqd %xmm8, %xmm6			; SSE2-NEXT: pcmpeqd %xmm12, %xmm7
	; SSE2-NEXT: pcmpeqd %xmm8, %xmm5			; SSE2-NEXT: pcmpeqd %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqd %xmm8, %xmm4			; SSE2-NEXT: movdqa %xmm7, %xmm8
	; SSE2-NEXT: pand %xmm4, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm8
				; SSE2-NEXT: pcmpeqd %xmm12, %xmm6
				; SSE2-NEXT: movdqa %xmm6, %xmm9
				; SSE2-NEXT: pxor %xmm0, %xmm9
				; SSE2-NEXT: pcmpeqd %xmm12, %xmm5
				; SSE2-NEXT: movdqa %xmm5, %xmm11
				; SSE2-NEXT: pxor %xmm0, %xmm11
				; SSE2-NEXT: pcmpeqd %xmm12, %xmm4
				; SSE2-NEXT: pxor %xmm4, %xmm0
	; SSE2-NEXT: pandn (%rdi), %xmm4			; SSE2-NEXT: pandn (%rdi), %xmm4
				; SSE2-NEXT: pandn %xmm10, %xmm0
	; SSE2-NEXT: por %xmm4, %xmm0			; SSE2-NEXT: por %xmm4, %xmm0
	; SSE2-NEXT: pand %xmm5, %xmm1
	; SSE2-NEXT: pandn 16(%rdi), %xmm5			; SSE2-NEXT: pandn 16(%rdi), %xmm5
	; SSE2-NEXT: por %xmm5, %xmm1			; SSE2-NEXT: pandn %xmm1, %xmm11
	; SSE2-NEXT: pand %xmm6, %xmm2			; SSE2-NEXT: por %xmm5, %xmm11
	; SSE2-NEXT: pandn 32(%rdi), %xmm6			; SSE2-NEXT: pandn 32(%rdi), %xmm6
	; SSE2-NEXT: por %xmm6, %xmm2			; SSE2-NEXT: pandn %xmm2, %xmm9
	; SSE2-NEXT: pand %xmm7, %xmm3			; SSE2-NEXT: por %xmm6, %xmm9
	; SSE2-NEXT: pandn 48(%rdi), %xmm7			; SSE2-NEXT: pandn 48(%rdi), %xmm7
	; SSE2-NEXT: por %xmm7, %xmm3			; SSE2-NEXT: pandn %xmm3, %xmm8
				; SSE2-NEXT: por %xmm7, %xmm8
				; SSE2-NEXT: movdqa %xmm11, %xmm1
				; SSE2-NEXT: movdqa %xmm9, %xmm2
				; SSE2-NEXT: movdqa %xmm8, %xmm3
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_masked_v16i32:			; SSE41-LABEL: test_masked_v16i32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm8			; SSE41-NEXT: movdqa %xmm0, %xmm8
	; SSE41-NEXT: pxor %xmm0, %xmm0			; SSE41-NEXT: pxor %xmm0, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm7			; SSE41-NEXT: pcmpeqd %xmm0, %xmm7
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm9			; SSE41-NEXT: pcmpeqd %xmm9, %xmm9
	▲ Show 20 Lines • Show All 107 Lines • Show Last 20 Lines

test/CodeGen/X86/psubus.ll

	Show First 20 Lines • Show All 525 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[2,3,0,1]
	; SSE41-NEXT: pmovzxwd {{.*#+}} xmm3 = xmm3[0],zero,xmm3[1],zero,xmm3[2],zero,xmm3[3],zero			; SSE41-NEXT: pmovzxwd {{.*#+}} xmm3 = xmm3[0],zero,xmm3[1],zero,xmm3[2],zero,xmm3[3],zero
	; SSE41-NEXT: pmovzxwd {{.*#+}} xmm4 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero			; SSE41-NEXT: pmovzxwd {{.*#+}} xmm4 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
	; SSE41-NEXT: movdqa %xmm4, %xmm0			; SSE41-NEXT: movdqa %xmm4, %xmm0
	; SSE41-NEXT: pmaxud %xmm1, %xmm0			; SSE41-NEXT: pmaxud %xmm1, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm4, %xmm0			; SSE41-NEXT: pcmpeqd %xmm4, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm5, %xmm5			; SSE41-NEXT: pcmpeqd %xmm5, %xmm5
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15]			; SSE41-NEXT: movdqa %xmm3, %xmm6
	; SSE41-NEXT: pshufb %xmm6, %xmm0			; SSE41-NEXT: pmaxud %xmm2, %xmm6
	; SSE41-NEXT: movdqa %xmm3, %xmm7			; SSE41-NEXT: pcmpeqd %xmm3, %xmm6
	; SSE41-NEXT: pmaxud %xmm2, %xmm7			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm7			; SSE41-NEXT: packssdw %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm7
	; SSE41-NEXT: pshufb %xmm6, %xmm7
	; SSE41-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm7[0]
	; SSE41-NEXT: psubd %xmm2, %xmm3			; SSE41-NEXT: psubd %xmm2, %xmm3
	; SSE41-NEXT: psubd %xmm1, %xmm4			; SSE41-NEXT: psubd %xmm1, %xmm4
	; SSE41-NEXT: pshufb %xmm6, %xmm4			; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15]
	; SSE41-NEXT: pshufb %xmm6, %xmm3			; SSE41-NEXT: pshufb %xmm1, %xmm4
				; SSE41-NEXT: pshufb %xmm1, %xmm3
	; SSE41-NEXT: punpcklqdq {{.*#+}} xmm4 = xmm4[0],xmm3[0]			; SSE41-NEXT: punpcklqdq {{.*#+}} xmm4 = xmm4[0],xmm3[0]
	; SSE41-NEXT: pandn %xmm4, %xmm0			; SSE41-NEXT: pandn %xmm4, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test13:			; AVX1-LABEL: test13:
	; AVX1: # %bb.0: # %vector.ph			; AVX1: # %bb.0: # %vector.ph
	; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm0[2,3,0,1]			; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm0[2,3,0,1]
	; AVX1-NEXT: vpmovzxwd {{.*#+}} xmm2 = xmm2[0],zero,xmm2[1],zero,xmm2[2],zero,xmm2[3],zero			; AVX1-NEXT: vpmovzxwd {{.*#+}} xmm2 = xmm2[0],zero,xmm2[1],zero,xmm2[2],zero,xmm2[3],zero
	▲ Show 20 Lines • Show All 357 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[2,3,0,1]
	; SSE41-NEXT: pmovzxwd {{.*#+}} xmm3 = xmm3[0],zero,xmm3[1],zero,xmm3[2],zero,xmm3[3],zero			; SSE41-NEXT: pmovzxwd {{.*#+}} xmm3 = xmm3[0],zero,xmm3[1],zero,xmm3[2],zero,xmm3[3],zero
	; SSE41-NEXT: pmovzxwd {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero			; SSE41-NEXT: pmovzxwd {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pminud %xmm1, %xmm4			; SSE41-NEXT: pminud %xmm1, %xmm4
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm4			; SSE41-NEXT: pcmpeqd %xmm0, %xmm4
	; SSE41-NEXT: pcmpeqd %xmm5, %xmm5			; SSE41-NEXT: pcmpeqd %xmm5, %xmm5
	; SSE41-NEXT: pxor %xmm5, %xmm4			; SSE41-NEXT: pxor %xmm5, %xmm4
	; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15]			; SSE41-NEXT: movdqa %xmm3, %xmm6
	; SSE41-NEXT: pshufb %xmm6, %xmm4			; SSE41-NEXT: pminud %xmm2, %xmm6
	; SSE41-NEXT: movdqa %xmm3, %xmm7			; SSE41-NEXT: pcmpeqd %xmm3, %xmm6
	; SSE41-NEXT: pminud %xmm2, %xmm7			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm7			; SSE41-NEXT: packssdw %xmm6, %xmm4
	; SSE41-NEXT: pxor %xmm5, %xmm7
	; SSE41-NEXT: pshufb %xmm6, %xmm7
	; SSE41-NEXT: punpcklqdq {{.*#+}} xmm4 = xmm4[0],xmm7[0]
	; SSE41-NEXT: psubd %xmm2, %xmm3			; SSE41-NEXT: psubd %xmm2, %xmm3
	; SSE41-NEXT: psubd %xmm1, %xmm0			; SSE41-NEXT: psubd %xmm1, %xmm0
	; SSE41-NEXT: pshufb %xmm6, %xmm0			; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15]
	; SSE41-NEXT: pshufb %xmm6, %xmm3			; SSE41-NEXT: pshufb %xmm1, %xmm0
				; SSE41-NEXT: pshufb %xmm1, %xmm3
	; SSE41-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm3[0]			; SSE41-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm3[0]
	; SSE41-NEXT: pand %xmm4, %xmm0			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test15:			; AVX1-LABEL: test15:
	; AVX1: # %bb.0: # %vector.ph			; AVX1: # %bb.0: # %vector.ph
	; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm0[2,3,0,1]			; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm0[2,3,0,1]
	; AVX1-NEXT: vpmovzxwd {{.*#+}} xmm2 = xmm2[0],zero,xmm2[1],zero,xmm2[2],zero,xmm2[3],zero			; AVX1-NEXT: vpmovzxwd {{.*#+}} xmm2 = xmm2[0],zero,xmm2[1],zero,xmm2[2],zero,xmm2[3],zero
	▲ Show 20 Lines • Show All 108 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[2,3,0,1]
	; SSE41-NEXT: pmovzxwd {{.*#+}} xmm3 = xmm3[0],zero,xmm3[1],zero,xmm3[2],zero,xmm3[3],zero			; SSE41-NEXT: pmovzxwd {{.*#+}} xmm3 = xmm3[0],zero,xmm3[1],zero,xmm3[2],zero,xmm3[3],zero
	; SSE41-NEXT: pmovzxwd {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero			; SSE41-NEXT: pmovzxwd {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pmaxud %xmm0, %xmm4			; SSE41-NEXT: pmaxud %xmm0, %xmm4
	; SSE41-NEXT: pcmpeqd %xmm1, %xmm4			; SSE41-NEXT: pcmpeqd %xmm1, %xmm4
	; SSE41-NEXT: pcmpeqd %xmm5, %xmm5			; SSE41-NEXT: pcmpeqd %xmm5, %xmm5
	; SSE41-NEXT: pxor %xmm5, %xmm4			; SSE41-NEXT: pxor %xmm5, %xmm4
	; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15]			; SSE41-NEXT: movdqa %xmm2, %xmm6
	; SSE41-NEXT: pshufb %xmm6, %xmm4			; SSE41-NEXT: pmaxud %xmm3, %xmm6
	; SSE41-NEXT: movdqa %xmm2, %xmm7			; SSE41-NEXT: pcmpeqd %xmm2, %xmm6
	; SSE41-NEXT: pmaxud %xmm3, %xmm7			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: pcmpeqd %xmm2, %xmm7			; SSE41-NEXT: packssdw %xmm6, %xmm4
	; SSE41-NEXT: pxor %xmm5, %xmm7
	; SSE41-NEXT: pshufb %xmm6, %xmm7
	; SSE41-NEXT: punpcklqdq {{.*#+}} xmm4 = xmm4[0],xmm7[0]
	; SSE41-NEXT: psubd %xmm2, %xmm3			; SSE41-NEXT: psubd %xmm2, %xmm3
	; SSE41-NEXT: psubd %xmm1, %xmm0			; SSE41-NEXT: psubd %xmm1, %xmm0
	; SSE41-NEXT: pshufb %xmm6, %xmm0			; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15]
	; SSE41-NEXT: pshufb %xmm6, %xmm3			; SSE41-NEXT: pshufb %xmm1, %xmm0
				; SSE41-NEXT: pshufb %xmm1, %xmm3
	; SSE41-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm3[0]			; SSE41-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm3[0]
	; SSE41-NEXT: pand %xmm4, %xmm0			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test16:			; AVX1-LABEL: test16:
	; AVX1: # %bb.0: # %vector.ph			; AVX1: # %bb.0: # %vector.ph
	; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm0[2,3,0,1]			; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm0[2,3,0,1]
	; AVX1-NEXT: vpmovzxwd {{.*#+}} xmm2 = xmm2[0],zero,xmm2[1],zero,xmm2[2],zero,xmm2[3],zero			; AVX1-NEXT: vpmovzxwd {{.*#+}} xmm2 = xmm2[0],zero,xmm2[1],zero,xmm2[2],zero,xmm2[3],zero
	▲ Show 20 Lines • Show All 1,364 Lines • Show Last 20 Lines

test/CodeGen/X86/sat-add.ll

Show First 20 Lines • Show All 740 Lines • ▼ Show 20 Lines	; SSE41-NEXT: retq
%r = select <8 x i1> %c, <8 x i16> <i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1>, <8 x i16> %a		%r = select <8 x i1> %c, <8 x i16> <i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1>, <8 x i16> %a
ret <8 x i16> %r		ret <8 x i16> %r
}		}

define <4 x i32> @unsigned_sat_variable_v4i32_using_min(<4 x i32> %x, <4 x i32> %y) {		define <4 x i32> @unsigned_sat_variable_v4i32_using_min(<4 x i32> %x, <4 x i32> %y) {
; SSE2-LABEL: unsigned_sat_variable_v4i32_using_min:		; SSE2-LABEL: unsigned_sat_variable_v4i32_using_min:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: pcmpeqd %xmm2, %xmm2		; SSE2-NEXT: pcmpeqd %xmm2, %xmm2
; SSE2-NEXT: pxor %xmm1, %xmm2
; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648,2147483648,2147483648]		; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648,2147483648,2147483648]
; SSE2-NEXT: pxor %xmm0, %xmm3		; SSE2-NEXT: pxor %xmm0, %xmm3
; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [2147483647,2147483647,2147483647,2147483647]		; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [2147483647,2147483647,2147483647,2147483647]
; SSE2-NEXT: pxor %xmm1, %xmm4		; SSE2-NEXT: pxor %xmm1, %xmm4
; SSE2-NEXT: pcmpgtd %xmm3, %xmm4		; SSE2-NEXT: pcmpgtd %xmm3, %xmm4
; SSE2-NEXT: pand %xmm4, %xmm0		; SSE2-NEXT: pand %xmm4, %xmm0
; SSE2-NEXT: pandn %xmm2, %xmm4		; SSE2-NEXT: pxor %xmm2, %xmm4
; SSE2-NEXT: por %xmm4, %xmm0		; SSE2-NEXT: movdqa %xmm1, %xmm2
		craig.topperAuthorUnsubmitted Not Done Reply Inline Actions This looks like we have an and with 2 not operands and we're now folding a different one to andn. I expect instcombine would have pulled the nots through the and so this is probably not a realistic case. craig.topper: This looks like we have an and with 2 not operands and we're now folding a different one to…
		; SSE2-NEXT: pandn %xmm4, %xmm2
		; SSE2-NEXT: por %xmm2, %xmm0
; SSE2-NEXT: paddd %xmm1, %xmm0		; SSE2-NEXT: paddd %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: unsigned_sat_variable_v4i32_using_min:		; SSE41-LABEL: unsigned_sat_variable_v4i32_using_min:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: pcmpeqd %xmm2, %xmm2		; SSE41-NEXT: pcmpeqd %xmm2, %xmm2
; SSE41-NEXT: pxor %xmm1, %xmm2		; SSE41-NEXT: pxor %xmm1, %xmm2
; SSE41-NEXT: pminud %xmm2, %xmm0		; SSE41-NEXT: pminud %xmm2, %xmm0
▲ Show 20 Lines • Show All 165 Lines • Show Last 20 Lines

test/CodeGen/X86/sse-intrinsics-fast-isel.ll

	Show First 20 Lines • Show All 73 Lines • ▼ Show 20 Lines
	define <4 x float> @test_mm_andnot_ps(<4 x float> %a0, <4 x float> %a1) nounwind {			define <4 x float> @test_mm_andnot_ps(<4 x float> %a0, <4 x float> %a1) nounwind {
	; SSE-LABEL: test_mm_andnot_ps:			; SSE-LABEL: test_mm_andnot_ps:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: andnps %xmm1, %xmm0 # encoding: [0x0f,0x55,0xc1]			; SSE-NEXT: andnps %xmm1, %xmm0 # encoding: [0x0f,0x55,0xc1]
	; SSE-NEXT: ret{{[l\|q]}} # encoding: [0xc3]			; SSE-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
	;			;
	; AVX1-LABEL: test_mm_andnot_ps:			; AVX1-LABEL: test_mm_andnot_ps:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vandnps %xmm1, %xmm0, %xmm0 # encoding: [0xc5,0xf8,0x55,0xc1]			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2 # encoding: [0xc5,0xe9,0x76,0xd2]
				; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm0 # encoding: [0xc5,0xf9,0xef,0xc2]
				; AVX1-NEXT: vpand %xmm1, %xmm0, %xmm0 # encoding: [0xc5,0xf9,0xdb,0xc1]
	; AVX1-NEXT: ret{{[l\|q]}} # encoding: [0xc3]			; AVX1-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
	;			;
	; AVX512-LABEL: test_mm_andnot_ps:			; AVX512-LABEL: test_mm_andnot_ps:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vandnps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x55,0xc1]			; AVX512-NEXT: vpternlogq $15, %xmm0, %xmm0, %xmm0 # encoding: [0x62,0xf3,0xfd,0x08,0x25,0xc0,0x0f]
				; AVX512-NEXT: vpand %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf9,0xdb,0xc1]
	; AVX512-NEXT: ret{{[l\|q]}} # encoding: [0xc3]			; AVX512-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
	%arg0 = bitcast <4 x float> %a0 to <4 x i32>			%arg0 = bitcast <4 x float> %a0 to <4 x i32>
	%arg1 = bitcast <4 x float> %a1 to <4 x i32>			%arg1 = bitcast <4 x float> %a1 to <4 x i32>
	%not = xor <4 x i32> %arg0, <i32 -1, i32 -1, i32 -1, i32 -1>			%not = xor <4 x i32> %arg0, <i32 -1, i32 -1, i32 -1, i32 -1>
	%res = and <4 x i32> %not, %arg1			%res = and <4 x i32> %not, %arg1
	%bc = bitcast <4 x i32> %res to <4 x float>			%bc = bitcast <4 x i32> %res to <4 x float>
	ret <4 x float> %bc			ret <4 x float> %bc
	}			}
	▲ Show 20 Lines • Show All 3,395 Lines • Show Last 20 Lines

test/CodeGen/X86/sse2-intrinsics-fast-isel.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 266 Lines • ▼ Show 20 Lines
	; AVX512-NEXT: ret{{[l\|q]}} # encoding: [0xc3]			; AVX512-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
	%res = and <2 x i64> %a0, %a1			%res = and <2 x i64> %a0, %a1
	ret <2 x i64> %res			ret <2 x i64> %res
	}			}

	define <2 x double> @test_mm_andnot_pd(<2 x double> %a0, <2 x double> %a1) nounwind {			define <2 x double> @test_mm_andnot_pd(<2 x double> %a0, <2 x double> %a1) nounwind {
	; SSE-LABEL: test_mm_andnot_pd:			; SSE-LABEL: test_mm_andnot_pd:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: andnps %xmm1, %xmm0 # encoding: [0x0f,0x55,0xc1]			; SSE-NEXT: pcmpeqd %xmm2, %xmm2 # encoding: [0x66,0x0f,0x76,0xd2]
				; SSE-NEXT: pxor %xmm2, %xmm0 # encoding: [0x66,0x0f,0xef,0xc2]
				; SSE-NEXT: pand %xmm1, %xmm0 # encoding: [0x66,0x0f,0xdb,0xc1]
	; SSE-NEXT: ret{{[l\|q]}} # encoding: [0xc3]			; SSE-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
	;			;
	; AVX1-LABEL: test_mm_andnot_pd:			; AVX1-LABEL: test_mm_andnot_pd:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vandnps %xmm1, %xmm0, %xmm0 # encoding: [0xc5,0xf8,0x55,0xc1]			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2 # encoding: [0xc5,0xe9,0x76,0xd2]
				; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm0 # encoding: [0xc5,0xf9,0xef,0xc2]
				; AVX1-NEXT: vpand %xmm1, %xmm0, %xmm0 # encoding: [0xc5,0xf9,0xdb,0xc1]
	; AVX1-NEXT: ret{{[l\|q]}} # encoding: [0xc3]			; AVX1-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
	;			;
	; AVX512-LABEL: test_mm_andnot_pd:			; AVX512-LABEL: test_mm_andnot_pd:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vandnps %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf8,0x55,0xc1]			; AVX512-NEXT: vpternlogq $15, %xmm0, %xmm0, %xmm0 # encoding: [0x62,0xf3,0xfd,0x08,0x25,0xc0,0x0f]
				; AVX512-NEXT: vpand %xmm1, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc5,0xf9,0xdb,0xc1]
	; AVX512-NEXT: ret{{[l\|q]}} # encoding: [0xc3]			; AVX512-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
	%arg0 = bitcast <2 x double> %a0 to <4 x i32>			%arg0 = bitcast <2 x double> %a0 to <4 x i32>
	%arg1 = bitcast <2 x double> %a1 to <4 x i32>			%arg1 = bitcast <2 x double> %a1 to <4 x i32>
	%not = xor <4 x i32> %arg0, <i32 -1, i32 -1, i32 -1, i32 -1>			%not = xor <4 x i32> %arg0, <i32 -1, i32 -1, i32 -1, i32 -1>
	%res = and <4 x i32> %not, %arg1			%res = and <4 x i32> %not, %arg1
	%bc = bitcast <4 x i32> %res to <2 x double>			%bc = bitcast <4 x i32> %res to <2 x double>
	ret <2 x double> %bc			ret <2 x double> %bc
	}			}
	▲ Show 20 Lines • Show All 6,446 Lines • Show Last 20 Lines

test/CodeGen/X86/unfold-masked-merge-vector-variablemask-const.ll

	Show First 20 Lines • Show All 126 Lines • ▼ Show 20 Lines
	; CHECK-SSE1-NEXT: xorps %xmm1, %xmm2			; CHECK-SSE1-NEXT: xorps %xmm1, %xmm2
	; CHECK-SSE1-NEXT: andnps %xmm2, %xmm0			; CHECK-SSE1-NEXT: andnps %xmm2, %xmm0
	; CHECK-SSE1-NEXT: xorps %xmm1, %xmm0			; CHECK-SSE1-NEXT: xorps %xmm1, %xmm0
	; CHECK-SSE1-NEXT: movaps %xmm0, (%rdi)			; CHECK-SSE1-NEXT: movaps %xmm0, (%rdi)
	; CHECK-SSE1-NEXT: retq			; CHECK-SSE1-NEXT: retq
	;			;
	; CHECK-SSE2-LABEL: in_constant_varx_mone_invmask:			; CHECK-SSE2-LABEL: in_constant_varx_mone_invmask:
	; CHECK-SSE2: # %bb.0:			; CHECK-SSE2: # %bb.0:
	; CHECK-SSE2-NEXT: movdqa (%rdx), %xmm0			; CHECK-SSE2-NEXT: movdqa (%rdi), %xmm0
	; CHECK-SSE2-NEXT: pcmpeqd %xmm1, %xmm1			; CHECK-SSE2-NEXT: pcmpeqd %xmm1, %xmm1
	; CHECK-SSE2-NEXT: movdqa (%rdi), %xmm2			; CHECK-SSE2-NEXT: movdqa (%rdx), %xmm2
	; CHECK-SSE2-NEXT: pxor %xmm1, %xmm2			; CHECK-SSE2-NEXT: pxor %xmm1, %xmm2
	; CHECK-SSE2-NEXT: pandn %xmm2, %xmm0			; CHECK-SSE2-NEXT: pandn %xmm2, %xmm0
	; CHECK-SSE2-NEXT: pxor %xmm1, %xmm0			; CHECK-SSE2-NEXT: pxor %xmm1, %xmm0
	; CHECK-SSE2-NEXT: retq			; CHECK-SSE2-NEXT: retq
	;			;
	; CHECK-XOP-LABEL: in_constant_varx_mone_invmask:			; CHECK-XOP-LABEL: in_constant_varx_mone_invmask:
	; CHECK-XOP: # %bb.0:			; CHECK-XOP: # %bb.0:
	; CHECK-XOP-NEXT: vmovdqa (%rdx), %xmm0			; CHECK-XOP-NEXT: vmovdqa (%rdi), %xmm0
	; CHECK-XOP-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; CHECK-XOP-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; CHECK-XOP-NEXT: vpxor (%rdi), %xmm1, %xmm2			; CHECK-XOP-NEXT: vpxor (%rdx), %xmm1, %xmm2
	; CHECK-XOP-NEXT: vpandn %xmm2, %xmm0, %xmm0			; CHECK-XOP-NEXT: vpandn %xmm2, %xmm0, %xmm0
	; CHECK-XOP-NEXT: vpxor %xmm1, %xmm0, %xmm0			; CHECK-XOP-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; CHECK-XOP-NEXT: retq			; CHECK-XOP-NEXT: retq
	%x = load <4 x i32>, <4 x i32> *%px, align 16			%x = load <4 x i32>, <4 x i32> *%px, align 16
	%y = load <4 x i32>, <4 x i32> *%py, align 16			%y = load <4 x i32>, <4 x i32> *%py, align 16
	%mask = load <4 x i32>, <4 x i32> *%pmask, align 16			%mask = load <4 x i32>, <4 x i32> *%pmask, align 16
	%notmask = xor <4 x i32> %mask, <i32 -1, i32 -1, i32 -1, i32 -1>			%notmask = xor <4 x i32> %mask, <i32 -1, i32 -1, i32 -1, i32 -1>
	%n0 = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1> ; %x			%n0 = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1> ; %x
	▲ Show 20 Lines • Show All 451 Lines • Show Last 20 Lines

test/CodeGen/X86/vec-copysign-avx512.ll

Show All 37 Lines	; AVX512VLDQ-NEXT: retq
ret <8 x float> %tmp		ret <8 x float> %tmp
}		}

define <16 x float> @v16f32(<16 x float> %a, <16 x float> %b) nounwind {		define <16 x float> @v16f32(<16 x float> %a, <16 x float> %b) nounwind {
; AVX512VL-LABEL: v16f32:		; AVX512VL-LABEL: v16f32:
; AVX512VL: ## %bb.0:		; AVX512VL: ## %bb.0:
; AVX512VL-NEXT: vpandd {{.*}}(%rip){1to16}, %zmm1, %zmm1		; AVX512VL-NEXT: vpandd {{.*}}(%rip){1to16}, %zmm1, %zmm1
; AVX512VL-NEXT: vpandd {{.*}}(%rip){1to16}, %zmm0, %zmm0		; AVX512VL-NEXT: vpandd {{.*}}(%rip){1to16}, %zmm0, %zmm0
; AVX512VL-NEXT: vporq %zmm1, %zmm0, %zmm0		; AVX512VL-NEXT: vpord %zmm1, %zmm0, %zmm0
; AVX512VL-NEXT: retq		; AVX512VL-NEXT: retq
;		;
; AVX512VLDQ-LABEL: v16f32:		; AVX512VLDQ-LABEL: v16f32:
; AVX512VLDQ: ## %bb.0:		; AVX512VLDQ: ## %bb.0:
; AVX512VLDQ-NEXT: vandps {{.*}}(%rip){1to16}, %zmm1, %zmm1		; AVX512VLDQ-NEXT: vandps {{.*}}(%rip){1to16}, %zmm1, %zmm1
; AVX512VLDQ-NEXT: vandps {{.*}}(%rip){1to16}, %zmm0, %zmm0		; AVX512VLDQ-NEXT: vandps {{.*}}(%rip){1to16}, %zmm0, %zmm0
; AVX512VLDQ-NEXT: vorps %zmm1, %zmm0, %zmm0		; AVX512VLDQ-NEXT: vorps %zmm1, %zmm0, %zmm0
; AVX512VLDQ-NEXT: retq		; AVX512VLDQ-NEXT: retq
▲ Show 20 Lines • Show All 58 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-bitreverse.ll

	Show First 20 Lines • Show All 2,040 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpor %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpor %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: test_bitreverse_v16i32:			; AVX512F-LABEL: test_bitreverse_v16i32:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpsrld $24, %zmm0, %zmm1			; AVX512F-NEXT: vpsrld $24, %zmm0, %zmm1
	; AVX512F-NEXT: vpsrld $8, %zmm0, %zmm2			; AVX512F-NEXT: vpsrld $8, %zmm0, %zmm2
	; AVX512F-NEXT: vpandd {{.*}}(%rip){1to16}, %zmm2, %zmm2			; AVX512F-NEXT: vpandd {{.*}}(%rip){1to16}, %zmm2, %zmm2
	; AVX512F-NEXT: vporq %zmm1, %zmm2, %zmm1			; AVX512F-NEXT: vpord %zmm1, %zmm2, %zmm1
	; AVX512F-NEXT: vpslld $24, %zmm0, %zmm2			; AVX512F-NEXT: vpslld $24, %zmm0, %zmm2
	; AVX512F-NEXT: vpslld $8, %zmm0, %zmm0			; AVX512F-NEXT: vpslld $8, %zmm0, %zmm0
	; AVX512F-NEXT: vpandd {{.*}}(%rip){1to16}, %zmm0, %zmm0			; AVX512F-NEXT: vpandd {{.*}}(%rip){1to16}, %zmm0, %zmm0
	; AVX512F-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512F-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512F-NEXT: vporq %zmm0, %zmm2, %zmm0			; AVX512F-NEXT: vpord %zmm0, %zmm2, %zmm0
	; AVX512F-NEXT: vpandd {{.*}}(%rip){1to16}, %zmm0, %zmm1			; AVX512F-NEXT: vpandd {{.*}}(%rip){1to16}, %zmm0, %zmm1
	; AVX512F-NEXT: vpslld $4, %zmm1, %zmm1			; AVX512F-NEXT: vpslld $4, %zmm1, %zmm1
	; AVX512F-NEXT: vpandd {{.*}}(%rip){1to16}, %zmm0, %zmm0			; AVX512F-NEXT: vpandd {{.*}}(%rip){1to16}, %zmm0, %zmm0
	; AVX512F-NEXT: vpsrld $4, %zmm0, %zmm0			; AVX512F-NEXT: vpsrld $4, %zmm0, %zmm0
	; AVX512F-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512F-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512F-NEXT: vpandd {{.*}}(%rip){1to16}, %zmm0, %zmm1			; AVX512F-NEXT: vpandd {{.*}}(%rip){1to16}, %zmm0, %zmm1
	; AVX512F-NEXT: vpslld $2, %zmm1, %zmm1			; AVX512F-NEXT: vpslld $2, %zmm1, %zmm1
	; AVX512F-NEXT: vpandd {{.*}}(%rip){1to16}, %zmm0, %zmm0			; AVX512F-NEXT: vpandd {{.*}}(%rip){1to16}, %zmm0, %zmm0
	; AVX512F-NEXT: vpsrld $2, %zmm0, %zmm0			; AVX512F-NEXT: vpsrld $2, %zmm0, %zmm0
	; AVX512F-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512F-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512F-NEXT: vpandd {{.*}}(%rip){1to16}, %zmm0, %zmm1			; AVX512F-NEXT: vpandd {{.*}}(%rip){1to16}, %zmm0, %zmm1
	; AVX512F-NEXT: vpslld $1, %zmm1, %zmm1			; AVX512F-NEXT: vpslld $1, %zmm1, %zmm1
	; AVX512F-NEXT: vpandd {{.*}}(%rip){1to16}, %zmm0, %zmm0			; AVX512F-NEXT: vpandd {{.*}}(%rip){1to16}, %zmm0, %zmm0
	; AVX512F-NEXT: vpsrld $1, %zmm0, %zmm0			; AVX512F-NEXT: vpsrld $1, %zmm0, %zmm0
	; AVX512F-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512F-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512BW-LABEL: test_bitreverse_v16i32:			; AVX512BW-LABEL: test_bitreverse_v16i32:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpshufb {{.*#+}} zmm0 = zmm0[3,2,1,0,7,6,5,4,11,10,9,8,15,14,13,12,19,18,17,16,23,22,21,20,27,26,25,24,31,30,29,28,35,34,33,32,39,38,37,36,43,42,41,40,47,46,45,44,51,50,49,48,55,54,53,52,59,58,57,56,63,62,61,60]			; AVX512BW-NEXT: vpshufb {{.*#+}} zmm0 = zmm0[3,2,1,0,7,6,5,4,11,10,9,8,15,14,13,12,19,18,17,16,23,22,21,20,27,26,25,24,31,30,29,28,35,34,33,32,39,38,37,36,43,42,41,40,47,46,45,44,51,50,49,48,55,54,53,52,59,58,57,56,63,62,61,60]
	; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm2			; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm2
	; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm3 = [0,128,64,192,32,160,96,224,16,144,80,208,48,176,112,240,0,128,64,192,32,160,96,224,16,144,80,208,48,176,112,240,0,128,64,192,32,160,96,224,16,144,80,208,48,176,112,240,0,128,64,192,32,160,96,224,16,144,80,208,48,176,112,240]			; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm3 = [0,128,64,192,32,160,96,224,16,144,80,208,48,176,112,240,0,128,64,192,32,160,96,224,16,144,80,208,48,176,112,240,0,128,64,192,32,160,96,224,16,144,80,208,48,176,112,240,0,128,64,192,32,160,96,224,16,144,80,208,48,176,112,240]
	▲ Show 20 Lines • Show All 483 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-lzcnt-512.ll

	Show All 23 Lines
	; AVX512BW-NEXT: vpsrlq $4, %zmm0, %zmm1			; AVX512BW-NEXT: vpsrlq $4, %zmm0, %zmm1
	; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsrlq $8, %zmm0, %zmm1			; AVX512BW-NEXT: vpsrlq $8, %zmm0, %zmm1
	; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsrlq $16, %zmm0, %zmm1			; AVX512BW-NEXT: vpsrlq $16, %zmm0, %zmm1
	; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsrlq $32, %zmm0, %zmm1			; AVX512BW-NEXT: vpsrlq $32, %zmm0, %zmm1
	; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0
				; AVX512BW-NEXT: vpternlogq $15, %zmm0, %zmm0, %zmm0
	; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; AVX512BW-NEXT: vpandnq %zmm1, %zmm0, %zmm2			; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm2
	; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX512BW-NEXT: vpshufb %zmm2, %zmm3, %zmm2			; AVX512BW-NEXT: vpshufb %zmm2, %zmm3, %zmm2
	; AVX512BW-NEXT: vpternlogq $15, %zmm0, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsrlw $4, %zmm0, %zmm0			; AVX512BW-NEXT: vpsrlw $4, %zmm0, %zmm0
	; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpshufb %zmm0, %zmm3, %zmm0			; AVX512BW-NEXT: vpshufb %zmm0, %zmm3, %zmm0
	; AVX512BW-NEXT: vpaddb %zmm2, %zmm0, %zmm0			; AVX512BW-NEXT: vpaddb %zmm2, %zmm0, %zmm0
	; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512BW-NEXT: vpsadbw %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpsadbw %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	; AVX512BW-NEXT: vpsrlq $4, %zmm0, %zmm1			; AVX512BW-NEXT: vpsrlq $4, %zmm0, %zmm1
	; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsrlq $8, %zmm0, %zmm1			; AVX512BW-NEXT: vpsrlq $8, %zmm0, %zmm1
	; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsrlq $16, %zmm0, %zmm1			; AVX512BW-NEXT: vpsrlq $16, %zmm0, %zmm1
	; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsrlq $32, %zmm0, %zmm1			; AVX512BW-NEXT: vpsrlq $32, %zmm0, %zmm1
	; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0
				; AVX512BW-NEXT: vpternlogq $15, %zmm0, %zmm0, %zmm0
	; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; AVX512BW-NEXT: vpandnq %zmm1, %zmm0, %zmm2			; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm2
	; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX512BW-NEXT: vpshufb %zmm2, %zmm3, %zmm2			; AVX512BW-NEXT: vpshufb %zmm2, %zmm3, %zmm2
	; AVX512BW-NEXT: vpternlogq $15, %zmm0, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsrlw $4, %zmm0, %zmm0			; AVX512BW-NEXT: vpsrlw $4, %zmm0, %zmm0
	; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpshufb %zmm0, %zmm3, %zmm0			; AVX512BW-NEXT: vpshufb %zmm0, %zmm3, %zmm0
	; AVX512BW-NEXT: vpaddb %zmm2, %zmm0, %zmm0			; AVX512BW-NEXT: vpaddb %zmm2, %zmm0, %zmm0
	; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512BW-NEXT: vpsadbw %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpsadbw %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; AVX512CDBW-LABEL: testv16i32:			; AVX512CDBW-LABEL: testv16i32:
	; AVX512CDBW: # %bb.0:			; AVX512CDBW: # %bb.0:
	; AVX512CDBW-NEXT: vplzcntd %zmm0, %zmm0			; AVX512CDBW-NEXT: vplzcntd %zmm0, %zmm0
	; AVX512CDBW-NEXT: retq			; AVX512CDBW-NEXT: retq
	;			;
	; AVX512BW-LABEL: testv16i32:			; AVX512BW-LABEL: testv16i32:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpsrld $1, %zmm0, %zmm1			; AVX512BW-NEXT: vpsrld $1, %zmm0, %zmm1
	; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsrld $2, %zmm0, %zmm1			; AVX512BW-NEXT: vpsrld $2, %zmm0, %zmm1
	; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsrld $4, %zmm0, %zmm1			; AVX512BW-NEXT: vpsrld $4, %zmm0, %zmm1
	; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsrld $8, %zmm0, %zmm1			; AVX512BW-NEXT: vpsrld $8, %zmm0, %zmm1
	; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsrld $16, %zmm0, %zmm1			; AVX512BW-NEXT: vpsrld $16, %zmm0, %zmm1
	; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpord %zmm1, %zmm0, %zmm0
				; AVX512BW-NEXT: vpternlogq $15, %zmm0, %zmm0, %zmm0
	; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; AVX512BW-NEXT: vpandnq %zmm1, %zmm0, %zmm2			; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm2
	; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX512BW-NEXT: vpshufb %zmm2, %zmm3, %zmm2			; AVX512BW-NEXT: vpshufb %zmm2, %zmm3, %zmm2
	; AVX512BW-NEXT: vpternlogq $15, %zmm0, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsrlw $4, %zmm0, %zmm0			; AVX512BW-NEXT: vpsrlw $4, %zmm0, %zmm0
	; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpshufb %zmm0, %zmm3, %zmm0			; AVX512BW-NEXT: vpshufb %zmm0, %zmm3, %zmm0
	; AVX512BW-NEXT: vpaddb %zmm2, %zmm0, %zmm0			; AVX512BW-NEXT: vpaddb %zmm2, %zmm0, %zmm0
	; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512BW-NEXT: vpunpckhdq {{.*#+}} zmm2 = zmm0[2],zmm1[2],zmm0[3],zmm1[3],zmm0[6],zmm1[6],zmm0[7],zmm1[7],zmm0[10],zmm1[10],zmm0[11],zmm1[11],zmm0[14],zmm1[14],zmm0[15],zmm1[15]			; AVX512BW-NEXT: vpunpckhdq {{.*#+}} zmm2 = zmm0[2],zmm1[2],zmm0[3],zmm1[3],zmm0[6],zmm1[6],zmm0[7],zmm1[7],zmm0[10],zmm1[10],zmm0[11],zmm1[11],zmm0[14],zmm1[14],zmm0[15],zmm1[15]
	; AVX512BW-NEXT: vpsadbw %zmm1, %zmm2, %zmm2			; AVX512BW-NEXT: vpsadbw %zmm1, %zmm2, %zmm2
	; AVX512BW-NEXT: vpunpckldq {{.*#+}} zmm0 = zmm0[0],zmm1[0],zmm0[1],zmm1[1],zmm0[4],zmm1[4],zmm0[5],zmm1[5],zmm0[8],zmm1[8],zmm0[9],zmm1[9],zmm0[12],zmm1[12],zmm0[13],zmm1[13]			; AVX512BW-NEXT: vpunpckldq {{.*#+}} zmm0 = zmm0[0],zmm1[0],zmm0[1],zmm1[1],zmm0[4],zmm1[4],zmm0[5],zmm1[5],zmm0[8],zmm1[8],zmm0[9],zmm1[9],zmm0[12],zmm1[12],zmm0[13],zmm1[13]
	; AVX512BW-NEXT: vpsadbw %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpsadbw %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpackuswb %zmm2, %zmm0, %zmm0			; AVX512BW-NEXT: vpackuswb %zmm2, %zmm0, %zmm0
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512DQ-LABEL: testv16i32:			; AVX512DQ-LABEL: testv16i32:
	; AVX512DQ: # %bb.0:			; AVX512DQ: # %bb.0:
	; AVX512DQ-NEXT: vpsrld $1, %zmm0, %zmm1			; AVX512DQ-NEXT: vpsrld $1, %zmm0, %zmm1
	; AVX512DQ-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512DQ-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512DQ-NEXT: vpsrld $2, %zmm0, %zmm1			; AVX512DQ-NEXT: vpsrld $2, %zmm0, %zmm1
	; AVX512DQ-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512DQ-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512DQ-NEXT: vpsrld $4, %zmm0, %zmm1			; AVX512DQ-NEXT: vpsrld $4, %zmm0, %zmm1
	; AVX512DQ-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512DQ-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512DQ-NEXT: vpsrld $8, %zmm0, %zmm1			; AVX512DQ-NEXT: vpsrld $8, %zmm0, %zmm1
	; AVX512DQ-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512DQ-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512DQ-NEXT: vpsrld $16, %zmm0, %zmm1			; AVX512DQ-NEXT: vpsrld $16, %zmm0, %zmm1
	; AVX512DQ-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512DQ-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512DQ-NEXT: vpternlogq $15, %zmm0, %zmm0, %zmm0			; AVX512DQ-NEXT: vpternlogq $15, %zmm0, %zmm0, %zmm0
	; AVX512DQ-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512DQ-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512DQ-NEXT: vmovdqa {{.*#+}} ymm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; AVX512DQ-NEXT: vmovdqa {{.*#+}} ymm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; AVX512DQ-NEXT: vpand %ymm2, %ymm1, %ymm3			; AVX512DQ-NEXT: vpand %ymm2, %ymm1, %ymm3
	; AVX512DQ-NEXT: vmovdqa {{.*#+}} ymm4 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX512DQ-NEXT: vmovdqa {{.*#+}} ymm4 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX512DQ-NEXT: vpshufb %ymm3, %ymm4, %ymm3			; AVX512DQ-NEXT: vpshufb %ymm3, %ymm4, %ymm3
	; AVX512DQ-NEXT: vpsrlw $4, %ymm1, %ymm1			; AVX512DQ-NEXT: vpsrlw $4, %ymm1, %ymm1
	; AVX512DQ-NEXT: vpand %ymm2, %ymm1, %ymm1			; AVX512DQ-NEXT: vpand %ymm2, %ymm1, %ymm1
	Show All 31 Lines
	; AVX512CDBW-LABEL: testv16i32u:			; AVX512CDBW-LABEL: testv16i32u:
	; AVX512CDBW: # %bb.0:			; AVX512CDBW: # %bb.0:
	; AVX512CDBW-NEXT: vplzcntd %zmm0, %zmm0			; AVX512CDBW-NEXT: vplzcntd %zmm0, %zmm0
	; AVX512CDBW-NEXT: retq			; AVX512CDBW-NEXT: retq
	;			;
	; AVX512BW-LABEL: testv16i32u:			; AVX512BW-LABEL: testv16i32u:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpsrld $1, %zmm0, %zmm1			; AVX512BW-NEXT: vpsrld $1, %zmm0, %zmm1
	; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsrld $2, %zmm0, %zmm1			; AVX512BW-NEXT: vpsrld $2, %zmm0, %zmm1
	; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsrld $4, %zmm0, %zmm1			; AVX512BW-NEXT: vpsrld $4, %zmm0, %zmm1
	; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsrld $8, %zmm0, %zmm1			; AVX512BW-NEXT: vpsrld $8, %zmm0, %zmm1
	; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsrld $16, %zmm0, %zmm1			; AVX512BW-NEXT: vpsrld $16, %zmm0, %zmm1
	; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpord %zmm1, %zmm0, %zmm0
				; AVX512BW-NEXT: vpternlogq $15, %zmm0, %zmm0, %zmm0
	; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; AVX512BW-NEXT: vpandnq %zmm1, %zmm0, %zmm2			; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm2
	; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX512BW-NEXT: vpshufb %zmm2, %zmm3, %zmm2			; AVX512BW-NEXT: vpshufb %zmm2, %zmm3, %zmm2
	; AVX512BW-NEXT: vpternlogq $15, %zmm0, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsrlw $4, %zmm0, %zmm0			; AVX512BW-NEXT: vpsrlw $4, %zmm0, %zmm0
	; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpshufb %zmm0, %zmm3, %zmm0			; AVX512BW-NEXT: vpshufb %zmm0, %zmm3, %zmm0
	; AVX512BW-NEXT: vpaddb %zmm2, %zmm0, %zmm0			; AVX512BW-NEXT: vpaddb %zmm2, %zmm0, %zmm0
	; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512BW-NEXT: vpunpckhdq {{.*#+}} zmm2 = zmm0[2],zmm1[2],zmm0[3],zmm1[3],zmm0[6],zmm1[6],zmm0[7],zmm1[7],zmm0[10],zmm1[10],zmm0[11],zmm1[11],zmm0[14],zmm1[14],zmm0[15],zmm1[15]			; AVX512BW-NEXT: vpunpckhdq {{.*#+}} zmm2 = zmm0[2],zmm1[2],zmm0[3],zmm1[3],zmm0[6],zmm1[6],zmm0[7],zmm1[7],zmm0[10],zmm1[10],zmm0[11],zmm1[11],zmm0[14],zmm1[14],zmm0[15],zmm1[15]
	; AVX512BW-NEXT: vpsadbw %zmm1, %zmm2, %zmm2			; AVX512BW-NEXT: vpsadbw %zmm1, %zmm2, %zmm2
	; AVX512BW-NEXT: vpunpckldq {{.*#+}} zmm0 = zmm0[0],zmm1[0],zmm0[1],zmm1[1],zmm0[4],zmm1[4],zmm0[5],zmm1[5],zmm0[8],zmm1[8],zmm0[9],zmm1[9],zmm0[12],zmm1[12],zmm0[13],zmm1[13]			; AVX512BW-NEXT: vpunpckldq {{.*#+}} zmm0 = zmm0[0],zmm1[0],zmm0[1],zmm1[1],zmm0[4],zmm1[4],zmm0[5],zmm1[5],zmm0[8],zmm1[8],zmm0[9],zmm1[9],zmm0[12],zmm1[12],zmm0[13],zmm1[13]
	; AVX512BW-NEXT: vpsadbw %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpsadbw %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpackuswb %zmm2, %zmm0, %zmm0			; AVX512BW-NEXT: vpackuswb %zmm2, %zmm0, %zmm0
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512DQ-LABEL: testv16i32u:			; AVX512DQ-LABEL: testv16i32u:
	; AVX512DQ: # %bb.0:			; AVX512DQ: # %bb.0:
	; AVX512DQ-NEXT: vpsrld $1, %zmm0, %zmm1			; AVX512DQ-NEXT: vpsrld $1, %zmm0, %zmm1
	; AVX512DQ-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512DQ-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512DQ-NEXT: vpsrld $2, %zmm0, %zmm1			; AVX512DQ-NEXT: vpsrld $2, %zmm0, %zmm1
	; AVX512DQ-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512DQ-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512DQ-NEXT: vpsrld $4, %zmm0, %zmm1			; AVX512DQ-NEXT: vpsrld $4, %zmm0, %zmm1
	; AVX512DQ-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512DQ-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512DQ-NEXT: vpsrld $8, %zmm0, %zmm1			; AVX512DQ-NEXT: vpsrld $8, %zmm0, %zmm1
	; AVX512DQ-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512DQ-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512DQ-NEXT: vpsrld $16, %zmm0, %zmm1			; AVX512DQ-NEXT: vpsrld $16, %zmm0, %zmm1
	; AVX512DQ-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512DQ-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512DQ-NEXT: vpternlogq $15, %zmm0, %zmm0, %zmm0			; AVX512DQ-NEXT: vpternlogq $15, %zmm0, %zmm0, %zmm0
	; AVX512DQ-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512DQ-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512DQ-NEXT: vmovdqa {{.*#+}} ymm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; AVX512DQ-NEXT: vmovdqa {{.*#+}} ymm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; AVX512DQ-NEXT: vpand %ymm2, %ymm1, %ymm3			; AVX512DQ-NEXT: vpand %ymm2, %ymm1, %ymm3
	; AVX512DQ-NEXT: vmovdqa {{.*#+}} ymm4 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX512DQ-NEXT: vmovdqa {{.*#+}} ymm4 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX512DQ-NEXT: vpshufb %ymm3, %ymm4, %ymm3			; AVX512DQ-NEXT: vpshufb %ymm3, %ymm4, %ymm3
	; AVX512DQ-NEXT: vpsrlw $4, %ymm1, %ymm1			; AVX512DQ-NEXT: vpsrlw $4, %ymm1, %ymm1
	; AVX512DQ-NEXT: vpand %ymm2, %ymm1, %ymm1			; AVX512DQ-NEXT: vpand %ymm2, %ymm1, %ymm1
	▲ Show 20 Lines • Show All 389 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-reduce-and.ll

	Show First 20 Lines • Show All 303 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vmovd %xmm0, %eax			; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v16i32:			; AVX512-LABEL: test_v16i32:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vpandq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpandd %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX512-NEXT: vpandq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpandd %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpandq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpandd %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpandq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpandd %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vmovd %xmm0, %eax			; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i32 @llvm.experimental.vector.reduce.and.i32.v16i32(<16 x i32> %a0)			%1 = call i32 @llvm.experimental.vector.reduce.and.i32.v16i32(<16 x i32> %a0)
	ret i32 %1			ret i32 %1
	}			}

	define i32 @test_v32i32(<32 x i32> %a0) {			define i32 @test_v32i32(<32 x i32> %a0) {
	Show All 40 Lines
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vmovd %xmm0, %eax			; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v32i32:			; AVX512-LABEL: test_v32i32:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpandq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpandd %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vpandq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpandd %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX512-NEXT: vpandq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpandd %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpandq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpandd %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpandq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpandd %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vmovd %xmm0, %eax			; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i32 @llvm.experimental.vector.reduce.and.i32.v32i32(<32 x i32> %a0)			%1 = call i32 @llvm.experimental.vector.reduce.and.i32.v32i32(<32 x i32> %a0)
	ret i32 %1			ret i32 %1
	}			}

	;			;
	▲ Show 20 Lines • Show All 637 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-reduce-or.ll

	Show First 20 Lines • Show All 303 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vmovd %xmm0, %eax			; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v16i32:			; AVX512-LABEL: test_v16i32:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vmovd %xmm0, %eax			; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i32 @llvm.experimental.vector.reduce.or.i32.v16i32(<16 x i32> %a0)			%1 = call i32 @llvm.experimental.vector.reduce.or.i32.v16i32(<16 x i32> %a0)
	ret i32 %1			ret i32 %1
	}			}

	define i32 @test_v32i32(<32 x i32> %a0) {			define i32 @test_v32i32(<32 x i32> %a0) {
	Show All 40 Lines
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vmovd %xmm0, %eax			; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v32i32:			; AVX512-LABEL: test_v32i32:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vmovd %xmm0, %eax			; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i32 @llvm.experimental.vector.reduce.or.i32.v32i32(<32 x i32> %a0)			%1 = call i32 @llvm.experimental.vector.reduce.or.i32.v32i32(<32 x i32> %a0)
	ret i32 %1			ret i32 %1
	}			}

	;			;
	▲ Show 20 Lines • Show All 637 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-reduce-umax.ll

	Show First 20 Lines • Show All 1,577 Lines • ▼ Show 20 Lines
	; AVX512BW-NEXT: vpternlogq $15, %zmm0, %zmm0, %zmm0			; AVX512BW-NEXT: vpternlogq $15, %zmm0, %zmm0, %zmm0
	; AVX512BW-NEXT: vpextrb $0, %xmm0, %eax			; AVX512BW-NEXT: vpextrb $0, %xmm0, %eax
	; AVX512BW-NEXT: # kill: def $al killed $al killed $eax			; AVX512BW-NEXT: # kill: def $al killed $al killed $eax
	; AVX512BW-NEXT: vzeroupper			; AVX512BW-NEXT: vzeroupper
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512VL-LABEL: test_v16i8:			; AVX512VL-LABEL: test_v16i8:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vpternlogq $15, %xmm0, %xmm0, %xmm0			; AVX512VL-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; AVX512VL-NEXT: vpsrlw $8, %xmm0, %xmm1			; AVX512VL-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; AVX512VL-NEXT: vpminub %xmm1, %xmm0, %xmm0			; AVX512VL-NEXT: vpsrlw $8, %xmm0, %xmm2
				; AVX512VL-NEXT: vpminub %xmm2, %xmm0, %xmm0
	; AVX512VL-NEXT: vphminposuw %xmm0, %xmm0			; AVX512VL-NEXT: vphminposuw %xmm0, %xmm0
	; AVX512VL-NEXT: vpternlogq $15, %xmm0, %xmm0, %xmm0			; AVX512VL-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; AVX512VL-NEXT: vpextrb $0, %xmm0, %eax			; AVX512VL-NEXT: vpextrb $0, %xmm0, %eax
	; AVX512VL-NEXT: # kill: def $al killed $al killed $eax			; AVX512VL-NEXT: # kill: def $al killed $al killed $eax
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	%1 = call i8 @llvm.experimental.vector.reduce.umax.i8.v16i8(<16 x i8> %a0)			%1 = call i8 @llvm.experimental.vector.reduce.umax.i8.v16i8(<16 x i8> %a0)
	ret i8 %1			ret i8 %1
	}			}

	define i8 @test_v32i8(<32 x i8> %a0) {			define i8 @test_v32i8(<32 x i8> %a0) {
	▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
	; AVX512BW-NEXT: # kill: def $al killed $al killed $eax			; AVX512BW-NEXT: # kill: def $al killed $al killed $eax
	; AVX512BW-NEXT: vzeroupper			; AVX512BW-NEXT: vzeroupper
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512VL-LABEL: test_v32i8:			; AVX512VL-LABEL: test_v32i8:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512VL-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX512VL-NEXT: vpmaxub %xmm1, %xmm0, %xmm0			; AVX512VL-NEXT: vpmaxub %xmm1, %xmm0, %xmm0
	; AVX512VL-NEXT: vpternlogq $15, %xmm0, %xmm0, %xmm0			; AVX512VL-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; AVX512VL-NEXT: vpsrlw $8, %xmm0, %xmm1			; AVX512VL-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; AVX512VL-NEXT: vpminub %xmm1, %xmm0, %xmm0			; AVX512VL-NEXT: vpsrlw $8, %xmm0, %xmm2
				; AVX512VL-NEXT: vpminub %xmm2, %xmm0, %xmm0
	; AVX512VL-NEXT: vphminposuw %xmm0, %xmm0			; AVX512VL-NEXT: vphminposuw %xmm0, %xmm0
	; AVX512VL-NEXT: vpternlogq $15, %xmm0, %xmm0, %xmm0			; AVX512VL-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; AVX512VL-NEXT: vpextrb $0, %xmm0, %eax			; AVX512VL-NEXT: vpextrb $0, %xmm0, %eax
	; AVX512VL-NEXT: # kill: def $al killed $al killed $eax			; AVX512VL-NEXT: # kill: def $al killed $al killed $eax
	; AVX512VL-NEXT: vzeroupper			; AVX512VL-NEXT: vzeroupper
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	%1 = call i8 @llvm.experimental.vector.reduce.umax.i8.v32i8(<32 x i8> %a0)			%1 = call i8 @llvm.experimental.vector.reduce.umax.i8.v32i8(<32 x i8> %a0)
	ret i8 %1			ret i8 %1
	}			}

	▲ Show 20 Lines • Show All 84 Lines • ▼ Show 20 Lines
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512VL-LABEL: test_v64i8:			; AVX512VL-LABEL: test_v64i8:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512VL-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512VL-NEXT: vpmaxub %ymm1, %ymm0, %ymm0			; AVX512VL-NEXT: vpmaxub %ymm1, %ymm0, %ymm0
	; AVX512VL-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512VL-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX512VL-NEXT: vpmaxub %xmm1, %xmm0, %xmm0			; AVX512VL-NEXT: vpmaxub %xmm1, %xmm0, %xmm0
	; AVX512VL-NEXT: vpternlogq $15, %xmm0, %xmm0, %xmm0			; AVX512VL-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; AVX512VL-NEXT: vpsrlw $8, %xmm0, %xmm1			; AVX512VL-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; AVX512VL-NEXT: vpminub %xmm1, %xmm0, %xmm0			; AVX512VL-NEXT: vpsrlw $8, %xmm0, %xmm2
				; AVX512VL-NEXT: vpminub %xmm2, %xmm0, %xmm0
	; AVX512VL-NEXT: vphminposuw %xmm0, %xmm0			; AVX512VL-NEXT: vphminposuw %xmm0, %xmm0
	; AVX512VL-NEXT: vpternlogq $15, %xmm0, %xmm0, %xmm0			; AVX512VL-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; AVX512VL-NEXT: vpextrb $0, %xmm0, %eax			; AVX512VL-NEXT: vpextrb $0, %xmm0, %eax
	; AVX512VL-NEXT: # kill: def $al killed $al killed $eax			; AVX512VL-NEXT: # kill: def $al killed $al killed $eax
	; AVX512VL-NEXT: vzeroupper			; AVX512VL-NEXT: vzeroupper
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	%1 = call i8 @llvm.experimental.vector.reduce.umax.i8.v64i8(<64 x i8> %a0)			%1 = call i8 @llvm.experimental.vector.reduce.umax.i8.v64i8(<64 x i8> %a0)
	ret i8 %1			ret i8 %1
	}			}

	▲ Show 20 Lines • Show All 102 Lines • ▼ Show 20 Lines
	;			;
	; AVX512VL-LABEL: test_v128i8:			; AVX512VL-LABEL: test_v128i8:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vpmaxub %zmm1, %zmm0, %zmm0			; AVX512VL-NEXT: vpmaxub %zmm1, %zmm0, %zmm0
	; AVX512VL-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512VL-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512VL-NEXT: vpmaxub %ymm1, %ymm0, %ymm0			; AVX512VL-NEXT: vpmaxub %ymm1, %ymm0, %ymm0
	; AVX512VL-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512VL-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX512VL-NEXT: vpmaxub %xmm1, %xmm0, %xmm0			; AVX512VL-NEXT: vpmaxub %xmm1, %xmm0, %xmm0
	; AVX512VL-NEXT: vpternlogq $15, %xmm0, %xmm0, %xmm0			; AVX512VL-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; AVX512VL-NEXT: vpsrlw $8, %xmm0, %xmm1			; AVX512VL-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; AVX512VL-NEXT: vpminub %xmm1, %xmm0, %xmm0			; AVX512VL-NEXT: vpsrlw $8, %xmm0, %xmm2
				; AVX512VL-NEXT: vpminub %xmm2, %xmm0, %xmm0
	; AVX512VL-NEXT: vphminposuw %xmm0, %xmm0			; AVX512VL-NEXT: vphminposuw %xmm0, %xmm0
	; AVX512VL-NEXT: vpternlogq $15, %xmm0, %xmm0, %xmm0			; AVX512VL-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; AVX512VL-NEXT: vpextrb $0, %xmm0, %eax			; AVX512VL-NEXT: vpextrb $0, %xmm0, %eax
	; AVX512VL-NEXT: # kill: def $al killed $al killed $eax			; AVX512VL-NEXT: # kill: def $al killed $al killed $eax
	; AVX512VL-NEXT: vzeroupper			; AVX512VL-NEXT: vzeroupper
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	%1 = call i8 @llvm.experimental.vector.reduce.umax.i8.v128i8(<128 x i8> %a0)			%1 = call i8 @llvm.experimental.vector.reduce.umax.i8.v128i8(<128 x i8> %a0)
	ret i8 %1			ret i8 %1
	}			}

	Show All 19 Lines

test/CodeGen/X86/vector-reduce-xor.ll

	Show First 20 Lines • Show All 303 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpxor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vmovd %xmm0, %eax			; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v16i32:			; AVX512-LABEL: test_v16i32:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vpxorq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpxord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX512-NEXT: vpxorq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpxord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpxorq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpxord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpxorq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpxord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vmovd %xmm0, %eax			; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i32 @llvm.experimental.vector.reduce.xor.i32.v16i32(<16 x i32> %a0)			%1 = call i32 @llvm.experimental.vector.reduce.xor.i32.v16i32(<16 x i32> %a0)
	ret i32 %1			ret i32 %1
	}			}

	define i32 @test_v32i32(<32 x i32> %a0) {			define i32 @test_v32i32(<32 x i32> %a0) {
	Show All 40 Lines
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpxor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpxor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vmovd %xmm0, %eax			; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v32i32:			; AVX512-LABEL: test_v32i32:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpxorq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpxord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vpxorq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpxord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX512-NEXT: vpxorq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpxord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpxorq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpxord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpxorq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpxord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vmovd %xmm0, %eax			; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i32 @llvm.experimental.vector.reduce.xor.i32.v32i32(<32 x i32> %a0)			%1 = call i32 @llvm.experimental.vector.reduce.xor.i32.v32i32(<32 x i32> %a0)
	ret i32 %1			ret i32 %1
	}			}

	;			;
	▲ Show 20 Lines • Show All 637 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-rotate-512.ll

Show First 20 Lines • Show All 870 Lines • ▼ Show 20 Lines	; AVX512-NEXT: retq
%or = or <8 x i64> %lmask, %rmask		%or = or <8 x i64> %lmask, %rmask
ret <8 x i64> %or		ret <8 x i64> %or
}		}

define <16 x i32> @splatconstant_rotate_mask_v16i32(<16 x i32> %a) nounwind {		define <16 x i32> @splatconstant_rotate_mask_v16i32(<16 x i32> %a) nounwind {
; AVX512-LABEL: splatconstant_rotate_mask_v16i32:		; AVX512-LABEL: splatconstant_rotate_mask_v16i32:
; AVX512: # %bb.0:		; AVX512: # %bb.0:
; AVX512-NEXT: vprold $4, %zmm0, %zmm0		; AVX512-NEXT: vprold $4, %zmm0, %zmm0
; AVX512-NEXT: vpandq {{.*}}(%rip), %zmm0, %zmm0		; AVX512-NEXT: vpandd {{.*}}(%rip), %zmm0, %zmm0
; AVX512-NEXT: retq		; AVX512-NEXT: retq
%shl = shl <16 x i32> %a, <i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>		%shl = shl <16 x i32> %a, <i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>
%lshr = lshr <16 x i32> %a, <i32 28, i32 28, i32 28, i32 28, i32 28, i32 28, i32 28, i32 28, i32 28, i32 28, i32 28, i32 28, i32 28, i32 28, i32 28, i32 28>		%lshr = lshr <16 x i32> %a, <i32 28, i32 28, i32 28, i32 28, i32 28, i32 28, i32 28, i32 28, i32 28, i32 28, i32 28, i32 28, i32 28, i32 28, i32 28, i32 28>
%rmask = and <16 x i32> %lshr, <i32 3, i32 7, i32 15, i32 31, i32 63, i32 127, i32 255, i32 511, i32 3, i32 7, i32 15, i32 31, i32 63, i32 127, i32 255, i32 511>		%rmask = and <16 x i32> %lshr, <i32 3, i32 7, i32 15, i32 31, i32 63, i32 127, i32 255, i32 511, i32 3, i32 7, i32 15, i32 31, i32 63, i32 127, i32 255, i32 511>
%lmask = and <16 x i32> %shl, <i32 511, i32 255, i32 127, i32 63, i32 31, i32 15, i32 7, i32 3, i32 511, i32 255, i32 127, i32 63, i32 31, i32 15, i32 7, i32 3>		%lmask = and <16 x i32> %shl, <i32 511, i32 255, i32 127, i32 63, i32 31, i32 15, i32 7, i32 3, i32 511, i32 255, i32 127, i32 63, i32 31, i32 15, i32 7, i32 3>
%or = or <16 x i32> %lmask, %rmask		%or = or <16 x i32> %lmask, %rmask
ret <16 x i32> %or		ret <16 x i32> %or
}		}
▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
; AVX512VL-NEXT: vpand %ymm4, %ymm1, %ymm1		; AVX512VL-NEXT: vpand %ymm4, %ymm1, %ymm1
; AVX512VL-NEXT: vpor %ymm3, %ymm1, %ymm1		; AVX512VL-NEXT: vpor %ymm3, %ymm1, %ymm1
; AVX512VL-NEXT: vpand %ymm2, %ymm1, %ymm1		; AVX512VL-NEXT: vpand %ymm2, %ymm1, %ymm1
; AVX512VL-NEXT: retq		; AVX512VL-NEXT: retq
;		;
; AVX512BW-LABEL: splatconstant_rotate_mask_v64i8:		; AVX512BW-LABEL: splatconstant_rotate_mask_v64i8:
; AVX512BW: # %bb.0:		; AVX512BW: # %bb.0:
; AVX512BW-NEXT: vpsllw $4, %zmm0, %zmm1		; AVX512BW-NEXT: vpsllw $4, %zmm0, %zmm1
; AVX512BW-NEXT: vpandq {{.*}}(%rip), %zmm1, %zmm1
; AVX512BW-NEXT: vpsrlw $4, %zmm0, %zmm0		; AVX512BW-NEXT: vpsrlw $4, %zmm0, %zmm0
; AVX512BW-NEXT: vpandq {{.*}}(%rip), %zmm0, %zmm0		; AVX512BW-NEXT: vpandq {{.*}}(%rip), %zmm0, %zmm0
; AVX512BW-NEXT: vpandq {{.*}}(%rip), %zmm0, %zmm0
; AVX512BW-NEXT: vpandq {{.*}}(%rip), %zmm1, %zmm1		; AVX512BW-NEXT: vpandq {{.*}}(%rip), %zmm1, %zmm1
; AVX512BW-NEXT: vporq %zmm0, %zmm1, %zmm0		; AVX512BW-NEXT: vporq %zmm0, %zmm1, %zmm0
; AVX512BW-NEXT: retq		; AVX512BW-NEXT: retq
;		;
; AVX512VLBW-LABEL: splatconstant_rotate_mask_v64i8:		; AVX512VLBW-LABEL: splatconstant_rotate_mask_v64i8:
; AVX512VLBW: # %bb.0:		; AVX512VLBW: # %bb.0:
; AVX512VLBW-NEXT: vpsllw $4, %zmm0, %zmm1		; AVX512VLBW-NEXT: vpsllw $4, %zmm0, %zmm1
; AVX512VLBW-NEXT: vpandq {{.*}}(%rip), %zmm1, %zmm1
; AVX512VLBW-NEXT: vpsrlw $4, %zmm0, %zmm0		; AVX512VLBW-NEXT: vpsrlw $4, %zmm0, %zmm0
; AVX512VLBW-NEXT: vpandq {{.*}}(%rip), %zmm0, %zmm0		; AVX512VLBW-NEXT: vpandq {{.*}}(%rip), %zmm0, %zmm0
; AVX512VLBW-NEXT: vpandq {{.*}}(%rip), %zmm0, %zmm0
; AVX512VLBW-NEXT: vpandq {{.*}}(%rip), %zmm1, %zmm1		; AVX512VLBW-NEXT: vpandq {{.*}}(%rip), %zmm1, %zmm1
; AVX512VLBW-NEXT: vporq %zmm0, %zmm1, %zmm0		; AVX512VLBW-NEXT: vporq %zmm0, %zmm1, %zmm0
; AVX512VLBW-NEXT: retq		; AVX512VLBW-NEXT: retq
%shl = shl <64 x i8> %a, <i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4>		%shl = shl <64 x i8> %a, <i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4>
%lshr = lshr <64 x i8> %a, <i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4>		%lshr = lshr <64 x i8> %a, <i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4, i8 4>
%rmask = and <64 x i8> %lshr, <i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55>		%rmask = and <64 x i8> %lshr, <i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55, i8 55>
%lmask = and <64 x i8> %shl, <i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33>		%lmask = and <64 x i8> %shl, <i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33, i8 33>
%or = or <64 x i8> %lmask, %rmask		%or = or <64 x i8> %lmask, %rmask
ret <64 x i8> %or		ret <64 x i8> %or
}		}

test/CodeGen/X86/vector-trunc-math.ll

	Show First 20 Lines • Show All 3,499 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]			; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]
	; AVX2-NEXT: vpshufb %xmm3, %xmm0, %xmm0			; AVX2-NEXT: vpshufb %xmm3, %xmm0, %xmm0
	; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]			; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: trunc_and_v16i32_v16i8:			; AVX512-LABEL: trunc_and_v16i32_v16i8:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpandq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpandd %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpmovdb %zmm0, %xmm0			; AVX512-NEXT: vpmovdb %zmm0, %xmm0
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = and <16 x i32> %a0, %a1			%1 = and <16 x i32> %a0, %a1
	%2 = trunc <16 x i32> %1 to <16 x i8>			%2 = trunc <16 x i32> %1 to <16 x i8>
	ret <16 x i8> %2			ret <16 x i8> %2
	}			}

	▲ Show 20 Lines • Show All 787 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]			; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]
	; AVX2-NEXT: vpshufb %xmm3, %xmm0, %xmm0			; AVX2-NEXT: vpshufb %xmm3, %xmm0, %xmm0
	; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]			; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: trunc_xor_v16i32_v16i8:			; AVX512-LABEL: trunc_xor_v16i32_v16i8:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpxorq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpxord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpmovdb %zmm0, %xmm0			; AVX512-NEXT: vpmovdb %zmm0, %xmm0
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = xor <16 x i32> %a0, %a1			%1 = xor <16 x i32> %a0, %a1
	%2 = trunc <16 x i32> %1 to <16 x i8>			%2 = trunc <16 x i32> %1 to <16 x i8>
	ret <16 x i8> %2			ret <16 x i8> %2
	}			}

	▲ Show 20 Lines • Show All 787 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]			; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]
	; AVX2-NEXT: vpshufb %xmm3, %xmm0, %xmm0			; AVX2-NEXT: vpshufb %xmm3, %xmm0, %xmm0
	; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]			; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: trunc_or_v16i32_v16i8:			; AVX512-LABEL: trunc_or_v16i32_v16i8:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpmovdb %zmm0, %xmm0			; AVX512-NEXT: vpmovdb %zmm0, %xmm0
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = or <16 x i32> %a0, %a1			%1 = or <16 x i32> %a0, %a1
	%2 = trunc <16 x i32> %1 to <16 x i8>			%2 = trunc <16 x i32> %1 to <16 x i8>
	ret <16 x i8> %2			ret <16 x i8> %2
	}			}

	▲ Show 20 Lines • Show All 566 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-tzcnt-512.ll

Show First 20 Lines • Show All 122 Lines • ▼ Show 20 Lines	; BITALG-NEXT: retq
ret <8 x i64> %out		ret <8 x i64> %out
}		}

define <16 x i32> @testv16i32(<16 x i32> %in) nounwind {		define <16 x i32> @testv16i32(<16 x i32> %in) nounwind {
; AVX512CD-LABEL: testv16i32:		; AVX512CD-LABEL: testv16i32:
; AVX512CD: # %bb.0:		; AVX512CD: # %bb.0:
; AVX512CD-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1		; AVX512CD-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1
; AVX512CD-NEXT: vpaddd %zmm1, %zmm0, %zmm1		; AVX512CD-NEXT: vpaddd %zmm1, %zmm0, %zmm1
; AVX512CD-NEXT: vpandnq %zmm1, %zmm0, %zmm0		; AVX512CD-NEXT: vpandnd %zmm1, %zmm0, %zmm0
; AVX512CD-NEXT: vplzcntd %zmm0, %zmm0		; AVX512CD-NEXT: vplzcntd %zmm0, %zmm0
; AVX512CD-NEXT: vpbroadcastd {{.*#+}} zmm1 = [32,32,32,32,32,32,32,32,32,32,32,32,32,32,32,32]		; AVX512CD-NEXT: vpbroadcastd {{.*#+}} zmm1 = [32,32,32,32,32,32,32,32,32,32,32,32,32,32,32,32]
; AVX512CD-NEXT: vpsubd %zmm0, %zmm1, %zmm0		; AVX512CD-NEXT: vpsubd %zmm0, %zmm1, %zmm0
; AVX512CD-NEXT: retq		; AVX512CD-NEXT: retq
;		;
; AVX512CDBW-LABEL: testv16i32:		; AVX512CDBW-LABEL: testv16i32:
; AVX512CDBW: # %bb.0:		; AVX512CDBW: # %bb.0:
; AVX512CDBW-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1		; AVX512CDBW-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1
; AVX512CDBW-NEXT: vpaddd %zmm1, %zmm0, %zmm1		; AVX512CDBW-NEXT: vpaddd %zmm1, %zmm0, %zmm1
; AVX512CDBW-NEXT: vpandnq %zmm1, %zmm0, %zmm0		; AVX512CDBW-NEXT: vpandnd %zmm1, %zmm0, %zmm0
; AVX512CDBW-NEXT: vplzcntd %zmm0, %zmm0		; AVX512CDBW-NEXT: vplzcntd %zmm0, %zmm0
; AVX512CDBW-NEXT: vpbroadcastd {{.*#+}} zmm1 = [32,32,32,32,32,32,32,32,32,32,32,32,32,32,32,32]		; AVX512CDBW-NEXT: vpbroadcastd {{.*#+}} zmm1 = [32,32,32,32,32,32,32,32,32,32,32,32,32,32,32,32]
; AVX512CDBW-NEXT: vpsubd %zmm0, %zmm1, %zmm0		; AVX512CDBW-NEXT: vpsubd %zmm0, %zmm1, %zmm0
; AVX512CDBW-NEXT: retq		; AVX512CDBW-NEXT: retq
;		;
; AVX512BW-LABEL: testv16i32:		; AVX512BW-LABEL: testv16i32:
; AVX512BW: # %bb.0:		; AVX512BW: # %bb.0:
; AVX512BW-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1		; AVX512BW-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1
; AVX512BW-NEXT: vpaddd %zmm1, %zmm0, %zmm1		; AVX512BW-NEXT: vpaddd %zmm1, %zmm0, %zmm1
; AVX512BW-NEXT: vpandnq %zmm1, %zmm0, %zmm0		; AVX512BW-NEXT: vpandnd %zmm1, %zmm0, %zmm0
; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]		; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm2		; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm2
; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]		; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
; AVX512BW-NEXT: vpshufb %zmm2, %zmm3, %zmm2		; AVX512BW-NEXT: vpshufb %zmm2, %zmm3, %zmm2
; AVX512BW-NEXT: vpsrlw $4, %zmm0, %zmm0		; AVX512BW-NEXT: vpsrlw $4, %zmm0, %zmm0
; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm0		; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm0
; AVX512BW-NEXT: vpshufb %zmm0, %zmm3, %zmm0		; AVX512BW-NEXT: vpshufb %zmm0, %zmm3, %zmm0
; AVX512BW-NEXT: vpaddb %zmm2, %zmm0, %zmm0		; AVX512BW-NEXT: vpaddb %zmm2, %zmm0, %zmm0
; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1		; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1
; AVX512BW-NEXT: vpunpckhdq {{.*#+}} zmm2 = zmm0[2],zmm1[2],zmm0[3],zmm1[3],zmm0[6],zmm1[6],zmm0[7],zmm1[7],zmm0[10],zmm1[10],zmm0[11],zmm1[11],zmm0[14],zmm1[14],zmm0[15],zmm1[15]		; AVX512BW-NEXT: vpunpckhdq {{.*#+}} zmm2 = zmm0[2],zmm1[2],zmm0[3],zmm1[3],zmm0[6],zmm1[6],zmm0[7],zmm1[7],zmm0[10],zmm1[10],zmm0[11],zmm1[11],zmm0[14],zmm1[14],zmm0[15],zmm1[15]
; AVX512BW-NEXT: vpsadbw %zmm1, %zmm2, %zmm2		; AVX512BW-NEXT: vpsadbw %zmm1, %zmm2, %zmm2
; AVX512BW-NEXT: vpunpckldq {{.*#+}} zmm0 = zmm0[0],zmm1[0],zmm0[1],zmm1[1],zmm0[4],zmm1[4],zmm0[5],zmm1[5],zmm0[8],zmm1[8],zmm0[9],zmm1[9],zmm0[12],zmm1[12],zmm0[13],zmm1[13]		; AVX512BW-NEXT: vpunpckldq {{.*#+}} zmm0 = zmm0[0],zmm1[0],zmm0[1],zmm1[1],zmm0[4],zmm1[4],zmm0[5],zmm1[5],zmm0[8],zmm1[8],zmm0[9],zmm1[9],zmm0[12],zmm1[12],zmm0[13],zmm1[13]
; AVX512BW-NEXT: vpsadbw %zmm1, %zmm0, %zmm0		; AVX512BW-NEXT: vpsadbw %zmm1, %zmm0, %zmm0
; AVX512BW-NEXT: vpackuswb %zmm2, %zmm0, %zmm0		; AVX512BW-NEXT: vpackuswb %zmm2, %zmm0, %zmm0
; AVX512BW-NEXT: retq		; AVX512BW-NEXT: retq
;		;
; AVX512VPOPCNTDQ-LABEL: testv16i32:		; AVX512VPOPCNTDQ-LABEL: testv16i32:
; AVX512VPOPCNTDQ: # %bb.0:		; AVX512VPOPCNTDQ: # %bb.0:
; AVX512VPOPCNTDQ-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1		; AVX512VPOPCNTDQ-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1
; AVX512VPOPCNTDQ-NEXT: vpaddd %zmm1, %zmm0, %zmm1		; AVX512VPOPCNTDQ-NEXT: vpaddd %zmm1, %zmm0, %zmm1
; AVX512VPOPCNTDQ-NEXT: vpandnq %zmm1, %zmm0, %zmm0		; AVX512VPOPCNTDQ-NEXT: vpandnd %zmm1, %zmm0, %zmm0
; AVX512VPOPCNTDQ-NEXT: vpopcntd %zmm0, %zmm0		; AVX512VPOPCNTDQ-NEXT: vpopcntd %zmm0, %zmm0
; AVX512VPOPCNTDQ-NEXT: retq		; AVX512VPOPCNTDQ-NEXT: retq
;		;
; BITALG-LABEL: testv16i32:		; BITALG-LABEL: testv16i32:
; BITALG: # %bb.0:		; BITALG: # %bb.0:
; BITALG-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1		; BITALG-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1
; BITALG-NEXT: vpaddd %zmm1, %zmm0, %zmm1		; BITALG-NEXT: vpaddd %zmm1, %zmm0, %zmm1
; BITALG-NEXT: vpandnq %zmm1, %zmm0, %zmm0		; BITALG-NEXT: vpandnd %zmm1, %zmm0, %zmm0
; BITALG-NEXT: vpopcntb %zmm0, %zmm0		; BITALG-NEXT: vpopcntb %zmm0, %zmm0
; BITALG-NEXT: vpxor %xmm1, %xmm1, %xmm1		; BITALG-NEXT: vpxor %xmm1, %xmm1, %xmm1
; BITALG-NEXT: vpunpckhdq {{.*#+}} zmm2 = zmm0[2],zmm1[2],zmm0[3],zmm1[3],zmm0[6],zmm1[6],zmm0[7],zmm1[7],zmm0[10],zmm1[10],zmm0[11],zmm1[11],zmm0[14],zmm1[14],zmm0[15],zmm1[15]		; BITALG-NEXT: vpunpckhdq {{.*#+}} zmm2 = zmm0[2],zmm1[2],zmm0[3],zmm1[3],zmm0[6],zmm1[6],zmm0[7],zmm1[7],zmm0[10],zmm1[10],zmm0[11],zmm1[11],zmm0[14],zmm1[14],zmm0[15],zmm1[15]
; BITALG-NEXT: vpsadbw %zmm1, %zmm2, %zmm2		; BITALG-NEXT: vpsadbw %zmm1, %zmm2, %zmm2
; BITALG-NEXT: vpunpckldq {{.*#+}} zmm0 = zmm0[0],zmm1[0],zmm0[1],zmm1[1],zmm0[4],zmm1[4],zmm0[5],zmm1[5],zmm0[8],zmm1[8],zmm0[9],zmm1[9],zmm0[12],zmm1[12],zmm0[13],zmm1[13]		; BITALG-NEXT: vpunpckldq {{.*#+}} zmm0 = zmm0[0],zmm1[0],zmm0[1],zmm1[1],zmm0[4],zmm1[4],zmm0[5],zmm1[5],zmm0[8],zmm1[8],zmm0[9],zmm1[9],zmm0[12],zmm1[12],zmm0[13],zmm1[13]
; BITALG-NEXT: vpsadbw %zmm1, %zmm0, %zmm0		; BITALG-NEXT: vpsadbw %zmm1, %zmm0, %zmm0
; BITALG-NEXT: vpackuswb %zmm2, %zmm0, %zmm0		; BITALG-NEXT: vpackuswb %zmm2, %zmm0, %zmm0
; BITALG-NEXT: retq		; BITALG-NEXT: retq
%out = call <16 x i32> @llvm.cttz.v16i32(<16 x i32> %in, i1 0)		%out = call <16 x i32> @llvm.cttz.v16i32(<16 x i32> %in, i1 0)
ret <16 x i32> %out		ret <16 x i32> %out
}		}

define <16 x i32> @testv16i32u(<16 x i32> %in) nounwind {		define <16 x i32> @testv16i32u(<16 x i32> %in) nounwind {
; AVX512CD-LABEL: testv16i32u:		; AVX512CD-LABEL: testv16i32u:
; AVX512CD: # %bb.0:		; AVX512CD: # %bb.0:
; AVX512CD-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1		; AVX512CD-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1
; AVX512CD-NEXT: vpaddd %zmm1, %zmm0, %zmm1		; AVX512CD-NEXT: vpaddd %zmm1, %zmm0, %zmm1
; AVX512CD-NEXT: vpandnq %zmm1, %zmm0, %zmm0		; AVX512CD-NEXT: vpandnd %zmm1, %zmm0, %zmm0
; AVX512CD-NEXT: vplzcntd %zmm0, %zmm0		; AVX512CD-NEXT: vplzcntd %zmm0, %zmm0
; AVX512CD-NEXT: vpbroadcastd {{.*#+}} zmm1 = [32,32,32,32,32,32,32,32,32,32,32,32,32,32,32,32]		; AVX512CD-NEXT: vpbroadcastd {{.*#+}} zmm1 = [32,32,32,32,32,32,32,32,32,32,32,32,32,32,32,32]
; AVX512CD-NEXT: vpsubd %zmm0, %zmm1, %zmm0		; AVX512CD-NEXT: vpsubd %zmm0, %zmm1, %zmm0
; AVX512CD-NEXT: retq		; AVX512CD-NEXT: retq
;		;
; AVX512CDBW-LABEL: testv16i32u:		; AVX512CDBW-LABEL: testv16i32u:
; AVX512CDBW: # %bb.0:		; AVX512CDBW: # %bb.0:
; AVX512CDBW-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1		; AVX512CDBW-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1
; AVX512CDBW-NEXT: vpaddd %zmm1, %zmm0, %zmm1		; AVX512CDBW-NEXT: vpaddd %zmm1, %zmm0, %zmm1
; AVX512CDBW-NEXT: vpandnq %zmm1, %zmm0, %zmm0		; AVX512CDBW-NEXT: vpandnd %zmm1, %zmm0, %zmm0
; AVX512CDBW-NEXT: vplzcntd %zmm0, %zmm0		; AVX512CDBW-NEXT: vplzcntd %zmm0, %zmm0
; AVX512CDBW-NEXT: vpbroadcastd {{.*#+}} zmm1 = [32,32,32,32,32,32,32,32,32,32,32,32,32,32,32,32]		; AVX512CDBW-NEXT: vpbroadcastd {{.*#+}} zmm1 = [32,32,32,32,32,32,32,32,32,32,32,32,32,32,32,32]
; AVX512CDBW-NEXT: vpsubd %zmm0, %zmm1, %zmm0		; AVX512CDBW-NEXT: vpsubd %zmm0, %zmm1, %zmm0
; AVX512CDBW-NEXT: retq		; AVX512CDBW-NEXT: retq
;		;
; AVX512BW-LABEL: testv16i32u:		; AVX512BW-LABEL: testv16i32u:
; AVX512BW: # %bb.0:		; AVX512BW: # %bb.0:
; AVX512BW-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1		; AVX512BW-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1
; AVX512BW-NEXT: vpaddd %zmm1, %zmm0, %zmm1		; AVX512BW-NEXT: vpaddd %zmm1, %zmm0, %zmm1
; AVX512BW-NEXT: vpandnq %zmm1, %zmm0, %zmm0		; AVX512BW-NEXT: vpandnd %zmm1, %zmm0, %zmm0
; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]		; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm2		; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm2
; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]		; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
; AVX512BW-NEXT: vpshufb %zmm2, %zmm3, %zmm2		; AVX512BW-NEXT: vpshufb %zmm2, %zmm3, %zmm2
; AVX512BW-NEXT: vpsrlw $4, %zmm0, %zmm0		; AVX512BW-NEXT: vpsrlw $4, %zmm0, %zmm0
; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm0		; AVX512BW-NEXT: vpandq %zmm1, %zmm0, %zmm0
; AVX512BW-NEXT: vpshufb %zmm0, %zmm3, %zmm0		; AVX512BW-NEXT: vpshufb %zmm0, %zmm3, %zmm0
; AVX512BW-NEXT: vpaddb %zmm2, %zmm0, %zmm0		; AVX512BW-NEXT: vpaddb %zmm2, %zmm0, %zmm0
; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1		; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1
; AVX512BW-NEXT: vpunpckhdq {{.*#+}} zmm2 = zmm0[2],zmm1[2],zmm0[3],zmm1[3],zmm0[6],zmm1[6],zmm0[7],zmm1[7],zmm0[10],zmm1[10],zmm0[11],zmm1[11],zmm0[14],zmm1[14],zmm0[15],zmm1[15]		; AVX512BW-NEXT: vpunpckhdq {{.*#+}} zmm2 = zmm0[2],zmm1[2],zmm0[3],zmm1[3],zmm0[6],zmm1[6],zmm0[7],zmm1[7],zmm0[10],zmm1[10],zmm0[11],zmm1[11],zmm0[14],zmm1[14],zmm0[15],zmm1[15]
; AVX512BW-NEXT: vpsadbw %zmm1, %zmm2, %zmm2		; AVX512BW-NEXT: vpsadbw %zmm1, %zmm2, %zmm2
; AVX512BW-NEXT: vpunpckldq {{.*#+}} zmm0 = zmm0[0],zmm1[0],zmm0[1],zmm1[1],zmm0[4],zmm1[4],zmm0[5],zmm1[5],zmm0[8],zmm1[8],zmm0[9],zmm1[9],zmm0[12],zmm1[12],zmm0[13],zmm1[13]		; AVX512BW-NEXT: vpunpckldq {{.*#+}} zmm0 = zmm0[0],zmm1[0],zmm0[1],zmm1[1],zmm0[4],zmm1[4],zmm0[5],zmm1[5],zmm0[8],zmm1[8],zmm0[9],zmm1[9],zmm0[12],zmm1[12],zmm0[13],zmm1[13]
; AVX512BW-NEXT: vpsadbw %zmm1, %zmm0, %zmm0		; AVX512BW-NEXT: vpsadbw %zmm1, %zmm0, %zmm0
; AVX512BW-NEXT: vpackuswb %zmm2, %zmm0, %zmm0		; AVX512BW-NEXT: vpackuswb %zmm2, %zmm0, %zmm0
; AVX512BW-NEXT: retq		; AVX512BW-NEXT: retq
;		;
; AVX512VPOPCNTDQ-LABEL: testv16i32u:		; AVX512VPOPCNTDQ-LABEL: testv16i32u:
; AVX512VPOPCNTDQ: # %bb.0:		; AVX512VPOPCNTDQ: # %bb.0:
; AVX512VPOPCNTDQ-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1		; AVX512VPOPCNTDQ-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1
; AVX512VPOPCNTDQ-NEXT: vpaddd %zmm1, %zmm0, %zmm1		; AVX512VPOPCNTDQ-NEXT: vpaddd %zmm1, %zmm0, %zmm1
; AVX512VPOPCNTDQ-NEXT: vpandnq %zmm1, %zmm0, %zmm0		; AVX512VPOPCNTDQ-NEXT: vpandnd %zmm1, %zmm0, %zmm0
; AVX512VPOPCNTDQ-NEXT: vpopcntd %zmm0, %zmm0		; AVX512VPOPCNTDQ-NEXT: vpopcntd %zmm0, %zmm0
; AVX512VPOPCNTDQ-NEXT: retq		; AVX512VPOPCNTDQ-NEXT: retq
;		;
; BITALG-LABEL: testv16i32u:		; BITALG-LABEL: testv16i32u:
; BITALG: # %bb.0:		; BITALG: # %bb.0:
; BITALG-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1		; BITALG-NEXT: vpternlogd $255, %zmm1, %zmm1, %zmm1
; BITALG-NEXT: vpaddd %zmm1, %zmm0, %zmm1		; BITALG-NEXT: vpaddd %zmm1, %zmm0, %zmm1
; BITALG-NEXT: vpandnq %zmm1, %zmm0, %zmm0		; BITALG-NEXT: vpandnd %zmm1, %zmm0, %zmm0
; BITALG-NEXT: vpopcntb %zmm0, %zmm0		; BITALG-NEXT: vpopcntb %zmm0, %zmm0
; BITALG-NEXT: vpxor %xmm1, %xmm1, %xmm1		; BITALG-NEXT: vpxor %xmm1, %xmm1, %xmm1
; BITALG-NEXT: vpunpckhdq {{.*#+}} zmm2 = zmm0[2],zmm1[2],zmm0[3],zmm1[3],zmm0[6],zmm1[6],zmm0[7],zmm1[7],zmm0[10],zmm1[10],zmm0[11],zmm1[11],zmm0[14],zmm1[14],zmm0[15],zmm1[15]		; BITALG-NEXT: vpunpckhdq {{.*#+}} zmm2 = zmm0[2],zmm1[2],zmm0[3],zmm1[3],zmm0[6],zmm1[6],zmm0[7],zmm1[7],zmm0[10],zmm1[10],zmm0[11],zmm1[11],zmm0[14],zmm1[14],zmm0[15],zmm1[15]
; BITALG-NEXT: vpsadbw %zmm1, %zmm2, %zmm2		; BITALG-NEXT: vpsadbw %zmm1, %zmm2, %zmm2
; BITALG-NEXT: vpunpckldq {{.*#+}} zmm0 = zmm0[0],zmm1[0],zmm0[1],zmm1[1],zmm0[4],zmm1[4],zmm0[5],zmm1[5],zmm0[8],zmm1[8],zmm0[9],zmm1[9],zmm0[12],zmm1[12],zmm0[13],zmm1[13]		; BITALG-NEXT: vpunpckldq {{.*#+}} zmm0 = zmm0[0],zmm1[0],zmm0[1],zmm1[1],zmm0[4],zmm1[4],zmm0[5],zmm1[5],zmm0[8],zmm1[8],zmm0[9],zmm1[9],zmm0[12],zmm1[12],zmm0[13],zmm1[13]
; BITALG-NEXT: vpsadbw %zmm1, %zmm0, %zmm0		; BITALG-NEXT: vpsadbw %zmm1, %zmm0, %zmm0
; BITALG-NEXT: vpackuswb %zmm2, %zmm0, %zmm0		; BITALG-NEXT: vpackuswb %zmm2, %zmm0, %zmm0
; BITALG-NEXT: retq		; BITALG-NEXT: retq
▲ Show 20 Lines • Show All 368 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Stop promoting and/or/xor/andn to vXi64.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 169651

lib/Target/X86/X86ISelLowering.cpp

lib/Target/X86/X86InstrAVX512.td

lib/Target/X86/X86InstrFragmentsSIMD.td

lib/Target/X86/X86InstrSSE.td

lib/Target/X86/X86InstrXOP.td

test/CodeGen/X86/avx-intrinsics-fast-isel.ll

test/CodeGen/X86/avx-logic.ll

test/CodeGen/X86/avx512-arith.ll

test/CodeGen/X86/avx512-intrinsics-fast-isel.ll

test/CodeGen/X86/avx512-intrinsics-upgrade.ll

test/CodeGen/X86/avx512-logic.ll

test/CodeGen/X86/avx512-mask-op.ll

test/CodeGen/X86/avx512-schedule.ll

test/CodeGen/X86/avx512-select.ll

test/CodeGen/X86/avx512bw-intrinsics-fast-isel.ll

test/CodeGen/X86/avx512bw-vec-test-testn.ll

test/CodeGen/X86/avx512bwvl-intrinsics-fast-isel.ll

test/CodeGen/X86/avx512bwvl-vec-test-testn.ll

test/CodeGen/X86/avx512dqvl-intrinsics-upgrade.ll

test/CodeGen/X86/avx512f-vec-test-testn.ll

test/CodeGen/X86/avx512vl-intrinsics-fast-isel.ll

test/CodeGen/X86/avx512vl-logic.ll

test/CodeGen/X86/avx512vl-vec-test-testn.ll

test/CodeGen/X86/bitcast-int-to-vector-bool-sext.ll

test/CodeGen/X86/bitcast-int-to-vector-bool-zext.ll

test/CodeGen/X86/bitcast-setcc-128.ll

test/CodeGen/X86/broadcast-elm-cross-splat-vec.ll

test/CodeGen/X86/fma-fneg-combine.ll

test/CodeGen/X86/horizontal-reduce-umax.ll

test/CodeGen/X86/movmsk-cmp.ll

test/CodeGen/X86/nontemporal-loads.ll

test/CodeGen/X86/psubus.ll

test/CodeGen/X86/sat-add.ll

test/CodeGen/X86/sse-intrinsics-fast-isel.ll

test/CodeGen/X86/sse2-intrinsics-fast-isel.ll

test/CodeGen/X86/unfold-masked-merge-vector-variablemask-const.ll

test/CodeGen/X86/vec-copysign-avx512.ll

test/CodeGen/X86/vector-bitreverse.ll

test/CodeGen/X86/vector-lzcnt-512.ll

test/CodeGen/X86/vector-reduce-and.ll

test/CodeGen/X86/vector-reduce-or.ll

test/CodeGen/X86/vector-reduce-umax.ll

test/CodeGen/X86/vector-reduce-xor.ll

test/CodeGen/X86/vector-rotate-512.ll

test/CodeGen/X86/vector-trunc-math.ll

test/CodeGen/X86/vector-tzcnt-512.ll

[X86] Stop promoting and/or/xor/andn to vXi64.
ClosedPublic