Diff 127278

include/llvm/IR/IntrinsicsX86.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 258 Lines • ▼ Show 20 Lines
// Control register.		// Control register.
let TargetPrefix = "x86" in { // All intrinsics start with "llvm.x86.".		let TargetPrefix = "x86" in { // All intrinsics start with "llvm.x86.".
def int_x86_sse_stmxcsr :		def int_x86_sse_stmxcsr :
Intrinsic<[], [llvm_ptr_ty], []>;		Intrinsic<[], [llvm_ptr_ty], []>;
def int_x86_sse_ldmxcsr :		def int_x86_sse_ldmxcsr :
Intrinsic<[], [llvm_ptr_ty], []>;		Intrinsic<[], [llvm_ptr_ty], []>;
}		}

// Misc.
let TargetPrefix = "x86" in { // All intrinsics start with "llvm.x86.".
def int_x86_sse_movmsk_ps : GCCBuiltin<"__builtin_ia32_movmskps">,
Intrinsic<[llvm_i32_ty], [llvm_v4f32_ty], [IntrNoMem]>;
}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// SSE2		// SSE2

// FP arithmetic ops		// FP arithmetic ops
let TargetPrefix = "x86" in { // All intrinsics start with "llvm.x86.".		let TargetPrefix = "x86" in { // All intrinsics start with "llvm.x86.".
def int_x86_sse2_sqrt_sd : GCCBuiltin<"__builtin_ia32_sqrtsd">,		def int_x86_sse2_sqrt_sd : GCCBuiltin<"__builtin_ia32_sqrtsd">,
Intrinsic<[llvm_v2f64_ty], [llvm_v2f64_ty],		Intrinsic<[llvm_v2f64_ty], [llvm_v2f64_ty],
[IntrNoMem]>;		[IntrNoMem]>;
▲ Show 20 Lines • Show All 204 Lines • ▼ Show 20 Lines	def int_x86_sse2_packsswb_128 : GCCBuiltin<"__builtin_ia32_packsswb128">,
Intrinsic<[llvm_v16i8_ty], [llvm_v8i16_ty,		Intrinsic<[llvm_v16i8_ty], [llvm_v8i16_ty,
llvm_v8i16_ty], [IntrNoMem]>;		llvm_v8i16_ty], [IntrNoMem]>;
def int_x86_sse2_packssdw_128 : GCCBuiltin<"__builtin_ia32_packssdw128">,		def int_x86_sse2_packssdw_128 : GCCBuiltin<"__builtin_ia32_packssdw128">,
Intrinsic<[llvm_v8i16_ty], [llvm_v4i32_ty,		Intrinsic<[llvm_v8i16_ty], [llvm_v4i32_ty,
llvm_v4i32_ty], [IntrNoMem]>;		llvm_v4i32_ty], [IntrNoMem]>;
def int_x86_sse2_packuswb_128 : GCCBuiltin<"__builtin_ia32_packuswb128">,		def int_x86_sse2_packuswb_128 : GCCBuiltin<"__builtin_ia32_packuswb128">,
Intrinsic<[llvm_v16i8_ty], [llvm_v8i16_ty,		Intrinsic<[llvm_v16i8_ty], [llvm_v8i16_ty,
llvm_v8i16_ty], [IntrNoMem]>;		llvm_v8i16_ty], [IntrNoMem]>;
def int_x86_sse2_movmsk_pd : GCCBuiltin<"__builtin_ia32_movmskpd">,
Intrinsic<[llvm_i32_ty], [llvm_v2f64_ty], [IntrNoMem]>;
def int_x86_sse2_pmovmskb_128 : GCCBuiltin<"__builtin_ia32_pmovmskb128">,
Intrinsic<[llvm_i32_ty], [llvm_v16i8_ty], [IntrNoMem]>;
def int_x86_sse2_maskmov_dqu : GCCBuiltin<"__builtin_ia32_maskmovdqu">,		def int_x86_sse2_maskmov_dqu : GCCBuiltin<"__builtin_ia32_maskmovdqu">,
Intrinsic<[], [llvm_v16i8_ty,		Intrinsic<[], [llvm_v16i8_ty,
llvm_v16i8_ty, llvm_ptr_ty], []>;		llvm_v16i8_ty, llvm_ptr_ty], []>;
def int_x86_sse2_clflush : GCCBuiltin<"__builtin_ia32_clflush">,		def int_x86_sse2_clflush : GCCBuiltin<"__builtin_ia32_clflush">,
Intrinsic<[], [llvm_ptr_ty], []>;		Intrinsic<[], [llvm_ptr_ty], []>;
def int_x86_sse2_lfence : GCCBuiltin<"__builtin_ia32_lfence">,		def int_x86_sse2_lfence : GCCBuiltin<"__builtin_ia32_lfence">,
Intrinsic<[], [], []>;		Intrinsic<[], [], []>;
def int_x86_sse2_mfence : GCCBuiltin<"__builtin_ia32_mfence">,		def int_x86_sse2_mfence : GCCBuiltin<"__builtin_ia32_mfence">,
▲ Show 20 Lines • Show All 956 Lines • ▼ Show 20 Lines	def int_x86_avx512_mask_fpclass_sd :
Intrinsic<[llvm_i8_ty], [llvm_v2f64_ty, llvm_i32_ty, llvm_i8_ty],		Intrinsic<[llvm_i8_ty], [llvm_v2f64_ty, llvm_i32_ty, llvm_i8_ty],
[IntrNoMem]>;		[IntrNoMem]>;
def int_x86_avx512_mask_fpclass_ss :		def int_x86_avx512_mask_fpclass_ss :
GCCBuiltin<"__builtin_ia32_fpclassss_mask">,		GCCBuiltin<"__builtin_ia32_fpclassss_mask">,
Intrinsic<[llvm_i8_ty], [llvm_v4f32_ty, llvm_i32_ty, llvm_i8_ty],		Intrinsic<[llvm_i8_ty], [llvm_v4f32_ty, llvm_i32_ty, llvm_i8_ty],
[IntrNoMem]>;		[IntrNoMem]>;
}		}

// Vector extract sign mask
let TargetPrefix = "x86" in { // All intrinsics start with "llvm.x86.".
def int_x86_avx_movmsk_pd_256 : GCCBuiltin<"__builtin_ia32_movmskpd256">,
Intrinsic<[llvm_i32_ty], [llvm_v4f64_ty], [IntrNoMem]>;
def int_x86_avx_movmsk_ps_256 : GCCBuiltin<"__builtin_ia32_movmskps256">,
Intrinsic<[llvm_i32_ty], [llvm_v8f32_ty], [IntrNoMem]>;
}

// Vector zero		// Vector zero
let TargetPrefix = "x86" in { // All intrinsics start with "llvm.x86.".		let TargetPrefix = "x86" in { // All intrinsics start with "llvm.x86.".
def int_x86_avx_vzeroall : GCCBuiltin<"__builtin_ia32_vzeroall">,		def int_x86_avx_vzeroall : GCCBuiltin<"__builtin_ia32_vzeroall">,
Intrinsic<[], [], []>;		Intrinsic<[], [], []>;
def int_x86_avx_vzeroupper : GCCBuiltin<"__builtin_ia32_vzeroupper">,		def int_x86_avx_vzeroupper : GCCBuiltin<"__builtin_ia32_vzeroupper">,
Intrinsic<[], [], []>;		Intrinsic<[], [], []>;
}		}

▲ Show 20 Lines • Show All 585 Lines • ▼ Show 20 Lines	let TargetPrefix = "x86" in { // All intrinsics start with "llvm.x86.".
def int_x86_avx2_gather_q_d_256 : GCCBuiltin<"__builtin_ia32_gatherq_d256">,		def int_x86_avx2_gather_q_d_256 : GCCBuiltin<"__builtin_ia32_gatherq_d256">,
Intrinsic<[llvm_v4i32_ty],		Intrinsic<[llvm_v4i32_ty],
[llvm_v4i32_ty, llvm_ptr_ty, llvm_v4i64_ty, llvm_v4i32_ty, llvm_i8_ty],		[llvm_v4i32_ty, llvm_ptr_ty, llvm_v4i64_ty, llvm_v4i32_ty, llvm_i8_ty],
[IntrReadMem, IntrArgMemOnly]>;		[IntrReadMem, IntrArgMemOnly]>;
}		}

// Misc.		// Misc.
let TargetPrefix = "x86" in { // All intrinsics start with "llvm.x86.".		let TargetPrefix = "x86" in { // All intrinsics start with "llvm.x86.".
def int_x86_avx2_pmovmskb : GCCBuiltin<"__builtin_ia32_pmovmskb256">,
Intrinsic<[llvm_i32_ty], [llvm_v32i8_ty], [IntrNoMem]>;
def int_x86_avx2_pshuf_b : GCCBuiltin<"__builtin_ia32_pshufb256">,		def int_x86_avx2_pshuf_b : GCCBuiltin<"__builtin_ia32_pshufb256">,
Intrinsic<[llvm_v32i8_ty], [llvm_v32i8_ty,		Intrinsic<[llvm_v32i8_ty], [llvm_v32i8_ty,
llvm_v32i8_ty], [IntrNoMem]>;		llvm_v32i8_ty], [IntrNoMem]>;
def int_x86_avx2_mpsadbw : GCCBuiltin<"__builtin_ia32_mpsadbw256">,		def int_x86_avx2_mpsadbw : GCCBuiltin<"__builtin_ia32_mpsadbw256">,
Intrinsic<[llvm_v16i16_ty], [llvm_v32i8_ty, llvm_v32i8_ty,		Intrinsic<[llvm_v16i16_ty], [llvm_v32i8_ty, llvm_v32i8_ty,
llvm_i8_ty], [IntrNoMem, Commutative]>;		llvm_i8_ty], [IntrNoMem, Commutative]>;
}		}

▲ Show 20 Lines • Show All 4,326 Lines • Show Last 20 Lines

lib/IR/AutoUpgrade.cpp

Show First 20 Lines • Show All 197 Lines • ▼ Show 20 Lines	if (Name=="ssse3.pabs.b.128" \|\| // Added in 6.0
Name.startswith("avx512.mask.psrli") \|\| // Added in 4.0		Name.startswith("avx512.mask.psrli") \|\| // Added in 4.0
Name.startswith("avx512.mask.psllv") \|\| // Added in 4.0		Name.startswith("avx512.mask.psllv") \|\| // Added in 4.0
Name.startswith("avx512.mask.psrav") \|\| // Added in 4.0		Name.startswith("avx512.mask.psrav") \|\| // Added in 4.0
Name.startswith("avx512.mask.psrlv") \|\| // Added in 4.0		Name.startswith("avx512.mask.psrlv") \|\| // Added in 4.0
Name.startswith("sse41.pmovsx") \|\| // Added in 3.8		Name.startswith("sse41.pmovsx") \|\| // Added in 3.8
Name.startswith("sse41.pmovzx") \|\| // Added in 3.9		Name.startswith("sse41.pmovzx") \|\| // Added in 3.9
Name.startswith("avx2.pmovsx") \|\| // Added in 3.9		Name.startswith("avx2.pmovsx") \|\| // Added in 3.9
Name.startswith("avx2.pmovzx") \|\| // Added in 3.9		Name.startswith("avx2.pmovzx") \|\| // Added in 3.9
		Name.startswith("sse.movmsk.ps") \|\| // Added in 6.0
		guyblankUnsubmitted Not Done Reply Inline Actions what's this one? i don't see it in the removed intrinsics guyblank: what's this one? i don't see it in the removed intrinsics
		Name.startswith("sse2.movmsk.pd") \|\| // Added in 6.0
		Name.startswith("sse2.pmovmskb.128") \|\| // Added in 6.0
		guyblankUnsubmitted Done Reply Inline Actions this one also guyblank: this one also
		Name.startswith("avx.movmsk.pd.256") \|\| // Added in 6.0
		Name.startswith("avx.movmsk.ps.256") \|\| // Added in 6.0
		Name.startswith("avx2.pmovmskb") \|\| // Added in 6.0
Name.startswith("avx512.mask.pmovsx") \|\| // Added in 4.0		Name.startswith("avx512.mask.pmovsx") \|\| // Added in 4.0
Name.startswith("avx512.mask.pmovzx") \|\| // Added in 4.0		Name.startswith("avx512.mask.pmovzx") \|\| // Added in 4.0
Name.startswith("avx512.mask.lzcnt.") \|\| // Added in 5.0		Name.startswith("avx512.mask.lzcnt.") \|\| // Added in 5.0
Name == "sse2.cvtdq2pd" \|\| // Added in 3.9		Name == "sse2.cvtdq2pd" \|\| // Added in 3.9
Name == "sse2.cvtps2pd" \|\| // Added in 3.9		Name == "sse2.cvtps2pd" \|\| // Added in 3.9
Name == "avx.cvtdq2.pd.256" \|\| // Added in 3.9		Name == "avx.cvtdq2.pd.256" \|\| // Added in 3.9
Name == "avx.cvt.ps2.pd.256" \|\| // Added in 3.9		Name == "avx.cvt.ps2.pd.256" \|\| // Added in 3.9
Name.startswith("avx.vinsertf128.") \|\| // Added in 3.7		Name.startswith("avx.vinsertf128.") \|\| // Added in 3.7
▲ Show 20 Lines • Show All 691 Lines • ▼ Show 20 Lines
static Value* UpgradeMaskToInt(IRBuilder<> &Builder, CallInst &CI) {		static Value* UpgradeMaskToInt(IRBuilder<> &Builder, CallInst &CI) {
Value* Op = CI.getArgOperand(0);		Value* Op = CI.getArgOperand(0);
Type* ReturnOp = CI.getType();		Type* ReturnOp = CI.getType();
unsigned NumElts = CI.getType()->getVectorNumElements();		unsigned NumElts = CI.getType()->getVectorNumElements();
Value *Mask = getX86MaskVec(Builder, Op, NumElts);		Value *Mask = getX86MaskVec(Builder, Op, NumElts);
return Builder.CreateSExt(Mask, ReturnOp, "vpmovm2");		return Builder.CreateSExt(Mask, ReturnOp, "vpmovm2");
}		}

		static Value EmitX86Mask(IRBuilder<> &Builder, ArrayRef<Value > Ops) {
		guyblankUnsubmitted Done Reply Inline Actions typo EmitX86Msak -> EmitX86Mask guyblank: typo EmitX86Msak -> EmitX86Mask
		Type *Typ1 = Ops[0]->getType();
		Value *Cmp = Builder.CreateICmp(CmpInst::Predicate::ICMP_SLT, Ops[0],
		ConstantVector::getNullValue(Typ1));
		Value *BitCast = Builder.CreateBitCast(
		Cmp, Type::getIntNTy(Builder.getContext(), Typ1->getVectorNumElements()));
		return (Typ1->getVectorNumElements() < 32)
		? Builder.CreateZExt(BitCast,
		Type::getInt32Ty(Builder.getContext()))
		: BitCast;
		}

		/// Converting floating point (32/64 bit) into integer.
		static Value EmitX86MaskFloat(IRBuilder<> &Builder, ArrayRef<Value > Ops) {
		guyblankUnsubmitted Done Reply Inline Actions typo, same as above guyblank: typo, same as above
		unsigned DstTypEle = Ops[0]->getType()->getVectorNumElements();
		Type *New = Ops[0]->getType()->getScalarSizeInBits() == 32
		? Type::getInt32Ty(Builder.getContext())
		: Type::getInt64Ty(Builder.getContext());
		Type *DstTyp = VectorType::get(New, DstTypEle);
		Value *BitCastFloatToInt = Builder.CreateBitCast(Ops[0], DstTyp);
		return EmitX86Mask(Builder, BitCastFloatToInt);
		}

/// Upgrade a call to an old intrinsic. All argument and return casting must be		/// Upgrade a call to an old intrinsic. All argument and return casting must be
/// provided to seamlessly integrate with existing context.		/// provided to seamlessly integrate with existing context.
void llvm::UpgradeIntrinsicCall(CallInst CI, Function NewFn) {		void llvm::UpgradeIntrinsicCall(CallInst CI, Function NewFn) {
Function *F = CI->getCalledFunction();		Function *F = CI->getCalledFunction();
LLVMContext &C = CI->getContext();		LLVMContext &C = CI->getContext();
IRBuilder<> Builder(C);		IRBuilder<> Builder(C);
Builder.SetInsertPoint(CI->getParent(), CI->getIterator());		Builder.SetInsertPoint(CI->getParent(), CI->getIterator());

▲ Show 20 Lines • Show All 352 Lines • ▼ Show 20 Lines	if (IsX86 && (Name.startswith("sse2.pcmp") \|\|

bool DoSext = (StringRef::npos != Name.find("pmovsx"));		bool DoSext = (StringRef::npos != Name.find("pmovsx"));
Rep = DoSext ? Builder.CreateSExt(SV, DstTy)		Rep = DoSext ? Builder.CreateSExt(SV, DstTy)
: Builder.CreateZExt(SV, DstTy);		: Builder.CreateZExt(SV, DstTy);
// If there are 3 arguments, it's a masked intrinsic so we need a select.		// If there are 3 arguments, it's a masked intrinsic so we need a select.
if (CI->getNumArgOperands() == 3)		if (CI->getNumArgOperands() == 3)
Rep = EmitX86Select(Builder, CI->getArgOperand(2), Rep,		Rep = EmitX86Select(Builder, CI->getArgOperand(2), Rep,
CI->getArgOperand(1));		CI->getArgOperand(1));
		} else if (IsX86 && (Name.startswith("avx2.pmovmskb")\|\|
		(Name.startswith("sse2.pmovmskb.128")))) {
		Rep = EmitX86Mask(Builder, CI->getOperand(0));
		} else if (IsX86 && (Name.startswith("sse.movmsk.ps") \|\|
		Name.startswith("sse2.movmsk.pd") \|\|
		guyblankUnsubmitted Done Reply Inline Actions same one from above guyblank: same one from above
		Name.startswith("avx.movmsk.pd.256") \|\|
		Name.startswith("avx.movmsk.ps.256"))) {
		Rep = EmitX86MaskFloat(Builder, CI->getOperand(0));
} else if (IsX86 && (Name.startswith("avx.vbroadcastf128") \|\|		} else if (IsX86 && (Name.startswith("avx.vbroadcastf128") \|\|
Name == "avx2.vbroadcasti128")) {		Name == "avx2.vbroadcasti128")) {
// Replace vbroadcastf128/vbroadcasti128 with a vector load+shuffle.		// Replace vbroadcastf128/vbroadcasti128 with a vector load+shuffle.
Type *EltTy = CI->getType()->getVectorElementType();		Type *EltTy = CI->getType()->getVectorElementType();
unsigned NumSrcElts = 128 / EltTy->getPrimitiveSizeInBits();		unsigned NumSrcElts = 128 / EltTy->getPrimitiveSizeInBits();
Type *VT = VectorType::get(EltTy, NumSrcElts);		Type *VT = VectorType::get(EltTy, NumSrcElts);
Value *Op = Builder.CreatePointerCast(CI->getArgOperand(0),		Value *Op = Builder.CreatePointerCast(CI->getArgOperand(0),
PointerType::getUnqual(VT));		PointerType::getUnqual(VT));
▲ Show 20 Lines • Show All 1,306 Lines • Show Last 20 Lines

lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 30,118 Lines • ▼ Show 20 Lines	if (VT == MVT::x86mmx && SrcVT == MVT::v2i32 &&
N0.getOpcode() == ISD::FP_TO_SINT) {		N0.getOpcode() == ISD::FP_TO_SINT) {
SDLoc DL(N0);		SDLoc DL(N0);
SDValue Res = DAG.getNode(ISD::CONCAT_VECTORS, DL, MVT::v4i32, N0,		SDValue Res = DAG.getNode(ISD::CONCAT_VECTORS, DL, MVT::v4i32, N0,
DAG.getUNDEF(MVT::v2i32));		DAG.getUNDEF(MVT::v2i32));
return DAG.getNode(X86ISD::MOVDQ2Q, DL, VT,		return DAG.getNode(X86ISD::MOVDQ2Q, DL, VT,
DAG.getBitcast(MVT::v2i64, Res));		DAG.getBitcast(MVT::v2i64, Res));
}		}

		// Combine (bitcast(SETCC Vec , All zero Vec , SETLT),i32/i64) into
		// X86ISDMOVMSK Vec.
		if (N0->getOpcode() == ISD::SETCC && !VT.isFloatingPoint() &&
		!VT.isVector()) {
		ISD::CondCode CC = cast<CondCodeSDNode>(N0.getOperand(2))->get();
		SDValue LHS = N0.getOperand(0);
		SDValue RHS = N0.getOperand(1);
		if (!LHS.isUndef() && isNullConstant(RHS.getOperand(0)) &&
		CC == ISD::CondCode::SETLT)
		return DAG.getNode(X86ISD::MOVMSK, SDLoc(N0), VT, LHS);
		}

// Convert a bitcasted integer logic operation that has one bitcasted		// Convert a bitcasted integer logic operation that has one bitcasted
// floating-point operand into a floating-point logic operation. This may		// floating-point operand into a floating-point logic operation. This may
// create a load of a constant, but that is cheaper than materializing the		// create a load of a constant, but that is cheaper than materializing the
// constant in an integer register and transferring it to an SSE register or		// constant in an integer register and transferring it to an SSE register or
// transferring the SSE operand to integer register and back.		// transferring the SSE operand to integer register and back.
unsigned FPOpcode;		unsigned FPOpcode;
switch (N0.getOpcode()) {		switch (N0.getOpcode()) {
case ISD::AND: FPOpcode = X86ISD::FAND; break;		case ISD::AND: FPOpcode = X86ISD::FAND; break;
Show All 19 Lines	static SDValue combineBitcast(SDNode *N, SelectionDAG &DAG,
}		}
// bitcast(logic(X, bitcast(Y))) --> logic'(bitcast(X), Y)		// bitcast(logic(X, bitcast(Y))) --> logic'(bitcast(X), Y)
if (N0.hasOneUse() && LogicOp1.getOpcode() == ISD::BITCAST &&		if (N0.hasOneUse() && LogicOp1.getOpcode() == ISD::BITCAST &&
LogicOp1.hasOneUse() && LogicOp1.getOperand(0).getValueType() == VT &&		LogicOp1.hasOneUse() && LogicOp1.getOperand(0).getValueType() == VT &&
!isa<ConstantSDNode>(LogicOp1.getOperand(0))) {		!isa<ConstantSDNode>(LogicOp1.getOperand(0))) {
SDValue CastedOp0 = DAG.getBitcast(VT, LogicOp0);		SDValue CastedOp0 = DAG.getBitcast(VT, LogicOp0);
return DAG.getNode(FPOpcode, DL0, VT, LogicOp1.getOperand(0), CastedOp0);		return DAG.getNode(FPOpcode, DL0, VT, LogicOp1.getOperand(0), CastedOp0);
}		}

return SDValue();		return SDValue();
}		}

// Match a binop + shuffle pyramid that represents a horizontal reduction over		// Match a binop + shuffle pyramid that represents a horizontal reduction over
// the elements of a vector.		// the elements of a vector.
// Returns the vector that is being reduced on, or SDValue() if a reduction		// Returns the vector that is being reduced on, or SDValue() if a reduction
// was not matched.		// was not matched.
static SDValue matchBinOpReduction(SDNode *Extract, unsigned &BinOp,		static SDValue matchBinOpReduction(SDNode *Extract, unsigned &BinOp,
▲ Show 20 Lines • Show All 5,517 Lines • ▼ Show 20 Lines	static SDValue combineZext(SDNode *N, SelectionDAG &DAG,
// (i32 zext (and (i8 x86isd::setcc_carry), 1)) ->		// (i32 zext (and (i8 x86isd::setcc_carry), 1)) ->
// (and (i32 x86isd::setcc_carry), 1)		// (and (i32 x86isd::setcc_carry), 1)
// This eliminates the zext. This transformation is necessary because		// This eliminates the zext. This transformation is necessary because
// ISD::SETCC is always legalized to i8.		// ISD::SETCC is always legalized to i8.
SDLoc dl(N);		SDLoc dl(N);
SDValue N0 = N->getOperand(0);		SDValue N0 = N->getOperand(0);
EVT VT = N->getValueType(0);		EVT VT = N->getValueType(0);

		// Combine (i32 zext(bitcast(setcc(bitcast(vec1),vec2)))) => MOVMSK vec1
		guyblankUnsubmitted Not Done Reply Inline Actions should the combines be separate commits? also they need tests guyblank: should the combines be separate commits? also they need tests
		m_zuckermanAuthorUnsubmitted Not Done Reply Inline Actions All the combines are important for the test. Since we deleted intrinsics name, the front end IR doesn't aware of names. And so instcombinecall cant works for them. For satisfying the tests, we had to add new combines that replace the old (instcombinecall). All the combines are already covered by original tests. m_zuckerman: All the combines are important for the test. Since we deleted intrinsics name, the front end IR…
		// Combine (i64 zext(bitcast(setcc(bitcast(vec1),vec2)))) =>
		// (i64 zext(MOVMSK vec1))
		if ((VT == MVT::i32 \|\| VT == MVT::i64) && N0.getOpcode() == ISD::BITCAST &&
		N0.getOperand(0).getOpcode() == ISD::SETCC) {
		SDValue N00 = N0.getOperand(0);
		if (N00.getOperand(0).getOpcode() == ISD::BITCAST &&
		N00.getOperand(0).getOperand(0).getValueType().isFloatingPoint()) {
		SDValue MaskI32 =
		DAG.getNode(X86ISD::MOVMSK, dl, MVT::i32,
		N0.getOperand(0).getOperand(0).getOperand(0));
		return (VT == MVT::i32)
		? MaskI32
		: DAG.getNode(ISD::SIGN_EXTEND, dl, MVT::i64, MaskI32);
		}
		if (VT == MVT::i32 &&
		N00.getOperand(0).getValueType().getScalarSizeInBits() == 8)
		return DAG.getNode(X86ISD::MOVMSK, dl, VT, N00.getOperand(0));
		}

if (N0.getOpcode() == ISD::AND &&		if (N0.getOpcode() == ISD::AND &&
N0.hasOneUse() &&		N0.hasOneUse() &&
N0.getOperand(0).hasOneUse()) {		N0.getOperand(0).hasOneUse()) {
SDValue N00 = N0.getOperand(0);		SDValue N00 = N0.getOperand(0);
if (N00.getOpcode() == X86ISD::SETCC_CARRY) {		if (N00.getOpcode() == X86ISD::SETCC_CARRY) {
if (!isOneConstant(N0.getOperand(1)))		if (!isOneConstant(N0.getOperand(1)))
return SDValue();		return SDValue();
return DAG.getNode(ISD::AND, dl, VT,		return DAG.getNode(ISD::AND, dl, VT,
Show All 31 Lines	static SDValue combineZext(SDNode *N, SelectionDAG &DAG,
if (SDValue DivRem8 = getDivRem8(N, DAG))		if (SDValue DivRem8 = getDivRem8(N, DAG))
return DivRem8;		return DivRem8;

if (SDValue NewAdd = promoteExtBeforeAdd(N, DAG, Subtarget))		if (SDValue NewAdd = promoteExtBeforeAdd(N, DAG, Subtarget))
return NewAdd;		return NewAdd;

if (SDValue R = combineOrCmpEqZeroToCtlzSrl(N, DAG, DCI, Subtarget))		if (SDValue R = combineOrCmpEqZeroToCtlzSrl(N, DAG, DCI, Subtarget))
return R;		return R;

return SDValue();		return SDValue();
}		}

/// Try to map a 128-bit or larger integer comparison to vector instructions		/// Try to map a 128-bit or larger integer comparison to vector instructions
/// before type legalization splits it up into chunks.		/// before type legalization splits it up into chunks.
static SDValue combineVectorSizedSetCCEquality(SDNode *SetCC, SelectionDAG &DAG,		static SDValue combineVectorSizedSetCCEquality(SDNode *SetCC, SelectionDAG &DAG,
const X86Subtarget &Subtarget) {		const X86Subtarget &Subtarget) {
ISD::CondCode CC = cast<CondCodeSDNode>(SetCC->getOperand(2))->get();		ISD::CondCode CC = cast<CondCodeSDNode>(SetCC->getOperand(2))->get();
▲ Show 20 Lines • Show All 961 Lines • ▼ Show 20 Lines	static SDValue combineTestM(SDNode *N, SelectionDAG &DAG,
// TEST op0, BUILD_VECTOR(all_zero) -> BUILD_VECTOR(all_zero)		// TEST op0, BUILD_VECTOR(all_zero) -> BUILD_VECTOR(all_zero)
// TEST BUILD_VECTOR(all_zero), op1 -> BUILD_VECTOR(all_zero)		// TEST BUILD_VECTOR(all_zero), op1 -> BUILD_VECTOR(all_zero)
if (ISD::isBuildVectorAllZeros(Op0.getNode()) \|\|		if (ISD::isBuildVectorAllZeros(Op0.getNode()) \|\|
ISD::isBuildVectorAllZeros(Op1.getNode()))		ISD::isBuildVectorAllZeros(Op1.getNode()))
return getZeroVector(VT, Subtarget, DAG, DL);		return getZeroVector(VT, Subtarget, DAG, DL);

return SDValue();		return SDValue();
}		}
		// Combine (X86ISD:MOVMSK(SIGN_EXTEND(SETCC Vec1, allzeros, SETLT))) =>
		// (X86ISD:MOVMSK Vec1)
		static SDValue combineMOVMSK(SDNode *N, SelectionDAG &DAG,
		const X86Subtarget &Subtarget) {
		MVT VT = N->getSimpleValueType(0);
		SDLoc DL(N);

		if (N->getOperand(0)->getOpcode() == ISD::SIGN_EXTEND) {
		SDValue N0 = N->getOperand(0);
		if (N0.getOperand(0).getOpcode() == ISD::SETCC) {
		SDValue N00 = N0.getOperand(0);
		SDValue LHS = N00.getOperand(0);
		SDValue RHS = N00.getOperand(1);
		ISD::CondCode CC = cast<CondCodeSDNode>(N00.getOperand(2))->get();
		if (isNullConstant(RHS.getOperand(0)) && CC == ISD::SETLT)
		return DAG.getNode(X86ISD::MOVMSK, DL, MVT::i32, LHS);
		}
		}
		return SDValue();
		}

static SDValue combineVectorCompare(SDNode *N, SelectionDAG &DAG,		static SDValue combineVectorCompare(SDNode *N, SelectionDAG &DAG,
const X86Subtarget &Subtarget) {		const X86Subtarget &Subtarget) {
MVT VT = N->getSimpleValueType(0);		MVT VT = N->getSimpleValueType(0);
SDLoc DL(N);		SDLoc DL(N);

if (N->getOperand(0) == N->getOperand(1)) {		if (N->getOperand(0) == N->getOperand(1)) {
if (N->getOpcode() == X86ISD::PCMPEQ)		if (N->getOpcode() == X86ISD::PCMPEQ)
▲ Show 20 Lines • Show All 289 Lines • ▼ Show 20 Lines	SDValue X86TargetLowering::PerformDAGCombine(SDNode *N,
case X86ISD::FMSUBADD_RND:		case X86ISD::FMSUBADD_RND:
case X86ISD::FMADDSUB:		case X86ISD::FMADDSUB:
case X86ISD::FMSUBADD: return combineFMADDSUB(N, DAG, Subtarget);		case X86ISD::FMSUBADD: return combineFMADDSUB(N, DAG, Subtarget);
case ISD::MGATHER:		case ISD::MGATHER:
case ISD::MSCATTER: return combineGatherScatter(N, DAG, DCI);		case ISD::MSCATTER: return combineGatherScatter(N, DAG, DCI);
case X86ISD::TESTM: return combineTestM(N, DAG, Subtarget);		case X86ISD::TESTM: return combineTestM(N, DAG, Subtarget);
case X86ISD::PCMPEQ:		case X86ISD::PCMPEQ:
case X86ISD::PCMPGT: return combineVectorCompare(N, DAG, Subtarget);		case X86ISD::PCMPGT: return combineVectorCompare(N, DAG, Subtarget);
		case X86ISD::MOVMSK: return combineMOVMSK(N, DAG, Subtarget);
}		}

return SDValue();		return SDValue();
}		}

/// Return true if the target has native support for the specified value type		/// Return true if the target has native support for the specified value type
/// and it is 'desirable' to use the type for the given node type. e.g. On x86		/// and it is 'desirable' to use the type for the given node type. e.g. On x86
/// i16 is legal, but undesirable since i16 instruction encodings are longer and		/// i16 is legal, but undesirable since i16 instruction encodings are longer and
▲ Show 20 Lines • Show All 1,042 Lines • Show Last 20 Lines

lib/Target/X86/X86IntrinsicsInfo.h

Show First 20 Lines • Show All 379 Lines • ▼ Show 20 Lines	static const IntrinsicData IntrinsicsWithoutChain[] = {
X86_INTRINSIC_DATA(avx_hadd_pd_256, INTR_TYPE_2OP, X86ISD::FHADD, 0),		X86_INTRINSIC_DATA(avx_hadd_pd_256, INTR_TYPE_2OP, X86ISD::FHADD, 0),
X86_INTRINSIC_DATA(avx_hadd_ps_256, INTR_TYPE_2OP, X86ISD::FHADD, 0),		X86_INTRINSIC_DATA(avx_hadd_ps_256, INTR_TYPE_2OP, X86ISD::FHADD, 0),
X86_INTRINSIC_DATA(avx_hsub_pd_256, INTR_TYPE_2OP, X86ISD::FHSUB, 0),		X86_INTRINSIC_DATA(avx_hsub_pd_256, INTR_TYPE_2OP, X86ISD::FHSUB, 0),
X86_INTRINSIC_DATA(avx_hsub_ps_256, INTR_TYPE_2OP, X86ISD::FHSUB, 0),		X86_INTRINSIC_DATA(avx_hsub_ps_256, INTR_TYPE_2OP, X86ISD::FHSUB, 0),
X86_INTRINSIC_DATA(avx_max_pd_256, INTR_TYPE_2OP, X86ISD::FMAX, 0),		X86_INTRINSIC_DATA(avx_max_pd_256, INTR_TYPE_2OP, X86ISD::FMAX, 0),
X86_INTRINSIC_DATA(avx_max_ps_256, INTR_TYPE_2OP, X86ISD::FMAX, 0),		X86_INTRINSIC_DATA(avx_max_ps_256, INTR_TYPE_2OP, X86ISD::FMAX, 0),
X86_INTRINSIC_DATA(avx_min_pd_256, INTR_TYPE_2OP, X86ISD::FMIN, 0),		X86_INTRINSIC_DATA(avx_min_pd_256, INTR_TYPE_2OP, X86ISD::FMIN, 0),
X86_INTRINSIC_DATA(avx_min_ps_256, INTR_TYPE_2OP, X86ISD::FMIN, 0),		X86_INTRINSIC_DATA(avx_min_ps_256, INTR_TYPE_2OP, X86ISD::FMIN, 0),
X86_INTRINSIC_DATA(avx_movmsk_pd_256, INTR_TYPE_1OP, X86ISD::MOVMSK, 0),
X86_INTRINSIC_DATA(avx_movmsk_ps_256, INTR_TYPE_1OP, X86ISD::MOVMSK, 0),
X86_INTRINSIC_DATA(avx_rcp_ps_256, INTR_TYPE_1OP, X86ISD::FRCP, 0),		X86_INTRINSIC_DATA(avx_rcp_ps_256, INTR_TYPE_1OP, X86ISD::FRCP, 0),
X86_INTRINSIC_DATA(avx_round_pd_256, ROUNDP, X86ISD::VRNDSCALE, 0),		X86_INTRINSIC_DATA(avx_round_pd_256, ROUNDP, X86ISD::VRNDSCALE, 0),
X86_INTRINSIC_DATA(avx_round_ps_256, ROUNDP, X86ISD::VRNDSCALE, 0),		X86_INTRINSIC_DATA(avx_round_ps_256, ROUNDP, X86ISD::VRNDSCALE, 0),
X86_INTRINSIC_DATA(avx_rsqrt_ps_256, INTR_TYPE_1OP, X86ISD::FRSQRT, 0),		X86_INTRINSIC_DATA(avx_rsqrt_ps_256, INTR_TYPE_1OP, X86ISD::FRSQRT, 0),
X86_INTRINSIC_DATA(avx_sqrt_pd_256, INTR_TYPE_1OP, ISD::FSQRT, 0),		X86_INTRINSIC_DATA(avx_sqrt_pd_256, INTR_TYPE_1OP, ISD::FSQRT, 0),
X86_INTRINSIC_DATA(avx_sqrt_ps_256, INTR_TYPE_1OP, ISD::FSQRT, 0),		X86_INTRINSIC_DATA(avx_sqrt_ps_256, INTR_TYPE_1OP, ISD::FSQRT, 0),
X86_INTRINSIC_DATA(avx_vpermilvar_pd, INTR_TYPE_2OP, X86ISD::VPERMILPV, 0),		X86_INTRINSIC_DATA(avx_vpermilvar_pd, INTR_TYPE_2OP, X86ISD::VPERMILPV, 0),
X86_INTRINSIC_DATA(avx_vpermilvar_pd_256, INTR_TYPE_2OP, X86ISD::VPERMILPV, 0),		X86_INTRINSIC_DATA(avx_vpermilvar_pd_256, INTR_TYPE_2OP, X86ISD::VPERMILPV, 0),
X86_INTRINSIC_DATA(avx_vpermilvar_ps, INTR_TYPE_2OP, X86ISD::VPERMILPV, 0),		X86_INTRINSIC_DATA(avx_vpermilvar_ps, INTR_TYPE_2OP, X86ISD::VPERMILPV, 0),
X86_INTRINSIC_DATA(avx_vpermilvar_ps_256, INTR_TYPE_2OP, X86ISD::VPERMILPV, 0),		X86_INTRINSIC_DATA(avx_vpermilvar_ps_256, INTR_TYPE_2OP, X86ISD::VPERMILPV, 0),
X86_INTRINSIC_DATA(avx2_packssdw, INTR_TYPE_2OP, X86ISD::PACKSS, 0),		X86_INTRINSIC_DATA(avx2_packssdw, INTR_TYPE_2OP, X86ISD::PACKSS, 0),
X86_INTRINSIC_DATA(avx2_packsswb, INTR_TYPE_2OP, X86ISD::PACKSS, 0),		X86_INTRINSIC_DATA(avx2_packsswb, INTR_TYPE_2OP, X86ISD::PACKSS, 0),
X86_INTRINSIC_DATA(avx2_packusdw, INTR_TYPE_2OP, X86ISD::PACKUS, 0),		X86_INTRINSIC_DATA(avx2_packusdw, INTR_TYPE_2OP, X86ISD::PACKUS, 0),
X86_INTRINSIC_DATA(avx2_packuswb, INTR_TYPE_2OP, X86ISD::PACKUS, 0),		X86_INTRINSIC_DATA(avx2_packuswb, INTR_TYPE_2OP, X86ISD::PACKUS, 0),
X86_INTRINSIC_DATA(avx2_padds_b, INTR_TYPE_2OP, X86ISD::ADDS, 0),		X86_INTRINSIC_DATA(avx2_padds_b, INTR_TYPE_2OP, X86ISD::ADDS, 0),
X86_INTRINSIC_DATA(avx2_padds_w, INTR_TYPE_2OP, X86ISD::ADDS, 0),		X86_INTRINSIC_DATA(avx2_padds_w, INTR_TYPE_2OP, X86ISD::ADDS, 0),
X86_INTRINSIC_DATA(avx2_paddus_b, INTR_TYPE_2OP, X86ISD::ADDUS, 0),		X86_INTRINSIC_DATA(avx2_paddus_b, INTR_TYPE_2OP, X86ISD::ADDUS, 0),
X86_INTRINSIC_DATA(avx2_paddus_w, INTR_TYPE_2OP, X86ISD::ADDUS, 0),		X86_INTRINSIC_DATA(avx2_paddus_w, INTR_TYPE_2OP, X86ISD::ADDUS, 0),
X86_INTRINSIC_DATA(avx2_phadd_d, INTR_TYPE_2OP, X86ISD::HADD, 0),		X86_INTRINSIC_DATA(avx2_phadd_d, INTR_TYPE_2OP, X86ISD::HADD, 0),
X86_INTRINSIC_DATA(avx2_phadd_w, INTR_TYPE_2OP, X86ISD::HADD, 0),		X86_INTRINSIC_DATA(avx2_phadd_w, INTR_TYPE_2OP, X86ISD::HADD, 0),
X86_INTRINSIC_DATA(avx2_phsub_d, INTR_TYPE_2OP, X86ISD::HSUB, 0),		X86_INTRINSIC_DATA(avx2_phsub_d, INTR_TYPE_2OP, X86ISD::HSUB, 0),
X86_INTRINSIC_DATA(avx2_phsub_w, INTR_TYPE_2OP, X86ISD::HSUB, 0),		X86_INTRINSIC_DATA(avx2_phsub_w, INTR_TYPE_2OP, X86ISD::HSUB, 0),
X86_INTRINSIC_DATA(avx2_pmadd_ub_sw, INTR_TYPE_2OP, X86ISD::VPMADDUBSW, 0),		X86_INTRINSIC_DATA(avx2_pmadd_ub_sw, INTR_TYPE_2OP, X86ISD::VPMADDUBSW, 0),
X86_INTRINSIC_DATA(avx2_pmadd_wd, INTR_TYPE_2OP, X86ISD::VPMADDWD, 0),		X86_INTRINSIC_DATA(avx2_pmadd_wd, INTR_TYPE_2OP, X86ISD::VPMADDWD, 0),
X86_INTRINSIC_DATA(avx2_pmovmskb, INTR_TYPE_1OP, X86ISD::MOVMSK, 0),
X86_INTRINSIC_DATA(avx2_pmul_dq, INTR_TYPE_2OP, X86ISD::PMULDQ, 0),		X86_INTRINSIC_DATA(avx2_pmul_dq, INTR_TYPE_2OP, X86ISD::PMULDQ, 0),
X86_INTRINSIC_DATA(avx2_pmul_hr_sw, INTR_TYPE_2OP, X86ISD::MULHRS, 0),		X86_INTRINSIC_DATA(avx2_pmul_hr_sw, INTR_TYPE_2OP, X86ISD::MULHRS, 0),
X86_INTRINSIC_DATA(avx2_pmulh_w, INTR_TYPE_2OP, ISD::MULHS, 0),		X86_INTRINSIC_DATA(avx2_pmulh_w, INTR_TYPE_2OP, ISD::MULHS, 0),
X86_INTRINSIC_DATA(avx2_pmulhu_w, INTR_TYPE_2OP, ISD::MULHU, 0),		X86_INTRINSIC_DATA(avx2_pmulhu_w, INTR_TYPE_2OP, ISD::MULHU, 0),
X86_INTRINSIC_DATA(avx2_pmulu_dq, INTR_TYPE_2OP, X86ISD::PMULUDQ, 0),		X86_INTRINSIC_DATA(avx2_pmulu_dq, INTR_TYPE_2OP, X86ISD::PMULUDQ, 0),
X86_INTRINSIC_DATA(avx2_psad_bw, INTR_TYPE_2OP, X86ISD::PSADBW, 0),		X86_INTRINSIC_DATA(avx2_psad_bw, INTR_TYPE_2OP, X86ISD::PSADBW, 0),
X86_INTRINSIC_DATA(avx2_pshuf_b, INTR_TYPE_2OP, X86ISD::PSHUFB, 0),		X86_INTRINSIC_DATA(avx2_pshuf_b, INTR_TYPE_2OP, X86ISD::PSHUFB, 0),
X86_INTRINSIC_DATA(avx2_psll_d, INTR_TYPE_2OP, X86ISD::VSHL, 0),		X86_INTRINSIC_DATA(avx2_psll_d, INTR_TYPE_2OP, X86ISD::VSHL, 0),
▲ Show 20 Lines • Show All 1,169 Lines • ▼ Show 20 Lines
X86_INTRINSIC_DATA(sse_comigt_ss, COMI, X86ISD::COMI, ISD::SETGT),		X86_INTRINSIC_DATA(sse_comigt_ss, COMI, X86ISD::COMI, ISD::SETGT),
X86_INTRINSIC_DATA(sse_comile_ss, COMI, X86ISD::COMI, ISD::SETLE),		X86_INTRINSIC_DATA(sse_comile_ss, COMI, X86ISD::COMI, ISD::SETLE),
X86_INTRINSIC_DATA(sse_comilt_ss, COMI, X86ISD::COMI, ISD::SETLT),		X86_INTRINSIC_DATA(sse_comilt_ss, COMI, X86ISD::COMI, ISD::SETLT),
X86_INTRINSIC_DATA(sse_comineq_ss, COMI, X86ISD::COMI, ISD::SETNE),		X86_INTRINSIC_DATA(sse_comineq_ss, COMI, X86ISD::COMI, ISD::SETNE),
X86_INTRINSIC_DATA(sse_max_ps, INTR_TYPE_2OP, X86ISD::FMAX, 0),		X86_INTRINSIC_DATA(sse_max_ps, INTR_TYPE_2OP, X86ISD::FMAX, 0),
X86_INTRINSIC_DATA(sse_max_ss, INTR_TYPE_2OP, X86ISD::FMAXS, 0),		X86_INTRINSIC_DATA(sse_max_ss, INTR_TYPE_2OP, X86ISD::FMAXS, 0),
X86_INTRINSIC_DATA(sse_min_ps, INTR_TYPE_2OP, X86ISD::FMIN, 0),		X86_INTRINSIC_DATA(sse_min_ps, INTR_TYPE_2OP, X86ISD::FMIN, 0),
X86_INTRINSIC_DATA(sse_min_ss, INTR_TYPE_2OP, X86ISD::FMINS, 0),		X86_INTRINSIC_DATA(sse_min_ss, INTR_TYPE_2OP, X86ISD::FMINS, 0),
X86_INTRINSIC_DATA(sse_movmsk_ps, INTR_TYPE_1OP, X86ISD::MOVMSK, 0),
X86_INTRINSIC_DATA(sse_rcp_ps, INTR_TYPE_1OP, X86ISD::FRCP, 0),		X86_INTRINSIC_DATA(sse_rcp_ps, INTR_TYPE_1OP, X86ISD::FRCP, 0),
X86_INTRINSIC_DATA(sse_rsqrt_ps, INTR_TYPE_1OP, X86ISD::FRSQRT, 0),		X86_INTRINSIC_DATA(sse_rsqrt_ps, INTR_TYPE_1OP, X86ISD::FRSQRT, 0),
X86_INTRINSIC_DATA(sse_sqrt_ps, INTR_TYPE_1OP, ISD::FSQRT, 0),		X86_INTRINSIC_DATA(sse_sqrt_ps, INTR_TYPE_1OP, ISD::FSQRT, 0),
X86_INTRINSIC_DATA(sse_ucomieq_ss, COMI, X86ISD::UCOMI, ISD::SETEQ),		X86_INTRINSIC_DATA(sse_ucomieq_ss, COMI, X86ISD::UCOMI, ISD::SETEQ),
X86_INTRINSIC_DATA(sse_ucomige_ss, COMI, X86ISD::UCOMI, ISD::SETGE),		X86_INTRINSIC_DATA(sse_ucomige_ss, COMI, X86ISD::UCOMI, ISD::SETGE),
X86_INTRINSIC_DATA(sse_ucomigt_ss, COMI, X86ISD::UCOMI, ISD::SETGT),		X86_INTRINSIC_DATA(sse_ucomigt_ss, COMI, X86ISD::UCOMI, ISD::SETGT),
X86_INTRINSIC_DATA(sse_ucomile_ss, COMI, X86ISD::UCOMI, ISD::SETLE),		X86_INTRINSIC_DATA(sse_ucomile_ss, COMI, X86ISD::UCOMI, ISD::SETLE),
X86_INTRINSIC_DATA(sse_ucomilt_ss, COMI, X86ISD::UCOMI, ISD::SETLT),		X86_INTRINSIC_DATA(sse_ucomilt_ss, COMI, X86ISD::UCOMI, ISD::SETLT),
Show All 9 Lines
X86_INTRINSIC_DATA(sse2_cvtpd2dq, INTR_TYPE_1OP, X86ISD::CVTP2SI, 0),		X86_INTRINSIC_DATA(sse2_cvtpd2dq, INTR_TYPE_1OP, X86ISD::CVTP2SI, 0),
X86_INTRINSIC_DATA(sse2_cvtpd2ps, INTR_TYPE_1OP, X86ISD::VFPROUND, 0),		X86_INTRINSIC_DATA(sse2_cvtpd2ps, INTR_TYPE_1OP, X86ISD::VFPROUND, 0),
X86_INTRINSIC_DATA(sse2_cvttpd2dq, INTR_TYPE_1OP, X86ISD::CVTTP2SI, 0),		X86_INTRINSIC_DATA(sse2_cvttpd2dq, INTR_TYPE_1OP, X86ISD::CVTTP2SI, 0),
X86_INTRINSIC_DATA(sse2_cvttps2dq, INTR_TYPE_1OP, ISD::FP_TO_SINT, 0),		X86_INTRINSIC_DATA(sse2_cvttps2dq, INTR_TYPE_1OP, ISD::FP_TO_SINT, 0),
X86_INTRINSIC_DATA(sse2_max_pd, INTR_TYPE_2OP, X86ISD::FMAX, 0),		X86_INTRINSIC_DATA(sse2_max_pd, INTR_TYPE_2OP, X86ISD::FMAX, 0),
X86_INTRINSIC_DATA(sse2_max_sd, INTR_TYPE_2OP, X86ISD::FMAXS, 0),		X86_INTRINSIC_DATA(sse2_max_sd, INTR_TYPE_2OP, X86ISD::FMAXS, 0),
X86_INTRINSIC_DATA(sse2_min_pd, INTR_TYPE_2OP, X86ISD::FMIN, 0),		X86_INTRINSIC_DATA(sse2_min_pd, INTR_TYPE_2OP, X86ISD::FMIN, 0),
X86_INTRINSIC_DATA(sse2_min_sd, INTR_TYPE_2OP, X86ISD::FMINS, 0),		X86_INTRINSIC_DATA(sse2_min_sd, INTR_TYPE_2OP, X86ISD::FMINS, 0),
X86_INTRINSIC_DATA(sse2_movmsk_pd, INTR_TYPE_1OP, X86ISD::MOVMSK, 0),
X86_INTRINSIC_DATA(sse2_packssdw_128, INTR_TYPE_2OP, X86ISD::PACKSS, 0),		X86_INTRINSIC_DATA(sse2_packssdw_128, INTR_TYPE_2OP, X86ISD::PACKSS, 0),
X86_INTRINSIC_DATA(sse2_packsswb_128, INTR_TYPE_2OP, X86ISD::PACKSS, 0),		X86_INTRINSIC_DATA(sse2_packsswb_128, INTR_TYPE_2OP, X86ISD::PACKSS, 0),
X86_INTRINSIC_DATA(sse2_packuswb_128, INTR_TYPE_2OP, X86ISD::PACKUS, 0),		X86_INTRINSIC_DATA(sse2_packuswb_128, INTR_TYPE_2OP, X86ISD::PACKUS, 0),
X86_INTRINSIC_DATA(sse2_padds_b, INTR_TYPE_2OP, X86ISD::ADDS, 0),		X86_INTRINSIC_DATA(sse2_padds_b, INTR_TYPE_2OP, X86ISD::ADDS, 0),
X86_INTRINSIC_DATA(sse2_padds_w, INTR_TYPE_2OP, X86ISD::ADDS, 0),		X86_INTRINSIC_DATA(sse2_padds_w, INTR_TYPE_2OP, X86ISD::ADDS, 0),
X86_INTRINSIC_DATA(sse2_paddus_b, INTR_TYPE_2OP, X86ISD::ADDUS, 0),		X86_INTRINSIC_DATA(sse2_paddus_b, INTR_TYPE_2OP, X86ISD::ADDUS, 0),
X86_INTRINSIC_DATA(sse2_paddus_w, INTR_TYPE_2OP, X86ISD::ADDUS, 0),		X86_INTRINSIC_DATA(sse2_paddus_w, INTR_TYPE_2OP, X86ISD::ADDUS, 0),
X86_INTRINSIC_DATA(sse2_pmadd_wd, INTR_TYPE_2OP, X86ISD::VPMADDWD, 0),		X86_INTRINSIC_DATA(sse2_pmadd_wd, INTR_TYPE_2OP, X86ISD::VPMADDWD, 0),
X86_INTRINSIC_DATA(sse2_pmovmskb_128, INTR_TYPE_1OP, X86ISD::MOVMSK, 0),
X86_INTRINSIC_DATA(sse2_pmulh_w, INTR_TYPE_2OP, ISD::MULHS, 0),		X86_INTRINSIC_DATA(sse2_pmulh_w, INTR_TYPE_2OP, ISD::MULHS, 0),
X86_INTRINSIC_DATA(sse2_pmulhu_w, INTR_TYPE_2OP, ISD::MULHU, 0),		X86_INTRINSIC_DATA(sse2_pmulhu_w, INTR_TYPE_2OP, ISD::MULHU, 0),
X86_INTRINSIC_DATA(sse2_pmulu_dq, INTR_TYPE_2OP, X86ISD::PMULUDQ, 0),		X86_INTRINSIC_DATA(sse2_pmulu_dq, INTR_TYPE_2OP, X86ISD::PMULUDQ, 0),
X86_INTRINSIC_DATA(sse2_psad_bw, INTR_TYPE_2OP, X86ISD::PSADBW, 0),		X86_INTRINSIC_DATA(sse2_psad_bw, INTR_TYPE_2OP, X86ISD::PSADBW, 0),
X86_INTRINSIC_DATA(sse2_psll_d, INTR_TYPE_2OP, X86ISD::VSHL, 0),		X86_INTRINSIC_DATA(sse2_psll_d, INTR_TYPE_2OP, X86ISD::VSHL, 0),
X86_INTRINSIC_DATA(sse2_psll_q, INTR_TYPE_2OP, X86ISD::VSHL, 0),		X86_INTRINSIC_DATA(sse2_psll_q, INTR_TYPE_2OP, X86ISD::VSHL, 0),
X86_INTRINSIC_DATA(sse2_psll_w, INTR_TYPE_2OP, X86ISD::VSHL, 0),		X86_INTRINSIC_DATA(sse2_psll_w, INTR_TYPE_2OP, X86ISD::VSHL, 0),
X86_INTRINSIC_DATA(sse2_pslli_d, VSHIFT, X86ISD::VSHLI, 0),		X86_INTRINSIC_DATA(sse2_pslli_d, VSHIFT, X86ISD::VSHLI, 0),
▲ Show 20 Lines • Show All 111 Lines • Show Last 20 Lines

lib/Transforms/InstCombine/InstCombineCalls.cpp

Show First 20 Lines • Show All 2,313 Lines • ▼ Show 20 Lines	case Intrinsic::x86_avx512_cvttsd2usi64: {
if (Value *V = SimplifyDemandedVectorEltsLow(Arg, VWidth, 1)) {		if (Value *V = SimplifyDemandedVectorEltsLow(Arg, VWidth, 1)) {
II->setArgOperand(0, V);		II->setArgOperand(0, V);
return II;		return II;
}		}
break;		break;
}		}

case Intrinsic::x86_mmx_pmovmskb:		case Intrinsic::x86_mmx_pmovmskb:
case Intrinsic::x86_sse_movmsk_ps:
case Intrinsic::x86_sse2_movmsk_pd:
case Intrinsic::x86_sse2_pmovmskb_128:
case Intrinsic::x86_avx_movmsk_pd_256:
case Intrinsic::x86_avx_movmsk_ps_256:
case Intrinsic::x86_avx2_pmovmskb:
if (Value V = simplifyX86movmsk(II))		if (Value V = simplifyX86movmsk(II))
return replaceInstUsesWith(*II, V);		return replaceInstUsesWith(*II, V);
break;		break;

case Intrinsic::x86_sse_comieq_ss:		case Intrinsic::x86_sse_comieq_ss:
case Intrinsic::x86_sse_comige_ss:		case Intrinsic::x86_sse_comige_ss:
case Intrinsic::x86_sse_comigt_ss:		case Intrinsic::x86_sse_comigt_ss:
case Intrinsic::x86_sse_comile_ss:		case Intrinsic::x86_sse_comile_ss:
▲ Show 20 Lines • Show All 2,074 Lines • Show Last 20 Lines

lib/Transforms/InstCombine/InstCombineSimplifyDemanded.cpp

Show First 20 Lines • Show All 632 Lines • ▼ Show 20 Lines	if (IntrinsicInst *II = dyn_cast<IntrinsicInst>(I)) {
NewVal->takeName(I);		NewVal->takeName(I);
return InsertNewInstWith(NewVal, *I);		return InsertNewInstWith(NewVal, *I);
}		}

// TODO: Could compute known zero/one bits based on the input.		// TODO: Could compute known zero/one bits based on the input.
break;		break;
}		}
case Intrinsic::x86_mmx_pmovmskb:		case Intrinsic::x86_mmx_pmovmskb:
case Intrinsic::x86_sse_movmsk_ps:		{
case Intrinsic::x86_sse2_movmsk_pd:
case Intrinsic::x86_sse2_pmovmskb_128:
case Intrinsic::x86_avx_movmsk_ps_256:
case Intrinsic::x86_avx_movmsk_pd_256:
case Intrinsic::x86_avx2_pmovmskb: {
// MOVMSK copies the vector elements' sign bits to the low bits		// MOVMSK copies the vector elements' sign bits to the low bits
// and zeros the high bits.		// and zeros the high bits.
unsigned ArgWidth;		unsigned ArgWidth;
if (II->getIntrinsicID() == Intrinsic::x86_mmx_pmovmskb) {		if (II->getIntrinsicID() == Intrinsic::x86_mmx_pmovmskb) {
ArgWidth = 8; // Arg is x86_mmx, but treated as <8 x i8>.		ArgWidth = 8; // Arg is x86_mmx, but treated as <8 x i8>.
} else {		} else {
auto Arg = II->getArgOperand(0);		auto Arg = II->getArgOperand(0);
auto ArgType = cast<VectorType>(Arg->getType());		auto ArgType = cast<VectorType>(Arg->getType());
▲ Show 20 Lines • Show All 1,028 Lines • Show Last 20 Lines

test/CodeGen/X86/avx-intrinsics-fast-isel.ll

Show First 20 Lines • Show All 1,533 Lines • ▼ Show 20 Lines	; X64-NEXT: retq
%res = call i32 @llvm.x86.avx.movmsk.pd.256(<4 x double> %a0)		%res = call i32 @llvm.x86.avx.movmsk.pd.256(<4 x double> %a0)
ret i32 %res		ret i32 %res
}		}
declare i32 @llvm.x86.avx.movmsk.pd.256(<4 x double>) nounwind readnone		declare i32 @llvm.x86.avx.movmsk.pd.256(<4 x double>) nounwind readnone

define i32 @test_mm256_movemask_ps(<8 x float> %a0) nounwind {		define i32 @test_mm256_movemask_ps(<8 x float> %a0) nounwind {
; X32-LABEL: test_mm256_movemask_ps:		; X32-LABEL: test_mm256_movemask_ps:
; X32: # BB#0:		; X32: # BB#0:
		; X32-NEXT: vextractf128 $1, %ymm0, %xmm1
		; X32-NEXT: vpxor %xmm2, %xmm2, %xmm2
		; X32-NEXT: vpcmpgtd %xmm1, %xmm2, %xmm1
		; X32-NEXT: vpcmpgtd %xmm0, %xmm2, %xmm0
		; X32-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
; X32-NEXT: vmovmskps %ymm0, %eax		; X32-NEXT: vmovmskps %ymm0, %eax
		; X32-NEXT: movzbl %al, %eax
; X32-NEXT: vzeroupper		; X32-NEXT: vzeroupper
; X32-NEXT: retl		; X32-NEXT: retl
;		;
; X64-LABEL: test_mm256_movemask_ps:		; X64-LABEL: test_mm256_movemask_ps:
; X64: # BB#0:		; X64: # BB#0:
		; X64-NEXT: vextractf128 $1, %ymm0, %xmm1
		; X64-NEXT: vpxor %xmm2, %xmm2, %xmm2
		; X64-NEXT: vpcmpgtd %xmm1, %xmm2, %xmm1
		; X64-NEXT: vpcmpgtd %xmm0, %xmm2, %xmm0
		; X64-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
; X64-NEXT: vmovmskps %ymm0, %eax		; X64-NEXT: vmovmskps %ymm0, %eax
		; X64-NEXT: movzbl %al, %eax
; X64-NEXT: vzeroupper		; X64-NEXT: vzeroupper
; X64-NEXT: retq		; X64-NEXT: retq
%res = call i32 @llvm.x86.avx.movmsk.ps.256(<8 x float> %a0)		%res = call i32 @llvm.x86.avx.movmsk.ps.256(<8 x float> %a0)
ret i32 %res		ret i32 %res
}		}
declare i32 @llvm.x86.avx.movmsk.ps.256(<8 x float>) nounwind readnone		declare i32 @llvm.x86.avx.movmsk.ps.256(<8 x float>) nounwind readnone

define <4 x double> @test_mm256_mul_pd(<4 x double> %a0, <4 x double> %a1) nounwind {		define <4 x double> @test_mm256_mul_pd(<4 x double> %a0, <4 x double> %a1) nounwind {
▲ Show 20 Lines • Show All 2,263 Lines • Show Last 20 Lines

test/CodeGen/X86/broadcastm-lowering.ll

Show All 37 Lines	entry:
%vecinit.i.i = insertelement <2 x i64> undef, i64 %conv.i, i32 0		%vecinit.i.i = insertelement <2 x i64> undef, i64 %conv.i, i32 0
%vecinit1.i.i = shufflevector <2 x i64> %vecinit.i.i, <2 x i64> undef, <2 x i32> zeroinitializer		%vecinit1.i.i = shufflevector <2 x i64> %vecinit.i.i, <2 x i64> undef, <2 x i32> zeroinitializer
ret <2 x i64> %vecinit1.i.i		ret <2 x i64> %vecinit1.i.i
}		}

define <4 x i32> @test_mm_epi32(<16 x i8> %a, <16 x i8> %b) {		define <4 x i32> @test_mm_epi32(<16 x i8> %a, <16 x i8> %b) {
; AVX512CD-LABEL: test_mm_epi32:		; AVX512CD-LABEL: test_mm_epi32:
; AVX512CD: # BB#0: # %entry		; AVX512CD: # BB#0: # %entry
; AVX512CD-NEXT: vpcmpeqb %xmm1, %xmm0, %xmm0		; AVX512CD-NEXT: vpmovmskb %xmm0, %eax
; AVX512CD-NEXT: vpmovsxbd %xmm0, %zmm0		; AVX512CD-NEXT: vmovd %eax, %xmm0
; AVX512CD-NEXT: vpslld $31, %zmm0, %zmm0		; AVX512CD-NEXT: vpbroadcastd %xmm0, %xmm0
; AVX512CD-NEXT: vptestmd %zmm0, %zmm0, %k0
; AVX512CD-NEXT: kmovw %k0, %eax
; AVX512CD-NEXT: vpxor %xmm0, %xmm0, %xmm0
; AVX512CD-NEXT: vpinsrw $0, %eax, %xmm0, %xmm0
; AVX512CD-NEXT: vpinsrw $2, %eax, %xmm0, %xmm0
; AVX512CD-NEXT: vpinsrw $4, %eax, %xmm0, %xmm0
; AVX512CD-NEXT: vpinsrw $6, %eax, %xmm0, %xmm0
; AVX512CD-NEXT: vzeroupper
; AVX512CD-NEXT: retq		; AVX512CD-NEXT: retq
;		;
; AVX512VLCDBW-LABEL: test_mm_epi32:		; AVX512VLCDBW-LABEL: test_mm_epi32:
; AVX512VLCDBW: # BB#0: # %entry		; AVX512VLCDBW: # BB#0: # %entry
; AVX512VLCDBW-NEXT: vpcmpeqb %xmm1, %xmm0, %k0		; AVX512VLCDBW-NEXT: vpmovmskb %xmm0, %eax
; AVX512VLCDBW-NEXT: vpbroadcastmw2d %k0, %xmm0		; AVX512VLCDBW-NEXT: vpbroadcastd %eax, %xmm0
; AVX512VLCDBW-NEXT: retq		; AVX512VLCDBW-NEXT: retq
;		;
; X86-AVX512VLCDBW-LABEL: test_mm_epi32:		; X86-AVX512VLCDBW-LABEL: test_mm_epi32:
; X86-AVX512VLCDBW: # BB#0: # %entry		; X86-AVX512VLCDBW: # BB#0: # %entry
; X86-AVX512VLCDBW-NEXT: vpcmpeqb %xmm1, %xmm0, %k0		; X86-AVX512VLCDBW-NEXT: vpmovmskb %xmm0, %eax
; X86-AVX512VLCDBW-NEXT: vpbroadcastmw2d %k0, %xmm0		; X86-AVX512VLCDBW-NEXT: vpbroadcastd %eax, %xmm0
; X86-AVX512VLCDBW-NEXT: retl		; X86-AVX512VLCDBW-NEXT: retl
entry:		entry:
%0 = icmp eq <16 x i8> %a, %b		%0 = icmp eq <16 x i8> %a, %b
%1 = bitcast <16 x i1> %0 to i16		%1 = bitcast <16 x i1> %0 to i16
%conv.i = zext i16 %1 to i32		%conv.i = zext i16 %1 to i32
%vecinit.i.i = insertelement <4 x i32> undef, i32 %conv.i, i32 0		%vecinit.i.i = insertelement <4 x i32> undef, i32 %conv.i, i32 0
%vecinit3.i.i = shufflevector <4 x i32> %vecinit.i.i, <4 x i32> undef, <4 x i32> zeroinitializer		%vecinit3.i.i = shufflevector <4 x i32> %vecinit.i.i, <4 x i32> undef, <4 x i32> zeroinitializer
ret <4 x i32> %vecinit3.i.i		ret <4 x i32> %vecinit3.i.i
▲ Show 20 Lines • Show All 136 Lines • Show Last 20 Lines

test/CodeGen/X86/movmsk.ll

Show First 20 Lines • Show All 127 Lines • ▼ Show 20 Lines	entry:
%arrayidx = getelementptr inbounds i32, i32* %indexTable, i64 %idxprom		%arrayidx = getelementptr inbounds i32, i32* %indexTable, i64 %idxprom
%1 = load i32, i32* %arrayidx, align 4		%1 = load i32, i32* %arrayidx, align 4
ret i32 %1		ret i32 %1
}		}

define i32 @t2(<4 x float> %x, i32* nocapture %indexTable) nounwind uwtable readonly ssp {		define i32 @t2(<4 x float> %x, i32* nocapture %indexTable) nounwind uwtable readonly ssp {
; CHECK-LABEL: t2:		; CHECK-LABEL: t2:
; CHECK: ## BB#0: ## %entry		; CHECK: ## BB#0: ## %entry
; CHECK-NEXT: movmskpd %xmm0, %eax		; CHECK-NEXT: movmskps %xmm0, %eax
		guyblankUnsubmitted Not Done Reply Inline Actions this doesn't seem right, what happened here? guyblank: this doesn't seem right, what happened here?
; CHECK-NEXT: movl (%rdi,%rax,4), %eax		; CHECK-NEXT: movl (%rdi,%rax,4), %eax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
entry:		entry:
%0 = bitcast <4 x float> %x to <2 x double>		%0 = bitcast <4 x float> %x to <2 x double>
%1 = tail call i32 @llvm.x86.sse2.movmsk.pd(<2 x double> %0) nounwind		%1 = tail call i32 @llvm.x86.sse2.movmsk.pd(<2 x double> %0) nounwind
%idxprom = sext i32 %1 to i64		%idxprom = sext i32 %1 to i64
%arrayidx = getelementptr inbounds i32, i32* %indexTable, i64 %idxprom		%arrayidx = getelementptr inbounds i32, i32* %indexTable, i64 %idxprom
%2 = load i32, i32* %arrayidx, align 4		%2 = load i32, i32* %arrayidx, align 4
ret i32 %2		ret i32 %2
}		}

declare i32 @llvm.x86.sse2.movmsk.pd(<2 x double>) nounwind readnone		declare i32 @llvm.x86.sse2.movmsk.pd(<2 x double>) nounwind readnone
declare i32 @llvm.x86.sse.movmsk.ps(<4 x float>) nounwind readnone		declare i32 @llvm.x86.sse.movmsk.ps(<4 x float>) nounwind readnone

test/CodeGen/X86/sse2-intrinsics-fast-isel.ll

Show First 20 Lines • Show All 1,820 Lines • ▼ Show 20 Lines	; X64-NEXT: retq
%res1 = insertelement <2 x double> %res0, double %ext1, i32 1		%res1 = insertelement <2 x double> %res0, double %ext1, i32 1
ret <2 x double> %res1		ret <2 x double> %res1
}		}

define i32 @test_mm_movemask_epi8(<2 x i64> %a0) nounwind {		define i32 @test_mm_movemask_epi8(<2 x i64> %a0) nounwind {
; X32-LABEL: test_mm_movemask_epi8:		; X32-LABEL: test_mm_movemask_epi8:
; X32: # BB#0:		; X32: # BB#0:
; X32-NEXT: pmovmskb %xmm0, %eax		; X32-NEXT: pmovmskb %xmm0, %eax
		; X32-NEXT: movzwl %ax, %eax
; X32-NEXT: retl		; X32-NEXT: retl
;		;
; X64-LABEL: test_mm_movemask_epi8:		; X64-LABEL: test_mm_movemask_epi8:
; X64: # BB#0:		; X64: # BB#0:
; X64-NEXT: pmovmskb %xmm0, %eax		; X64-NEXT: pmovmskb %xmm0, %eax
		; X64-NEXT: movzwl %ax, %eax
; X64-NEXT: retq		; X64-NEXT: retq
%arg0 = bitcast <2 x i64> %a0 to <16 x i8>		%arg0 = bitcast <2 x i64> %a0 to <16 x i8>
%res = call i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8> %arg0)		%res = call i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8> %arg0)
ret i32 %res		ret i32 %res
}		}
declare i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8>) nounwind readnone		declare i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8>) nounwind readnone

define i32 @test_mm_movemask_pd(<2 x double> %a0) nounwind {		define i32 @test_mm_movemask_pd(<2 x double> %a0) nounwind {
▲ Show 20 Lines • Show All 2,058 Lines • Show Last 20 Lines

test/Transforms/InstCombine/X86/x86-movmsk.ll

	; NOTE: Assertions have been autogenerated by utils/update_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
				guyblankUnsubmitted Not Done Reply Inline Actions no reason to keep this test anymore, you've removed the combines it is testing. guyblank: no reason to keep this test anymore, you've removed the combines it is testing.
				m_zuckermanAuthorUnsubmitted Not Done Reply Inline Actions The first case is not cover it (MMX) m_zuckerman: The first case is not cover it (MMX)
	; RUN: opt < %s -instcombine -S \| FileCheck %s			; RUN: opt < %s -instcombine -S \| FileCheck %s

	target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"			target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"

	;			;
	; DemandedBits - MOVMSK zeros the upper bits of the result.			; DemandedBits - MOVMSK zeros the upper bits of the result.
	;			;

	define i32 @test_upper_x86_mmx_pmovmskb(x86_mmx %a0) {			define i32 @test_upper_x86_mmx_pmovmskb(x86_mmx %a0) {
	; CHECK-LABEL: @test_upper_x86_mmx_pmovmskb(			; CHECK-LABEL: @test_upper_x86_mmx_pmovmskb(
	; CHECK-NEXT: [[TMP1:%.*]] = call i32 @llvm.x86.mmx.pmovmskb(x86_mmx %a0)			; CHECK-NEXT: [[TMP1:%.]] = call i32 @llvm.x86.mmx.pmovmskb(x86_mmx [[A0:%.]])
	; CHECK-NEXT: ret i32 [[TMP1]]			; CHECK-NEXT: ret i32 [[TMP1]]
	;			;
	%1 = call i32 @llvm.x86.mmx.pmovmskb(x86_mmx %a0)			%1 = call i32 @llvm.x86.mmx.pmovmskb(x86_mmx %a0)
	%2 = and i32 %1, 255			%2 = and i32 %1, 255
	ret i32 %2			ret i32 %2
	}			}

	define i32 @test_upper_x86_sse_movmsk_ps(<4 x float> %a0) {			define i32 @test_upper_x86_sse_movmsk_ps(<4 x float> %a0) {
	; CHECK-LABEL: @test_upper_x86_sse_movmsk_ps(			; CHECK-LABEL: @test_upper_x86_sse_movmsk_ps(
	; CHECK-NEXT: [[TMP1:%.*]] = call i32 @llvm.x86.sse.movmsk.ps(<4 x float> %a0)			; CHECK-NEXT: [[TMP1:%.]] = bitcast <4 x float> [[A0:%.]] to <4 x i32>
	; CHECK-NEXT: ret i32 [[TMP1]]			; CHECK-NEXT: [[TMP2:%.*]] = icmp slt <4 x i32> [[TMP1]], zeroinitializer
				; CHECK-NEXT: [[TMP3:%.*]] = bitcast <4 x i1> [[TMP2]] to i4
				; CHECK-NEXT: [[TMP4:%.*]] = zext i4 [[TMP3]] to i32
				; CHECK-NEXT: ret i32 [[TMP4]]
	;			;
	%1 = call i32 @llvm.x86.sse.movmsk.ps(<4 x float> %a0)			%1 = call i32 @llvm.x86.sse.movmsk.ps(<4 x float> %a0)
	%2 = and i32 %1, 15			%2 = and i32 %1, 15
	ret i32 %2			ret i32 %2
	}			}

	define i32 @test_upper_x86_sse2_movmsk_pd(<2 x double> %a0) {			define i32 @test_upper_x86_sse2_movmsk_pd(<2 x double> %a0) {
	; CHECK-LABEL: @test_upper_x86_sse2_movmsk_pd(			; CHECK-LABEL: @test_upper_x86_sse2_movmsk_pd(
	; CHECK-NEXT: [[TMP1:%.*]] = call i32 @llvm.x86.sse2.movmsk.pd(<2 x double> %a0)			; CHECK-NEXT: [[TMP1:%.]] = bitcast <2 x double> [[A0:%.]] to <2 x i64>
	; CHECK-NEXT: ret i32 [[TMP1]]			; CHECK-NEXT: [[TMP2:%.*]] = icmp slt <2 x i64> [[TMP1]], zeroinitializer
				; CHECK-NEXT: [[TMP3:%.*]] = bitcast <2 x i1> [[TMP2]] to i2
				; CHECK-NEXT: [[TMP4:%.*]] = zext i2 [[TMP3]] to i32
				; CHECK-NEXT: ret i32 [[TMP4]]
	;			;
	%1 = call i32 @llvm.x86.sse2.movmsk.pd(<2 x double> %a0)			%1 = call i32 @llvm.x86.sse2.movmsk.pd(<2 x double> %a0)
	%2 = and i32 %1, 3			%2 = and i32 %1, 3
	ret i32 %2			ret i32 %2
	}			}

	define i32 @test_upper_x86_sse2_pmovmskb_128(<16 x i8> %a0) {			define i32 @test_upper_x86_sse2_pmovmskb_128(<16 x i8> %a0) {
	; CHECK-LABEL: @test_upper_x86_sse2_pmovmskb_128(			; CHECK-LABEL: @test_upper_x86_sse2_pmovmskb_128(
	; CHECK-NEXT: [[TMP1:%.*]] = call i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8> %a0)			; CHECK-NEXT: [[TMP1:%.]] = icmp slt <16 x i8> [[A0:%.]], zeroinitializer
	; CHECK-NEXT: ret i32 [[TMP1]]			; CHECK-NEXT: [[TMP2:%.*]] = bitcast <16 x i1> [[TMP1]] to i16
				; CHECK-NEXT: [[TMP3:%.*]] = zext i16 [[TMP2]] to i32
				; CHECK-NEXT: ret i32 [[TMP3]]
	;			;
	%1 = call i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8> %a0)			%1 = call i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8> %a0)
	%2 = and i32 %1, 65535			%2 = and i32 %1, 65535
	ret i32 %2			ret i32 %2
	}			}

	define i32 @test_upper_x86_avx_movmsk_ps_256(<8 x float> %a0) {			define i32 @test_upper_x86_avx_movmsk_ps_256(<8 x float> %a0) {
	; CHECK-LABEL: @test_upper_x86_avx_movmsk_ps_256(			; CHECK-LABEL: @test_upper_x86_avx_movmsk_ps_256(
	; CHECK-NEXT: [[TMP1:%.*]] = call i32 @llvm.x86.avx.movmsk.ps.256(<8 x float> %a0)			; CHECK-NEXT: [[TMP1:%.]] = bitcast <8 x float> [[A0:%.]] to <8 x i32>
	; CHECK-NEXT: ret i32 [[TMP1]]			; CHECK-NEXT: [[TMP2:%.*]] = icmp slt <8 x i32> [[TMP1]], zeroinitializer
				; CHECK-NEXT: [[TMP3:%.*]] = bitcast <8 x i1> [[TMP2]] to i8
				; CHECK-NEXT: [[TMP4:%.*]] = zext i8 [[TMP3]] to i32
				; CHECK-NEXT: ret i32 [[TMP4]]
	;			;
	%1 = call i32 @llvm.x86.avx.movmsk.ps.256(<8 x float> %a0)			%1 = call i32 @llvm.x86.avx.movmsk.ps.256(<8 x float> %a0)
	%2 = and i32 %1, 255			%2 = and i32 %1, 255
	ret i32 %2			ret i32 %2
	}			}

	define i32 @test_upper_x86_avx_movmsk_pd_256(<4 x double> %a0) {			define i32 @test_upper_x86_avx_movmsk_pd_256(<4 x double> %a0) {
	; CHECK-LABEL: @test_upper_x86_avx_movmsk_pd_256(			; CHECK-LABEL: @test_upper_x86_avx_movmsk_pd_256(
	; CHECK-NEXT: [[TMP1:%.*]] = call i32 @llvm.x86.avx.movmsk.pd.256(<4 x double> %a0)			; CHECK-NEXT: [[TMP1:%.]] = bitcast <4 x double> [[A0:%.]] to <4 x i64>
	; CHECK-NEXT: ret i32 [[TMP1]]			; CHECK-NEXT: [[TMP2:%.*]] = icmp slt <4 x i64> [[TMP1]], zeroinitializer
				; CHECK-NEXT: [[TMP3:%.*]] = bitcast <4 x i1> [[TMP2]] to i4
				; CHECK-NEXT: [[TMP4:%.*]] = zext i4 [[TMP3]] to i32
				; CHECK-NEXT: ret i32 [[TMP4]]
	;			;
	%1 = call i32 @llvm.x86.avx.movmsk.pd.256(<4 x double> %a0)			%1 = call i32 @llvm.x86.avx.movmsk.pd.256(<4 x double> %a0)
	%2 = and i32 %1, 15			%2 = and i32 %1, 15
	ret i32 %2			ret i32 %2
	}			}

	; llvm.x86.avx2.pmovmskb uses the whole of the 32-bit register.			; llvm.x86.avx2.pmovmskb uses the whole of the 32-bit register.

	▲ Show 20 Lines • Show All 253 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[LLVM][X86] Converting X86 intrinisics movmsk{ps|pd}{|256} and pmovmskb{128|256}
Needs ReviewPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 127278

include/llvm/IR/IntrinsicsX86.td

lib/IR/AutoUpgrade.cpp

lib/Target/X86/X86ISelLowering.cpp

lib/Target/X86/X86IntrinsicsInfo.h

lib/Transforms/InstCombine/InstCombineCalls.cpp

lib/Transforms/InstCombine/InstCombineSimplifyDemanded.cpp

test/CodeGen/X86/avx-intrinsics-fast-isel.ll

test/CodeGen/X86/broadcastm-lowering.ll

test/CodeGen/X86/movmsk.ll

test/CodeGen/X86/sse2-intrinsics-fast-isel.ll

test/Transforms/InstCombine/X86/x86-movmsk.ll

This is an archive of the discontinued LLVM Phabricator instance.

[LLVM][X86] Converting X86 intrinisics movmsk{ps|pd}{|256} and pmovmskb{128|256}Needs ReviewPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 127278

include/llvm/IR/IntrinsicsX86.td

lib/IR/AutoUpgrade.cpp

lib/Target/X86/X86ISelLowering.cpp

lib/Target/X86/X86IntrinsicsInfo.h

lib/Transforms/InstCombine/InstCombineCalls.cpp

lib/Transforms/InstCombine/InstCombineSimplifyDemanded.cpp

test/CodeGen/X86/avx-intrinsics-fast-isel.ll

test/CodeGen/X86/broadcastm-lowering.ll

test/CodeGen/X86/movmsk.ll

test/CodeGen/X86/sse2-intrinsics-fast-isel.ll

test/Transforms/InstCombine/X86/x86-movmsk.ll

[LLVM][X86] Converting X86 intrinisics movmsk{ps|pd}{|256} and pmovmskb{128|256}
Needs ReviewPublic