Diff 219810

llvm/trunk/lib/Target/X86/X86ISelLowering.h

Show First 20 Lines • Show All 1,336 Lines • ▼ Show 20 Lines	private:
SDValue lowerEH_SJLJ_LONGJMP(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerEH_SJLJ_LONGJMP(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerEH_SJLJ_SETUP_DISPATCH(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerEH_SJLJ_SETUP_DISPATCH(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerINIT_TRAMPOLINE(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerINIT_TRAMPOLINE(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerFLT_ROUNDS_(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerFLT_ROUNDS_(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerWin64_i128OP(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerWin64_i128OP(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerGC_TRANSITION_START(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerGC_TRANSITION_START(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerGC_TRANSITION_END(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerGC_TRANSITION_END(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerINTRINSIC_WO_CHAIN(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerINTRINSIC_WO_CHAIN(SDValue Op, SelectionDAG &DAG) const;
		SDValue lowerFaddFsub(SDValue Op, SelectionDAG &DAG) const;
		SDValue LowerFP_EXTEND(SDValue Op, SelectionDAG &DAG) const;
		SDValue LowerFP_ROUND(SDValue Op, SelectionDAG &DAG) const;

		SDValue LowerF128Call(SDValue Op, SelectionDAG &DAG,
		RTLIB::Libcall Call) const;

SDValue		SDValue
LowerFormalArguments(SDValue Chain, CallingConv::ID CallConv, bool isVarArg,		LowerFormalArguments(SDValue Chain, CallingConv::ID CallConv, bool isVarArg,
const SmallVectorImpl<ISD::InputArg> &Ins,		const SmallVectorImpl<ISD::InputArg> &Ins,
const SDLoc &dl, SelectionDAG &DAG,		const SDLoc &dl, SelectionDAG &DAG,
SmallVectorImpl<SDValue> &InVals) const override;		SmallVectorImpl<SDValue> &InVals) const override;
SDValue LowerCall(CallLoweringInfo &CLI,		SDValue LowerCall(CallLoweringInfo &CLI,
SmallVectorImpl<SDValue> &InVals) const override;		SmallVectorImpl<SDValue> &InVals) const override;
▲ Show 20 Lines • Show All 321 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 331 Lines • ▼ Show 20 Lines	if (Subtarget.is64Bit())
setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i32, Legal);		setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i32, Legal);
setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i16 , Legal);		setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i16 , Legal);
setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i8 , Legal);		setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i8 , Legal);
setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i1 , Expand);		setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i1 , Expand);

setOperationAction(ISD::FREM , MVT::f32 , Expand);		setOperationAction(ISD::FREM , MVT::f32 , Expand);
setOperationAction(ISD::FREM , MVT::f64 , Expand);		setOperationAction(ISD::FREM , MVT::f64 , Expand);
setOperationAction(ISD::FREM , MVT::f80 , Expand);		setOperationAction(ISD::FREM , MVT::f80 , Expand);
		setOperationAction(ISD::FREM , MVT::f128 , Expand);
setOperationAction(ISD::FLT_ROUNDS_ , MVT::i32 , Custom);		setOperationAction(ISD::FLT_ROUNDS_ , MVT::i32 , Custom);

// Promote the i8 variants and force them on up to i32 which has a shorter		// Promote the i8 variants and force them on up to i32 which has a shorter
// encoding.		// encoding.
setOperationPromotedToType(ISD::CTTZ , MVT::i8 , MVT::i32);		setOperationPromotedToType(ISD::CTTZ , MVT::i8 , MVT::i32);
setOperationPromotedToType(ISD::CTTZ_ZERO_UNDEF, MVT::i8 , MVT::i32);		setOperationPromotedToType(ISD::CTTZ_ZERO_UNDEF, MVT::i8 , MVT::i32);
if (!Subtarget.hasBMI()) {		if (!Subtarget.hasBMI()) {
setOperationAction(ISD::CTTZ , MVT::i16 , Custom);		setOperationAction(ISD::CTTZ , MVT::i16 , Custom);
Show All 30 Lines	X86TargetLowering::X86TargetLowering(const X86TargetMachine &TM,
if (Subtarget.useSoftFloat() \|\| !Subtarget.hasF16C()) {		if (Subtarget.useSoftFloat() \|\| !Subtarget.hasF16C()) {
setOperationAction(ISD::FP16_TO_FP, MVT::f32, Expand);		setOperationAction(ISD::FP16_TO_FP, MVT::f32, Expand);
setOperationAction(ISD::FP_TO_FP16, MVT::f32, Expand);		setOperationAction(ISD::FP_TO_FP16, MVT::f32, Expand);
}		}

// There's never any support for operations beyond MVT::f32.		// There's never any support for operations beyond MVT::f32.
setOperationAction(ISD::FP16_TO_FP, MVT::f64, Expand);		setOperationAction(ISD::FP16_TO_FP, MVT::f64, Expand);
setOperationAction(ISD::FP16_TO_FP, MVT::f80, Expand);		setOperationAction(ISD::FP16_TO_FP, MVT::f80, Expand);
		setOperationAction(ISD::FP16_TO_FP, MVT::f128, Expand);
setOperationAction(ISD::FP_TO_FP16, MVT::f64, Expand);		setOperationAction(ISD::FP_TO_FP16, MVT::f64, Expand);
setOperationAction(ISD::FP_TO_FP16, MVT::f80, Expand);		setOperationAction(ISD::FP_TO_FP16, MVT::f80, Expand);
		setOperationAction(ISD::FP_TO_FP16, MVT::f128, Expand);

setLoadExtAction(ISD::EXTLOAD, MVT::f32, MVT::f16, Expand);		setLoadExtAction(ISD::EXTLOAD, MVT::f32, MVT::f16, Expand);
setLoadExtAction(ISD::EXTLOAD, MVT::f64, MVT::f16, Expand);		setLoadExtAction(ISD::EXTLOAD, MVT::f64, MVT::f16, Expand);
setLoadExtAction(ISD::EXTLOAD, MVT::f80, MVT::f16, Expand);		setLoadExtAction(ISD::EXTLOAD, MVT::f80, MVT::f16, Expand);
		setLoadExtAction(ISD::EXTLOAD, MVT::f128, MVT::f16, Expand);
setTruncStoreAction(MVT::f32, MVT::f16, Expand);		setTruncStoreAction(MVT::f32, MVT::f16, Expand);
setTruncStoreAction(MVT::f64, MVT::f16, Expand);		setTruncStoreAction(MVT::f64, MVT::f16, Expand);
setTruncStoreAction(MVT::f80, MVT::f16, Expand);		setTruncStoreAction(MVT::f80, MVT::f16, Expand);
		setTruncStoreAction(MVT::f128, MVT::f16, Expand);

if (Subtarget.hasPOPCNT()) {		if (Subtarget.hasPOPCNT()) {
setOperationPromotedToType(ISD::CTPOP, MVT::i8, MVT::i32);		setOperationPromotedToType(ISD::CTPOP, MVT::i8, MVT::i32);
} else {		} else {
setOperationAction(ISD::CTPOP , MVT::i8 , Expand);		setOperationAction(ISD::CTPOP , MVT::i8 , Expand);
setOperationAction(ISD::CTPOP , MVT::i16 , Expand);		setOperationAction(ISD::CTPOP , MVT::i16 , Expand);
setOperationAction(ISD::CTPOP , MVT::i32 , Expand);		setOperationAction(ISD::CTPOP , MVT::i32 , Expand);
if (Subtarget.is64Bit())		if (Subtarget.is64Bit())
▲ Show 20 Lines • Show All 217 Lines • ▼ Show 20 Lines	if (isTypeLegal(MVT::f64)) {
} else // SSE immediates.		} else // SSE immediates.
addLegalFPImmediate(APFloat(+0.0)); // xorpd		addLegalFPImmediate(APFloat(+0.0)); // xorpd
}		}

// We don't support FMA.		// We don't support FMA.
setOperationAction(ISD::FMA, MVT::f64, Expand);		setOperationAction(ISD::FMA, MVT::f64, Expand);
setOperationAction(ISD::FMA, MVT::f32, Expand);		setOperationAction(ISD::FMA, MVT::f32, Expand);

// Long double always uses X87, except f128 in SSE.		// f80 always uses X87.
if (UseX87) {		if (UseX87) {
if (Subtarget.is64Bit() && Subtarget.hasSSE1()) {
addRegisterClass(MVT::f128, Subtarget.hasVLX() ? &X86::VR128XRegClass
: &X86::VR128RegClass);
ValueTypeActions.setTypeAction(MVT::f128, TypeSoftenFloat);
setOperationAction(ISD::FABS , MVT::f128, Custom);
setOperationAction(ISD::FNEG , MVT::f128, Custom);
setOperationAction(ISD::FCOPYSIGN, MVT::f128, Custom);

addLegalFPImmediate(APFloat::getZero(APFloat::IEEEquad())); // xorps
}

addRegisterClass(MVT::f80, &X86::RFP80RegClass);		addRegisterClass(MVT::f80, &X86::RFP80RegClass);
setOperationAction(ISD::UNDEF, MVT::f80, Expand);		setOperationAction(ISD::UNDEF, MVT::f80, Expand);
setOperationAction(ISD::FCOPYSIGN, MVT::f80, Expand);		setOperationAction(ISD::FCOPYSIGN, MVT::f80, Expand);
{		{
APFloat TmpFlt = APFloat::getZero(APFloat::x87DoubleExtended());		APFloat TmpFlt = APFloat::getZero(APFloat::x87DoubleExtended());
addLegalFPImmediate(TmpFlt); // FLD0		addLegalFPImmediate(TmpFlt); // FLD0
TmpFlt.changeSign();		TmpFlt.changeSign();
addLegalFPImmediate(TmpFlt); // FLD0/FCHS		addLegalFPImmediate(TmpFlt); // FLD0/FCHS
Show All 19 Lines	if (UseX87) {
setOperationAction(ISD::FNEARBYINT, MVT::f80, Expand);		setOperationAction(ISD::FNEARBYINT, MVT::f80, Expand);
setOperationAction(ISD::FMA, MVT::f80, Expand);		setOperationAction(ISD::FMA, MVT::f80, Expand);
setOperationAction(ISD::LROUND, MVT::f80, Expand);		setOperationAction(ISD::LROUND, MVT::f80, Expand);
setOperationAction(ISD::LLROUND, MVT::f80, Expand);		setOperationAction(ISD::LLROUND, MVT::f80, Expand);
setOperationAction(ISD::LRINT, MVT::f80, Expand);		setOperationAction(ISD::LRINT, MVT::f80, Expand);
setOperationAction(ISD::LLRINT, MVT::f80, Expand);		setOperationAction(ISD::LLRINT, MVT::f80, Expand);
}		}

		// f128 uses xmm registers, but most operations require libcalls.
		if (!Subtarget.useSoftFloat() && Subtarget.is64Bit() && Subtarget.hasSSE1()) {
		addRegisterClass(MVT::f128, Subtarget.hasVLX() ? &X86::VR128XRegClass
		: &X86::VR128RegClass);

		addLegalFPImmediate(APFloat::getZero(APFloat::IEEEquad())); // xorps

		setOperationAction(ISD::FADD, MVT::f128, Custom);
		setOperationAction(ISD::FSUB, MVT::f128, Custom);
		setOperationAction(ISD::FDIV, MVT::f128, Custom);
		setOperationAction(ISD::FMUL, MVT::f128, Custom);
		setOperationAction(ISD::FMA, MVT::f128, Expand);

		setOperationAction(ISD::FABS, MVT::f128, Custom);
		setOperationAction(ISD::FNEG, MVT::f128, Custom);
		setOperationAction(ISD::FCOPYSIGN, MVT::f128, Custom);

		setOperationAction(ISD::FSIN, MVT::f128, Expand);
		setOperationAction(ISD::FCOS, MVT::f128, Expand);
		setOperationAction(ISD::FSINCOS, MVT::f128, Expand);
		setOperationAction(ISD::FSQRT, MVT::f128, Expand);

		setOperationAction(ISD::FP_EXTEND, MVT::f128, Custom);
		// We need to custom handle any FP_ROUND with an f128 input, but
		// LegalizeDAG uses the result type to know when to run a custom handler.
		// So we have to list all legal floating point result types here.
		if (isTypeLegal(MVT::f32)) {
		setOperationAction(ISD::FP_ROUND, MVT::f32, Custom);
		setOperationAction(ISD::STRICT_FP_ROUND, MVT::f32, Custom);
		}
		if (isTypeLegal(MVT::f64)) {
		setOperationAction(ISD::FP_ROUND, MVT::f64, Custom);
		setOperationAction(ISD::STRICT_FP_ROUND, MVT::f64, Custom);
		}
		if (isTypeLegal(MVT::f80)) {
		setOperationAction(ISD::FP_ROUND, MVT::f80, Custom);
		setOperationAction(ISD::STRICT_FP_ROUND, MVT::f80, Custom);
		}

		setOperationAction(ISD::SETCC, MVT::f128, Custom);

		setLoadExtAction(ISD::EXTLOAD, MVT::f128, MVT::f32, Expand);
		setLoadExtAction(ISD::EXTLOAD, MVT::f128, MVT::f64, Expand);
		setLoadExtAction(ISD::EXTLOAD, MVT::f128, MVT::f80, Expand);
		setTruncStoreAction(MVT::f128, MVT::f32, Expand);
		setTruncStoreAction(MVT::f128, MVT::f64, Expand);
		setTruncStoreAction(MVT::f128, MVT::f80, Expand);
		}

// Always use a library call for pow.		// Always use a library call for pow.
setOperationAction(ISD::FPOW , MVT::f32 , Expand);		setOperationAction(ISD::FPOW , MVT::f32 , Expand);
setOperationAction(ISD::FPOW , MVT::f64 , Expand);		setOperationAction(ISD::FPOW , MVT::f64 , Expand);
setOperationAction(ISD::FPOW , MVT::f80 , Expand);		setOperationAction(ISD::FPOW , MVT::f80 , Expand);
		setOperationAction(ISD::FPOW , MVT::f128 , Expand);

setOperationAction(ISD::FLOG, MVT::f80, Expand);		setOperationAction(ISD::FLOG, MVT::f80, Expand);
setOperationAction(ISD::FLOG2, MVT::f80, Expand);		setOperationAction(ISD::FLOG2, MVT::f80, Expand);
setOperationAction(ISD::FLOG10, MVT::f80, Expand);		setOperationAction(ISD::FLOG10, MVT::f80, Expand);
setOperationAction(ISD::FEXP, MVT::f80, Expand);		setOperationAction(ISD::FEXP, MVT::f80, Expand);
setOperationAction(ISD::FEXP2, MVT::f80, Expand);		setOperationAction(ISD::FEXP2, MVT::f80, Expand);
setOperationAction(ISD::FMINNUM, MVT::f80, Expand);		setOperationAction(ISD::FMINNUM, MVT::f80, Expand);
setOperationAction(ISD::FMAXNUM, MVT::f80, Expand);		setOperationAction(ISD::FMAXNUM, MVT::f80, Expand);
▲ Show 20 Lines • Show All 93 Lines • ▼ Show 20 Lines	if (!Subtarget.useSoftFloat() && Subtarget.hasSSE1()) {
setOperationAction(ISD::VECTOR_SHUFFLE, MVT::v4f32, Custom);		setOperationAction(ISD::VECTOR_SHUFFLE, MVT::v4f32, Custom);
setOperationAction(ISD::VSELECT, MVT::v4f32, Custom);		setOperationAction(ISD::VSELECT, MVT::v4f32, Custom);
setOperationAction(ISD::EXTRACT_VECTOR_ELT, MVT::v4f32, Custom);		setOperationAction(ISD::EXTRACT_VECTOR_ELT, MVT::v4f32, Custom);
setOperationAction(ISD::SELECT, MVT::v4f32, Custom);		setOperationAction(ISD::SELECT, MVT::v4f32, Custom);
setOperationAction(ISD::UINT_TO_FP, MVT::v4i32, Custom);		setOperationAction(ISD::UINT_TO_FP, MVT::v4i32, Custom);

setOperationAction(ISD::LOAD, MVT::v2f32, Custom);		setOperationAction(ISD::LOAD, MVT::v2f32, Custom);
setOperationAction(ISD::STORE, MVT::v2f32, Custom);		setOperationAction(ISD::STORE, MVT::v2f32, Custom);

		setOperationAction(ISD::STRICT_FP_ROUND, MVT::v4f32, Custom);
}		}

if (!Subtarget.useSoftFloat() && Subtarget.hasSSE2()) {		if (!Subtarget.useSoftFloat() && Subtarget.hasSSE2()) {
addRegisterClass(MVT::v2f64, Subtarget.hasVLX() ? &X86::VR128XRegClass		addRegisterClass(MVT::v2f64, Subtarget.hasVLX() ? &X86::VR128XRegClass
: &X86::VR128RegClass);		: &X86::VR128RegClass);

// FIXME: Unfortunately, -soft-float and -no-implicit-float mean XMM		// FIXME: Unfortunately, -soft-float and -no-implicit-float mean XMM
// registers cannot be used even for integer operations.		// registers cannot be used even for integer operations.
▲ Show 20 Lines • Show All 337 Lines • ▼ Show 20 Lines	if (!Subtarget.useSoftFloat() && Subtarget.hasAVX()) {
// (fp_to_int:v8i16 (v8f32 ..)) requires the result type to be promoted		// (fp_to_int:v8i16 (v8f32 ..)) requires the result type to be promoted
// even though v8i16 is a legal type.		// even though v8i16 is a legal type.
setOperationPromotedToType(ISD::FP_TO_SINT, MVT::v8i16, MVT::v8i32);		setOperationPromotedToType(ISD::FP_TO_SINT, MVT::v8i16, MVT::v8i32);
setOperationPromotedToType(ISD::FP_TO_UINT, MVT::v8i16, MVT::v8i32);		setOperationPromotedToType(ISD::FP_TO_UINT, MVT::v8i16, MVT::v8i32);
setOperationAction(ISD::FP_TO_SINT, MVT::v8i32, Legal);		setOperationAction(ISD::FP_TO_SINT, MVT::v8i32, Legal);

setOperationAction(ISD::SINT_TO_FP, MVT::v8i32, Legal);		setOperationAction(ISD::SINT_TO_FP, MVT::v8i32, Legal);

		setOperationAction(ISD::STRICT_FP_ROUND, MVT::v8f32, Custom);

if (!Subtarget.hasAVX512())		if (!Subtarget.hasAVX512())
setOperationAction(ISD::BITCAST, MVT::v32i1, Custom);		setOperationAction(ISD::BITCAST, MVT::v32i1, Custom);

// In the customized shift lowering, the legal v8i32/v4i64 cases		// In the customized shift lowering, the legal v8i32/v4i64 cases
// in AVX2 will be recognized.		// in AVX2 will be recognized.
for (auto VT : { MVT::v32i8, MVT::v16i16, MVT::v8i32, MVT::v4i64 }) {		for (auto VT : { MVT::v32i8, MVT::v16i16, MVT::v8i32, MVT::v4i64 }) {
setOperationAction(ISD::SRL, VT, Custom);		setOperationAction(ISD::SRL, VT, Custom);
setOperationAction(ISD::SHL, VT, Custom);		setOperationAction(ISD::SHL, VT, Custom);
▲ Show 20 Lines • Show All 245 Lines • ▼ Show 20 Lines	if (!Subtarget.useSoftFloat() && Subtarget.useAVX512Regs()) {
setOperationPromotedToType(ISD::FP_TO_SINT, MVT::v16i1, MVT::v16i32);		setOperationPromotedToType(ISD::FP_TO_SINT, MVT::v16i1, MVT::v16i32);
setOperationAction(ISD::FP_TO_UINT, MVT::v16i32, Legal);		setOperationAction(ISD::FP_TO_UINT, MVT::v16i32, Legal);
setOperationPromotedToType(ISD::FP_TO_UINT, MVT::v16i1, MVT::v16i32);		setOperationPromotedToType(ISD::FP_TO_UINT, MVT::v16i1, MVT::v16i32);
setOperationPromotedToType(ISD::FP_TO_UINT, MVT::v16i8, MVT::v16i32);		setOperationPromotedToType(ISD::FP_TO_UINT, MVT::v16i8, MVT::v16i32);
setOperationPromotedToType(ISD::FP_TO_UINT, MVT::v16i16, MVT::v16i32);		setOperationPromotedToType(ISD::FP_TO_UINT, MVT::v16i16, MVT::v16i32);
setOperationAction(ISD::SINT_TO_FP, MVT::v16i32, Legal);		setOperationAction(ISD::SINT_TO_FP, MVT::v16i32, Legal);
setOperationAction(ISD::UINT_TO_FP, MVT::v16i32, Legal);		setOperationAction(ISD::UINT_TO_FP, MVT::v16i32, Legal);

		setOperationAction(ISD::STRICT_FP_ROUND, MVT::v16f32, Custom);

setTruncStoreAction(MVT::v8i64, MVT::v8i8, Legal);		setTruncStoreAction(MVT::v8i64, MVT::v8i8, Legal);
setTruncStoreAction(MVT::v8i64, MVT::v8i16, Legal);		setTruncStoreAction(MVT::v8i64, MVT::v8i16, Legal);
setTruncStoreAction(MVT::v8i64, MVT::v8i32, Legal);		setTruncStoreAction(MVT::v8i64, MVT::v8i32, Legal);
setTruncStoreAction(MVT::v16i32, MVT::v16i8, Legal);		setTruncStoreAction(MVT::v16i32, MVT::v16i8, Legal);
setTruncStoreAction(MVT::v16i32, MVT::v16i16, Legal);		setTruncStoreAction(MVT::v16i32, MVT::v16i16, Legal);

// With 512-bit vectors and no VLX, we prefer to widen MLOAD/MSTORE		// With 512-bit vectors and no VLX, we prefer to widen MLOAD/MSTORE
// to 512-bit rather than use the AVX2 instructions so that we can use		// to 512-bit rather than use the AVX2 instructions so that we can use
▲ Show 20 Lines • Show All 3,245 Lines • ▼ Show 20 Lines	if (ConstantSDNode *RHSC = dyn_cast<ConstantSDNode>(RHS)) {
// X > -1 -> X == 0, jump !sign.		// X > -1 -> X == 0, jump !sign.
RHS = DAG.getConstant(0, DL, RHS.getValueType());		RHS = DAG.getConstant(0, DL, RHS.getValueType());
return X86::COND_NS;		return X86::COND_NS;
}		}
if (SetCCOpcode == ISD::SETLT && RHSC->isNullValue()) {		if (SetCCOpcode == ISD::SETLT && RHSC->isNullValue()) {
// X < 0 -> X == 0, jump on sign.		// X < 0 -> X == 0, jump on sign.
return X86::COND_S;		return X86::COND_S;
}		}
		if (SetCCOpcode == ISD::SETGE && RHSC->isNullValue()) {
		// X >= 0 -> X == 0, jump on !sign.
		return X86::COND_NS;
		}
if (SetCCOpcode == ISD::SETLT && RHSC->getAPIntValue() == 1) {		if (SetCCOpcode == ISD::SETLT && RHSC->getAPIntValue() == 1) {
// X < 1 -> X <= 0		// X < 1 -> X <= 0
RHS = DAG.getConstant(0, DL, RHS.getValueType());		RHS = DAG.getConstant(0, DL, RHS.getValueType());
return X86::COND_LE;		return X86::COND_LE;
}		}
}		}

return TranslateIntegerX86CC(SetCCOpcode);		return TranslateIntegerX86CC(SetCCOpcode);
▲ Show 20 Lines • Show All 13,598 Lines • ▼ Show 20 Lines

SDValue X86TargetLowering::LowerSINT_TO_FP(SDValue Op,		SDValue X86TargetLowering::LowerSINT_TO_FP(SDValue Op,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
SDValue Src = Op.getOperand(0);		SDValue Src = Op.getOperand(0);
MVT SrcVT = Src.getSimpleValueType();		MVT SrcVT = Src.getSimpleValueType();
MVT VT = Op.getSimpleValueType();		MVT VT = Op.getSimpleValueType();
SDLoc dl(Op);		SDLoc dl(Op);

		if (VT == MVT::f128)
		return LowerF128Call(Op, DAG, RTLIB::getSINTTOFP(SrcVT, VT));

if (SDValue Extract = vectorizeExtractedCast(Op, DAG, Subtarget))		if (SDValue Extract = vectorizeExtractedCast(Op, DAG, Subtarget))
return Extract;		return Extract;

if (SrcVT.isVector()) {		if (SrcVT.isVector()) {
if (SrcVT == MVT::v2i32 && VT == MVT::v2f64) {		if (SrcVT == MVT::v2i32 && VT == MVT::v2f64) {
return DAG.getNode(X86ISD::CVTSI2P, dl, VT,		return DAG.getNode(X86ISD::CVTSI2P, dl, VT,
DAG.getNode(ISD::CONCAT_VECTORS, dl, MVT::v4i32, Src,		DAG.getNode(ISD::CONCAT_VECTORS, dl, MVT::v4i32, Src,
DAG.getUNDEF(SrcVT)));		DAG.getUNDEF(SrcVT)));
▲ Show 20 Lines • Show All 343 Lines • ▼ Show 20 Lines	static SDValue lowerUINT_TO_FP_vec(SDValue Op, SelectionDAG &DAG,
}		}
}		}

SDValue X86TargetLowering::LowerUINT_TO_FP(SDValue Op,		SDValue X86TargetLowering::LowerUINT_TO_FP(SDValue Op,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
SDValue N0 = Op.getOperand(0);		SDValue N0 = Op.getOperand(0);
SDLoc dl(Op);		SDLoc dl(Op);
auto PtrVT = getPointerTy(DAG.getDataLayout());		auto PtrVT = getPointerTy(DAG.getDataLayout());
		MVT SrcVT = N0.getSimpleValueType();
		MVT DstVT = Op.getSimpleValueType();

		if (DstVT == MVT::f128)
		return LowerF128Call(Op, DAG, RTLIB::getUINTTOFP(SrcVT, DstVT));

if (Op.getSimpleValueType().isVector())		if (DstVT.isVector())
return lowerUINT_TO_FP_vec(Op, DAG, Subtarget);		return lowerUINT_TO_FP_vec(Op, DAG, Subtarget);

if (SDValue Extract = vectorizeExtractedCast(Op, DAG, Subtarget))		if (SDValue Extract = vectorizeExtractedCast(Op, DAG, Subtarget))
return Extract;		return Extract;

MVT SrcVT = N0.getSimpleValueType();
MVT DstVT = Op.getSimpleValueType();

if (Subtarget.hasAVX512() && isScalarFPTypeInSSEReg(DstVT) &&		if (Subtarget.hasAVX512() && isScalarFPTypeInSSEReg(DstVT) &&
(SrcVT == MVT::i32 \|\| (SrcVT == MVT::i64 && Subtarget.is64Bit()))) {		(SrcVT == MVT::i32 \|\| (SrcVT == MVT::i64 && Subtarget.is64Bit()))) {
// Conversions from unsigned i32 to f32/f64 are legal,		// Conversions from unsigned i32 to f32/f64 are legal,
// using VCVTUSI2SS/SD. Same for i64 in 64-bit mode.		// using VCVTUSI2SS/SD. Same for i64 in 64-bit mode.
return Op;		return Op;
}		}

// Promote i32 to i64 and use a signed conversion on 64-bit targets.		// Promote i32 to i64 and use a signed conversion on 64-bit targets.
▲ Show 20 Lines • Show All 711 Lines • ▼ Show 20 Lines

SDValue X86TargetLowering::LowerFP_TO_INT(SDValue Op, SelectionDAG &DAG) const {		SDValue X86TargetLowering::LowerFP_TO_INT(SDValue Op, SelectionDAG &DAG) const {
bool IsSigned = Op.getOpcode() == ISD::FP_TO_SINT;		bool IsSigned = Op.getOpcode() == ISD::FP_TO_SINT;
MVT VT = Op.getSimpleValueType();		MVT VT = Op.getSimpleValueType();
SDValue Src = Op.getOperand(0);		SDValue Src = Op.getOperand(0);
MVT SrcVT = Src.getSimpleValueType();		MVT SrcVT = Src.getSimpleValueType();
SDLoc dl(Op);		SDLoc dl(Op);

		if (SrcVT == MVT::f128) {
		RTLIB::Libcall LC;
		if (Op.getOpcode() == ISD::FP_TO_SINT)
		LC = RTLIB::getFPTOSINT(SrcVT, VT);
		else
		LC = RTLIB::getFPTOUINT(SrcVT, VT);

		MakeLibCallOptions CallOptions;
		return makeLibCall(DAG, LC, VT, Src, CallOptions, SDLoc(Op)).first;
		}

if (VT.isVector()) {		if (VT.isVector()) {
if (VT == MVT::v2i1 && SrcVT == MVT::v2f64) {		if (VT == MVT::v2i1 && SrcVT == MVT::v2f64) {
MVT ResVT = MVT::v4i32;		MVT ResVT = MVT::v4i32;
MVT TruncVT = MVT::v4i1;		MVT TruncVT = MVT::v4i1;
unsigned Opc = IsSigned ? X86ISD::CVTTP2SI : X86ISD::CVTTP2UI;		unsigned Opc = IsSigned ? X86ISD::CVTTP2SI : X86ISD::CVTTP2UI;
if (!IsSigned && !Subtarget.hasVLX()) {		if (!IsSigned && !Subtarget.hasVLX()) {
// Widen to 512-bits.		// Widen to 512-bits.
ResVT = MVT::v8i32;		ResVT = MVT::v8i32;
▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines	SDValue X86TargetLowering::LowerFP_TO_INT(SDValue Op, SelectionDAG &DAG) const {

// Fall back to X87.		// Fall back to X87.
if (SDValue V = FP_TO_INTHelper(Op, DAG, IsSigned))		if (SDValue V = FP_TO_INTHelper(Op, DAG, IsSigned))
return V;		return V;

llvm_unreachable("Expected FP_TO_INTHelper to handle all remaining cases.");		llvm_unreachable("Expected FP_TO_INTHelper to handle all remaining cases.");
}		}

static SDValue LowerFP_EXTEND(SDValue Op, SelectionDAG &DAG) {		SDValue X86TargetLowering::LowerFP_EXTEND(SDValue Op, SelectionDAG &DAG) const {
SDLoc DL(Op);		SDLoc DL(Op);
MVT VT = Op.getSimpleValueType();		MVT VT = Op.getSimpleValueType();
SDValue In = Op.getOperand(0);		SDValue In = Op.getOperand(0);
MVT SVT = In.getSimpleValueType();		MVT SVT = In.getSimpleValueType();

		if (VT == MVT::f128) {
		RTLIB::Libcall LC = RTLIB::getFPEXT(SVT, VT);
		return LowerF128Call(Op, DAG, LC);
		}

assert(SVT == MVT::v2f32 && "Only customize MVT::v2f32 type legalization!");		assert(SVT == MVT::v2f32 && "Only customize MVT::v2f32 type legalization!");

return DAG.getNode(X86ISD::VFPEXT, DL, VT,		return DAG.getNode(X86ISD::VFPEXT, DL, VT,
DAG.getNode(ISD::CONCAT_VECTORS, DL, MVT::v4f32,		DAG.getNode(ISD::CONCAT_VECTORS, DL, MVT::v4f32,
In, DAG.getUNDEF(SVT)));		In, DAG.getUNDEF(SVT)));
}		}

		SDValue X86TargetLowering::LowerFP_ROUND(SDValue Op, SelectionDAG &DAG) const {
		MVT VT = Op.getSimpleValueType();
		SDValue In = Op.getOperand(0);
		MVT SVT = In.getSimpleValueType();

		// It's legal except when f128 is involved
		if (SVT != MVT::f128)
		return Op;

		RTLIB::Libcall LC = RTLIB::getFPROUND(SVT, VT);

		// FP_ROUND node has a second operand indicating whether it is known to be
		// precise. That doesn't take part in the LibCall so we can't directly use
		// LowerF128Call.
		MakeLibCallOptions CallOptions;
		return makeLibCall(DAG, LC, VT, In, CallOptions, SDLoc(Op)).first;
		}

		// FIXME: This is a hack to allow FP_ROUND to be marked Custom without breaking
		// the default expansion of STRICT_FP_ROUND.
		static SDValue LowerSTRICT_FP_ROUND(SDValue Op, SelectionDAG &DAG) {
		// FIXME: Need to form a libcall with an input chain for f128.
		assert(Op.getOperand(0).getValueType() != MVT::f128 &&
		"Don't know how to handle f128 yet!");
		return Op;
		}

/// Horizontal vector math instructions may be slower than normal math with		/// Horizontal vector math instructions may be slower than normal math with
/// shuffles. Limit horizontal op codegen based on size/speed trade-offs, uarch		/// shuffles. Limit horizontal op codegen based on size/speed trade-offs, uarch
/// implementation, and likely shuffle complexity of the alternate sequence.		/// implementation, and likely shuffle complexity of the alternate sequence.
static bool shouldUseHorizontalOp(bool IsSingleSource, SelectionDAG &DAG,		static bool shouldUseHorizontalOp(bool IsSingleSource, SelectionDAG &DAG,
const X86Subtarget &Subtarget) {		const X86Subtarget &Subtarget) {
bool IsOptimizingSize = DAG.getMachineFunction().getFunction().hasOptSize();		bool IsOptimizingSize = DAG.getMachineFunction().getFunction().hasOptSize();
bool HasFastHOps = Subtarget.hasFastHorizontalOps();		bool HasFastHOps = Subtarget.hasFastHorizontalOps();
return !IsSingleSource \|\| IsOptimizingSize \|\| HasFastHOps;		return !IsSingleSource \|\| IsOptimizingSize \|\| HasFastHOps;
▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines	static SDValue lowerAddSubToHorizontalOp(SDValue Op, SelectionDAG &DAG,
// sub (extractelt (X, 0), extractelt (X, 1)) --> extractelt (hsub X, X), 0		// sub (extractelt (X, 0), extractelt (X, 1)) --> extractelt (hsub X, X), 0
SDValue HOp = DAG.getNode(HOpcode, DL, X.getValueType(), X, X);		SDValue HOp = DAG.getNode(HOpcode, DL, X.getValueType(), X, X);
return DAG.getNode(ISD::EXTRACT_VECTOR_ELT, DL, Op.getSimpleValueType(), HOp,		return DAG.getNode(ISD::EXTRACT_VECTOR_ELT, DL, Op.getSimpleValueType(), HOp,
DAG.getIntPtrConstant(LExtIndex / 2, DL));		DAG.getIntPtrConstant(LExtIndex / 2, DL));
}		}

/// Depending on uarch and/or optimizing for size, we might prefer to use a		/// Depending on uarch and/or optimizing for size, we might prefer to use a
/// vector operation in place of the typical scalar operation.		/// vector operation in place of the typical scalar operation.
static SDValue lowerFaddFsub(SDValue Op, SelectionDAG &DAG,		SDValue X86TargetLowering::lowerFaddFsub(SDValue Op, SelectionDAG &DAG) const {
const X86Subtarget &Subtarget) {		if (Op.getValueType() == MVT::f128) {
		RTLIB::Libcall LC = Op.getOpcode() == ISD::FADD ? RTLIB::ADD_F128
		: RTLIB::SUB_F128;
		return LowerF128Call(Op, DAG, LC);
		}

assert((Op.getValueType() == MVT::f32 \|\| Op.getValueType() == MVT::f64) &&		assert((Op.getValueType() == MVT::f32 \|\| Op.getValueType() == MVT::f64) &&
"Only expecting float/double");		"Only expecting float/double");
return lowerAddSubToHorizontalOp(Op, DAG, Subtarget);		return lowerAddSubToHorizontalOp(Op, DAG, Subtarget);
}		}

/// The only differences between FABS and FNEG are the mask and the logic op.		/// The only differences between FABS and FNEG are the mask and the logic op.
/// FNEG also has a folding opportunity for FNEG(FABS(x)).		/// FNEG also has a folding opportunity for FNEG(FABS(x)).
static SDValue LowerFABSorFNEG(SDValue Op, SelectionDAG &DAG) {		static SDValue LowerFABSorFNEG(SDValue Op, SelectionDAG &DAG) {
▲ Show 20 Lines • Show All 1,313 Lines • ▼ Show 20 Lines	SDValue X86TargetLowering::LowerSETCC(SDValue Op, SelectionDAG &DAG) const {
if (VT.isVector()) return LowerVSETCC(Op, Subtarget, DAG);		if (VT.isVector()) return LowerVSETCC(Op, Subtarget, DAG);

assert(VT == MVT::i8 && "SetCC type must be 8-bit integer");		assert(VT == MVT::i8 && "SetCC type must be 8-bit integer");
SDValue Op0 = Op.getOperand(0);		SDValue Op0 = Op.getOperand(0);
SDValue Op1 = Op.getOperand(1);		SDValue Op1 = Op.getOperand(1);
SDLoc dl(Op);		SDLoc dl(Op);
ISD::CondCode CC = cast<CondCodeSDNode>(Op.getOperand(2))->get();		ISD::CondCode CC = cast<CondCodeSDNode>(Op.getOperand(2))->get();

		// Handle f128 first, since one possible outcome is a normal integer
		// comparison which gets handled by emitFlagsForSetcc.
		if (Op0.getValueType() == MVT::f128) {
		softenSetCCOperands(DAG, MVT::f128, Op0, Op1, CC, dl, Op0, Op1);

		// If softenSetCCOperands returned a scalar, use it.
		if (!Op1.getNode()) {
		assert(Op0.getValueType() == Op.getValueType() &&
		"Unexpected setcc expansion!");
		return Op0;
		}
		}

SDValue X86CC;		SDValue X86CC;
SDValue EFLAGS = emitFlagsForSetcc(Op0, Op1, CC, dl, DAG, X86CC);		SDValue EFLAGS = emitFlagsForSetcc(Op0, Op1, CC, dl, DAG, X86CC);
if (!EFLAGS)		if (!EFLAGS)
return SDValue();		return SDValue();

return DAG.getNode(X86ISD::SETCC, dl, MVT::i8, X86CC, EFLAGS);		return DAG.getNode(X86ISD::SETCC, dl, MVT::i8, X86CC, EFLAGS);
}		}

▲ Show 20 Lines • Show All 6,689 Lines • ▼ Show 20 Lines	SDValue X86TargetLowering::LowerGC_TRANSITION_END(SDValue Op,

SDLoc OpDL(Op);		SDLoc OpDL(Op);
SDVTList VTs = DAG.getVTList(MVT::Other, MVT::Glue);		SDVTList VTs = DAG.getVTList(MVT::Other, MVT::Glue);
SDValue NOOP(DAG.getMachineNode(X86::NOOP, SDLoc(Op), VTs, Ops), 0);		SDValue NOOP(DAG.getMachineNode(X86::NOOP, SDLoc(Op), VTs, Ops), 0);

return NOOP;		return NOOP;
}		}

		SDValue X86TargetLowering::LowerF128Call(SDValue Op, SelectionDAG &DAG,
		RTLIB::Libcall Call) const {
		SmallVector<SDValue, 2> Ops(Op->op_begin(), Op->op_end());
		MakeLibCallOptions CallOptions;
		return makeLibCall(DAG, Call, MVT::f128, Ops, CallOptions, SDLoc(Op)).first;
		}

/// Provide custom lowering hooks for some operations.		/// Provide custom lowering hooks for some operations.
SDValue X86TargetLowering::LowerOperation(SDValue Op, SelectionDAG &DAG) const {		SDValue X86TargetLowering::LowerOperation(SDValue Op, SelectionDAG &DAG) const {
switch (Op.getOpcode()) {		switch (Op.getOpcode()) {
default: llvm_unreachable("Should not custom lower this!");		default: llvm_unreachable("Should not custom lower this!");
case ISD::ATOMIC_FENCE: return LowerATOMIC_FENCE(Op, Subtarget, DAG);		case ISD::ATOMIC_FENCE: return LowerATOMIC_FENCE(Op, Subtarget, DAG);
case ISD::ATOMIC_CMP_SWAP_WITH_SUCCESS:		case ISD::ATOMIC_CMP_SWAP_WITH_SUCCESS:
return LowerCMP_SWAP(Op, Subtarget, DAG);		return LowerCMP_SWAP(Op, Subtarget, DAG);
case ISD::CTPOP: return LowerCTPOP(Op, Subtarget, DAG);		case ISD::CTPOP: return LowerCTPOP(Op, Subtarget, DAG);
Show All 30 Lines	SDValue X86TargetLowering::LowerOperation(SDValue Op, SelectionDAG &DAG) const {
case ISD::SIGN_EXTEND: return LowerSIGN_EXTEND(Op, Subtarget, DAG);		case ISD::SIGN_EXTEND: return LowerSIGN_EXTEND(Op, Subtarget, DAG);
case ISD::ANY_EXTEND: return LowerANY_EXTEND(Op, Subtarget, DAG);		case ISD::ANY_EXTEND: return LowerANY_EXTEND(Op, Subtarget, DAG);
case ISD::ZERO_EXTEND_VECTOR_INREG:		case ISD::ZERO_EXTEND_VECTOR_INREG:
case ISD::SIGN_EXTEND_VECTOR_INREG:		case ISD::SIGN_EXTEND_VECTOR_INREG:
return LowerEXTEND_VECTOR_INREG(Op, Subtarget, DAG);		return LowerEXTEND_VECTOR_INREG(Op, Subtarget, DAG);
case ISD::FP_TO_SINT:		case ISD::FP_TO_SINT:
case ISD::FP_TO_UINT: return LowerFP_TO_INT(Op, DAG);		case ISD::FP_TO_UINT: return LowerFP_TO_INT(Op, DAG);
case ISD::FP_EXTEND: return LowerFP_EXTEND(Op, DAG);		case ISD::FP_EXTEND: return LowerFP_EXTEND(Op, DAG);
		case ISD::FP_ROUND: return LowerFP_ROUND(Op, DAG);
		case ISD::STRICT_FP_ROUND: return LowerSTRICT_FP_ROUND(Op, DAG);
case ISD::LOAD: return LowerLoad(Op, Subtarget, DAG);		case ISD::LOAD: return LowerLoad(Op, Subtarget, DAG);
case ISD::STORE: return LowerStore(Op, Subtarget, DAG);		case ISD::STORE: return LowerStore(Op, Subtarget, DAG);
case ISD::FADD:		case ISD::FADD:
case ISD::FSUB: return lowerFaddFsub(Op, DAG, Subtarget);		case ISD::FSUB: return lowerFaddFsub(Op, DAG);
		case ISD::FMUL: return LowerF128Call(Op, DAG, RTLIB::MUL_F128);
		case ISD::FDIV: return LowerF128Call(Op, DAG, RTLIB::DIV_F128);
case ISD::FABS:		case ISD::FABS:
case ISD::FNEG: return LowerFABSorFNEG(Op, DAG);		case ISD::FNEG: return LowerFABSorFNEG(Op, DAG);
case ISD::FCOPYSIGN: return LowerFCOPYSIGN(Op, DAG);		case ISD::FCOPYSIGN: return LowerFCOPYSIGN(Op, DAG);
case ISD::FGETSIGN: return LowerFGETSIGN(Op, DAG);		case ISD::FGETSIGN: return LowerFGETSIGN(Op, DAG);
case ISD::SETCC: return LowerSETCC(Op, DAG);		case ISD::SETCC: return LowerSETCC(Op, DAG);
case ISD::SETCCCARRY: return LowerSETCCCARRY(Op, DAG);		case ISD::SETCCCARRY: return LowerSETCCCARRY(Op, DAG);
case ISD::SELECT: return LowerSELECT(Op, DAG);		case ISD::SELECT: return LowerSELECT(Op, DAG);
case ISD::BRCOND: return LowerBRCOND(Op, DAG);		case ISD::BRCOND: return LowerBRCOND(Op, DAG);
▲ Show 20 Lines • Show All 18,629 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/fp128-cast.ll

Show First 20 Lines • Show All 499 Lines • ▼ Show 20 Lines	entry:
%conv = fptrunc fp128 %0 to double		%conv = fptrunc fp128 %0 to double
store double %conv, double* @vf64, align 8		store double %conv, double* @vf64, align 8
ret void		ret void
}		}

define void @TestFPTruncF128_F80() nounwind {		define void @TestFPTruncF128_F80() nounwind {
; X64-SSE-LABEL: TestFPTruncF128_F80:		; X64-SSE-LABEL: TestFPTruncF128_F80:
; X64-SSE: # %bb.0: # %entry		; X64-SSE: # %bb.0: # %entry
; X64-SSE-NEXT: subq $24, %rsp		; X64-SSE-NEXT: pushq %rax
; X64-SSE-NEXT: movaps {{.*}}(%rip), %xmm0		; X64-SSE-NEXT: movaps {{.*}}(%rip), %xmm0
; X64-SSE-NEXT: callq __trunctfxf2		; X64-SSE-NEXT: callq __trunctfxf2
; X64-SSE-NEXT: fstpt (%rsp)		; X64-SSE-NEXT: fstpt {{.*}}(%rip)
; X64-SSE-NEXT: movq (%rsp), %rax		; X64-SSE-NEXT: popq %rax
; X64-SSE-NEXT: movq %rax, {{.*}}(%rip)
; X64-SSE-NEXT: movl {{[0-9]+}}(%rsp), %eax
; X64-SSE-NEXT: movw %ax, vf80+{{.*}}(%rip)
; X64-SSE-NEXT: addq $24, %rsp
; X64-SSE-NEXT: retq		; X64-SSE-NEXT: retq
;		;
; X32-LABEL: TestFPTruncF128_F80:		; X32-LABEL: TestFPTruncF128_F80:
; X32: # %bb.0: # %entry		; X32: # %bb.0: # %entry
; X32-NEXT: subl $12, %esp		; X32-NEXT: subl $12, %esp
; X32-NEXT: pushl vf128+12		; X32-NEXT: pushl vf128+12
; X32-NEXT: pushl vf128+8		; X32-NEXT: pushl vf128+8
; X32-NEXT: pushl vf128+4		; X32-NEXT: pushl vf128+4
; X32-NEXT: pushl vf128		; X32-NEXT: pushl vf128
; X32-NEXT: calll __trunctfxf2		; X32-NEXT: calll __trunctfxf2
; X32-NEXT: addl $16, %esp		; X32-NEXT: addl $16, %esp
; X32-NEXT: fstpt vf80		; X32-NEXT: fstpt vf80
; X32-NEXT: addl $12, %esp		; X32-NEXT: addl $12, %esp
; X32-NEXT: retl		; X32-NEXT: retl
;		;
; X64-AVX-LABEL: TestFPTruncF128_F80:		; X64-AVX-LABEL: TestFPTruncF128_F80:
; X64-AVX: # %bb.0: # %entry		; X64-AVX: # %bb.0: # %entry
; X64-AVX-NEXT: subq $24, %rsp		; X64-AVX-NEXT: pushq %rax
; X64-AVX-NEXT: vmovaps {{.*}}(%rip), %xmm0		; X64-AVX-NEXT: vmovaps {{.*}}(%rip), %xmm0
; X64-AVX-NEXT: callq __trunctfxf2		; X64-AVX-NEXT: callq __trunctfxf2
; X64-AVX-NEXT: fstpt (%rsp)		; X64-AVX-NEXT: fstpt {{.*}}(%rip)
; X64-AVX-NEXT: movq (%rsp), %rax		; X64-AVX-NEXT: popq %rax
; X64-AVX-NEXT: movq %rax, {{.*}}(%rip)
; X64-AVX-NEXT: movl {{[0-9]+}}(%rsp), %eax
; X64-AVX-NEXT: movw %ax, vf80+{{.*}}(%rip)
; X64-AVX-NEXT: addq $24, %rsp
; X64-AVX-NEXT: retq		; X64-AVX-NEXT: retq
entry:		entry:
%0 = load fp128, fp128* @vf128, align 16		%0 = load fp128, fp128* @vf128, align 16
%conv = fptrunc fp128 %0 to x86_fp80		%conv = fptrunc fp128 %0 to x86_fp80
store x86_fp80 %conv, x86_fp80* @vf80, align 8		store x86_fp80 %conv, x86_fp80* @vf80, align 8
ret void		ret void
}		}

▲ Show 20 Lines • Show All 708 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/fp128-compare.ll

	Show First 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	}			}

	define i32 @TestComp128LT(fp128 %d1, fp128 %d2) {			define i32 @TestComp128LT(fp128 %d1, fp128 %d2) {
	; CHECK-LABEL: TestComp128LT:			; CHECK-LABEL: TestComp128LT:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: pushq %rax			; CHECK-NEXT: pushq %rax
	; CHECK-NEXT: .cfi_def_cfa_offset 16			; CHECK-NEXT: .cfi_def_cfa_offset 16
	; CHECK-NEXT: callq __lttf2			; CHECK-NEXT: callq __lttf2
	; CHECK-NEXT: shrl $31, %eax			; CHECK-NEXT: xorl %ecx, %ecx
				; CHECK-NEXT: testl %eax, %eax
				; CHECK-NEXT: sets %cl
				; CHECK-NEXT: movl %ecx, %eax
	; CHECK-NEXT: popq %rcx			; CHECK-NEXT: popq %rcx
	; CHECK-NEXT: .cfi_def_cfa_offset 8			; CHECK-NEXT: .cfi_def_cfa_offset 8
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%cmp = fcmp olt fp128 %d1, %d2			%cmp = fcmp olt fp128 %d1, %d2
	%conv = zext i1 %cmp to i32			%conv = zext i1 %cmp to i32
	ret i32 %conv			ret i32 %conv
	; The 'shrl' is a special optimization in llvm to combine			; FIXME: This used to generate a shrl to move the sign bit of eax into bit 0.
	; the effect of 'fcmp olt' and 'zext'. The main purpose is			; This no longer happens with fp128 compares being expanded by LegalizeDAG.
	; to test soften call to __lttf2.			; We can add a new DAG combine for X86ISD::CMP/SETCC to restore this.
	}			}

	define i32 @TestComp128LE(fp128 %d1, fp128 %d2) {			define i32 @TestComp128LE(fp128 %d1, fp128 %d2) {
	; CHECK-LABEL: TestComp128LE:			; CHECK-LABEL: TestComp128LE:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: pushq %rax			; CHECK-NEXT: pushq %rax
	; CHECK-NEXT: .cfi_def_cfa_offset 16			; CHECK-NEXT: .cfi_def_cfa_offset 16
	; CHECK-NEXT: callq __letf2			; CHECK-NEXT: callq __letf2
	▲ Show 20 Lines • Show All 73 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/fp128-i128.ll

	Show First 20 Lines • Show All 154 Lines • ▼ Show 20 Lines
	; AVX-NEXT: movabsq $9223372036854775807, %rax # imm = 0x7FFFFFFFFFFFFFFF			; AVX-NEXT: movabsq $9223372036854775807, %rax # imm = 0x7FFFFFFFFFFFFFFF
	; AVX-NEXT: andq {{[0-9]+}}(%rsp), %rax			; AVX-NEXT: andq {{[0-9]+}}(%rsp), %rax
	; AVX-NEXT: movq {{[0-9]+}}(%rsp), %rcx			; AVX-NEXT: movq {{[0-9]+}}(%rsp), %rcx
	; AVX-NEXT: movq %rax, {{[0-9]+}}(%rsp)			; AVX-NEXT: movq %rax, {{[0-9]+}}(%rsp)
	; AVX-NEXT: movq %rcx, (%rsp)			; AVX-NEXT: movq %rcx, (%rsp)
	; AVX-NEXT: vmovaps (%rsp), %xmm0			; AVX-NEXT: vmovaps (%rsp), %xmm0
	; AVX-NEXT: vmovaps {{.*}}(%rip), %xmm1			; AVX-NEXT: vmovaps {{.*}}(%rip), %xmm1
	; AVX-NEXT: callq __lttf2			; AVX-NEXT: callq __lttf2
	; AVX-NEXT: xorl %ecx, %ecx
	; AVX-NEXT: testl %eax, %eax			; AVX-NEXT: testl %eax, %eax
	; AVX-NEXT: sets %cl			; AVX-NEXT: js .LBB2_1
	; AVX-NEXT: shlq $4, %rcx			; AVX-NEXT: # %bb.2: # %entry
	; AVX-NEXT: vmovaps {{\.LCPI.*}}(%rcx), %xmm0			; AVX-NEXT: vmovaps {{.*}}(%rip), %xmm0
				; AVX-NEXT: addq $40, %rsp
				; AVX-NEXT: retq
				; AVX-NEXT: .LBB2_1:
				; AVX-NEXT: vmovaps {{.*}}(%rip), %xmm0
	; AVX-NEXT: addq $40, %rsp			; AVX-NEXT: addq $40, %rsp
	; AVX-NEXT: retq			; AVX-NEXT: retq
	entry:			entry:
	%0 = bitcast fp128 %x to i128			%0 = bitcast fp128 %x to i128
	%bf.clear = and i128 %0, 170141183460469231731687303715884105727			%bf.clear = and i128 %0, 170141183460469231731687303715884105727
	%1 = bitcast i128 %bf.clear to fp128			%1 = bitcast i128 %bf.clear to fp128
	%cmp = fcmp olt fp128 %1, 0xL999999999999999A3FFB999999999999			%cmp = fcmp olt fp128 %1, 0xL999999999999999A3FFB999999999999
	%cond = select i1 %cmp, fp128 0xL00000000000000003FFF000000000000, fp128 0xL00000000000000004000000000000000			%cond = select i1 %cmp, fp128 0xL00000000000000003FFF000000000000, fp128 0xL00000000000000004000000000000000
	▲ Show 20 Lines • Show All 381 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Move x86_64 fp128 conversion to libcalls from type legalization to DAG legalization
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 219810

llvm/trunk/lib/Target/X86/X86ISelLowering.h

llvm/trunk/lib/Target/X86/X86ISelLowering.cpp

llvm/trunk/test/CodeGen/X86/fp128-cast.ll

llvm/trunk/test/CodeGen/X86/fp128-compare.ll

llvm/trunk/test/CodeGen/X86/fp128-i128.ll

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Move x86_64 fp128 conversion to libcalls from type legalization to DAG legalizationClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 219810

llvm/trunk/lib/Target/X86/X86ISelLowering.h

llvm/trunk/lib/Target/X86/X86ISelLowering.cpp

llvm/trunk/test/CodeGen/X86/fp128-cast.ll

llvm/trunk/test/CodeGen/X86/fp128-compare.ll

llvm/trunk/test/CodeGen/X86/fp128-i128.ll

[X86] Move x86_64 fp128 conversion to libcalls from type legalization to DAG legalization
ClosedPublic