Diff 219658

llvm/lib/Target/X86/X86ISelLowering.h

Show First 20 Lines • Show All 1,336 Lines • ▼ Show 20 Lines	private:
SDValue lowerEH_SJLJ_LONGJMP(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerEH_SJLJ_LONGJMP(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerEH_SJLJ_SETUP_DISPATCH(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerEH_SJLJ_SETUP_DISPATCH(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerINIT_TRAMPOLINE(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerINIT_TRAMPOLINE(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerFLT_ROUNDS_(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerFLT_ROUNDS_(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerWin64_i128OP(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerWin64_i128OP(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerGC_TRANSITION_START(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerGC_TRANSITION_START(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerGC_TRANSITION_END(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerGC_TRANSITION_END(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerINTRINSIC_WO_CHAIN(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerINTRINSIC_WO_CHAIN(SDValue Op, SelectionDAG &DAG) const;
		SDValue lowerFaddFsub(SDValue Op, SelectionDAG &DAG) const;
		SDValue LowerFP_EXTEND(SDValue Op, SelectionDAG &DAG) const;
		SDValue LowerFP_ROUND(SDValue Op, SelectionDAG &DAG) const;

		SDValue LowerF128Call(SDValue Op, SelectionDAG &DAG,
		RTLIB::Libcall Call) const;

SDValue		SDValue
LowerFormalArguments(SDValue Chain, CallingConv::ID CallConv, bool isVarArg,		LowerFormalArguments(SDValue Chain, CallingConv::ID CallConv, bool isVarArg,
const SmallVectorImpl<ISD::InputArg> &Ins,		const SmallVectorImpl<ISD::InputArg> &Ins,
const SDLoc &dl, SelectionDAG &DAG,		const SDLoc &dl, SelectionDAG &DAG,
SmallVectorImpl<SDValue> &InVals) const override;		SmallVectorImpl<SDValue> &InVals) const override;
SDValue LowerCall(CallLoweringInfo &CLI,		SDValue LowerCall(CallLoweringInfo &CLI,
SmallVectorImpl<SDValue> &InVals) const override;		SmallVectorImpl<SDValue> &InVals) const override;
▲ Show 20 Lines • Show All 318 Lines • Show Last 20 Lines

llvm/lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 325 Lines • ▼ Show 20 Lines	X86TargetLowering::X86TargetLowering(const X86TargetMachine &TM,
setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i16 , Legal);		setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i16 , Legal);
setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i8 , Legal);		setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i8 , Legal);
setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i1 , Expand);		setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i1 , Expand);
setOperationAction(ISD::FP_ROUND_INREG , MVT::f32 , Expand);		setOperationAction(ISD::FP_ROUND_INREG , MVT::f32 , Expand);

setOperationAction(ISD::FREM , MVT::f32 , Expand);		setOperationAction(ISD::FREM , MVT::f32 , Expand);
setOperationAction(ISD::FREM , MVT::f64 , Expand);		setOperationAction(ISD::FREM , MVT::f64 , Expand);
setOperationAction(ISD::FREM , MVT::f80 , Expand);		setOperationAction(ISD::FREM , MVT::f80 , Expand);
		setOperationAction(ISD::FREM , MVT::f128 , Expand);
setOperationAction(ISD::FLT_ROUNDS_ , MVT::i32 , Custom);		setOperationAction(ISD::FLT_ROUNDS_ , MVT::i32 , Custom);

// Promote the i8 variants and force them on up to i32 which has a shorter		// Promote the i8 variants and force them on up to i32 which has a shorter
// encoding.		// encoding.
setOperationPromotedToType(ISD::CTTZ , MVT::i8 , MVT::i32);		setOperationPromotedToType(ISD::CTTZ , MVT::i8 , MVT::i32);
setOperationPromotedToType(ISD::CTTZ_ZERO_UNDEF, MVT::i8 , MVT::i32);		setOperationPromotedToType(ISD::CTTZ_ZERO_UNDEF, MVT::i8 , MVT::i32);
if (!Subtarget.hasBMI()) {		if (!Subtarget.hasBMI()) {
setOperationAction(ISD::CTTZ , MVT::i16 , Custom);		setOperationAction(ISD::CTTZ , MVT::i16 , Custom);
Show All 30 Lines	X86TargetLowering::X86TargetLowering(const X86TargetMachine &TM,
if (Subtarget.useSoftFloat() \|\| !Subtarget.hasF16C()) {		if (Subtarget.useSoftFloat() \|\| !Subtarget.hasF16C()) {
setOperationAction(ISD::FP16_TO_FP, MVT::f32, Expand);		setOperationAction(ISD::FP16_TO_FP, MVT::f32, Expand);
setOperationAction(ISD::FP_TO_FP16, MVT::f32, Expand);		setOperationAction(ISD::FP_TO_FP16, MVT::f32, Expand);
}		}

// There's never any support for operations beyond MVT::f32.		// There's never any support for operations beyond MVT::f32.
setOperationAction(ISD::FP16_TO_FP, MVT::f64, Expand);		setOperationAction(ISD::FP16_TO_FP, MVT::f64, Expand);
setOperationAction(ISD::FP16_TO_FP, MVT::f80, Expand);		setOperationAction(ISD::FP16_TO_FP, MVT::f80, Expand);
		setOperationAction(ISD::FP16_TO_FP, MVT::f128, Expand);
setOperationAction(ISD::FP_TO_FP16, MVT::f64, Expand);		setOperationAction(ISD::FP_TO_FP16, MVT::f64, Expand);
setOperationAction(ISD::FP_TO_FP16, MVT::f80, Expand);		setOperationAction(ISD::FP_TO_FP16, MVT::f80, Expand);
		setOperationAction(ISD::FP_TO_FP16, MVT::f128, Expand);

setLoadExtAction(ISD::EXTLOAD, MVT::f32, MVT::f16, Expand);		setLoadExtAction(ISD::EXTLOAD, MVT::f32, MVT::f16, Expand);
setLoadExtAction(ISD::EXTLOAD, MVT::f64, MVT::f16, Expand);		setLoadExtAction(ISD::EXTLOAD, MVT::f64, MVT::f16, Expand);
setLoadExtAction(ISD::EXTLOAD, MVT::f80, MVT::f16, Expand);		setLoadExtAction(ISD::EXTLOAD, MVT::f80, MVT::f16, Expand);
		setLoadExtAction(ISD::EXTLOAD, MVT::f128, MVT::f16, Expand);
setTruncStoreAction(MVT::f32, MVT::f16, Expand);		setTruncStoreAction(MVT::f32, MVT::f16, Expand);
setTruncStoreAction(MVT::f64, MVT::f16, Expand);		setTruncStoreAction(MVT::f64, MVT::f16, Expand);
setTruncStoreAction(MVT::f80, MVT::f16, Expand);		setTruncStoreAction(MVT::f80, MVT::f16, Expand);
		setTruncStoreAction(MVT::f128, MVT::f16, Expand);

if (Subtarget.hasPOPCNT()) {		if (Subtarget.hasPOPCNT()) {
setOperationPromotedToType(ISD::CTPOP, MVT::i8, MVT::i32);		setOperationPromotedToType(ISD::CTPOP, MVT::i8, MVT::i32);
} else {		} else {
setOperationAction(ISD::CTPOP , MVT::i8 , Expand);		setOperationAction(ISD::CTPOP , MVT::i8 , Expand);
setOperationAction(ISD::CTPOP , MVT::i16 , Expand);		setOperationAction(ISD::CTPOP , MVT::i16 , Expand);
setOperationAction(ISD::CTPOP , MVT::i32 , Expand);		setOperationAction(ISD::CTPOP , MVT::i32 , Expand);
if (Subtarget.is64Bit())		if (Subtarget.is64Bit())
▲ Show 20 Lines • Show All 217 Lines • ▼ Show 20 Lines	if (isTypeLegal(MVT::f64)) {
} else // SSE immediates.		} else // SSE immediates.
addLegalFPImmediate(APFloat(+0.0)); // xorpd		addLegalFPImmediate(APFloat(+0.0)); // xorpd
}		}

// We don't support FMA.		// We don't support FMA.
setOperationAction(ISD::FMA, MVT::f64, Expand);		setOperationAction(ISD::FMA, MVT::f64, Expand);
setOperationAction(ISD::FMA, MVT::f32, Expand);		setOperationAction(ISD::FMA, MVT::f32, Expand);

// Long double always uses X87, except f128 in SSE.		// f80 always uses X87.
		chhUnsubmitted Not Done Reply Inline Actions This comment is incorrect now. f128 still should be stored in SSE when available. chh: This comment is incorrect now. f128 still should be stored in SSE when available.
		craig.topperAuthorUnsubmitted Done Reply Inline Actions I've removed the reference to "long double" here. That's a C/C++ source language type which has different sizes on different targets. Better to be agnostic here and just talk in IR types. craig.topper: I've removed the reference to "long double" here. That's a C/C++ source language type which has…
if (UseX87) {		if (UseX87) {
if (Subtarget.is64Bit() && Subtarget.hasSSE1()) {
addRegisterClass(MVT::f128, Subtarget.hasVLX() ? &X86::VR128XRegClass
: &X86::VR128RegClass);
ValueTypeActions.setTypeAction(MVT::f128, TypeSoftenFloat);
setOperationAction(ISD::FABS , MVT::f128, Custom);
setOperationAction(ISD::FNEG , MVT::f128, Custom);
setOperationAction(ISD::FCOPYSIGN, MVT::f128, Custom);

addLegalFPImmediate(APFloat::getZero(APFloat::IEEEquad())); // xorps
}

addRegisterClass(MVT::f80, &X86::RFP80RegClass);		addRegisterClass(MVT::f80, &X86::RFP80RegClass);
setOperationAction(ISD::UNDEF, MVT::f80, Expand);		setOperationAction(ISD::UNDEF, MVT::f80, Expand);
setOperationAction(ISD::FCOPYSIGN, MVT::f80, Expand);		setOperationAction(ISD::FCOPYSIGN, MVT::f80, Expand);
{		{
APFloat TmpFlt = APFloat::getZero(APFloat::x87DoubleExtended());		APFloat TmpFlt = APFloat::getZero(APFloat::x87DoubleExtended());
addLegalFPImmediate(TmpFlt); // FLD0		addLegalFPImmediate(TmpFlt); // FLD0
TmpFlt.changeSign();		TmpFlt.changeSign();
addLegalFPImmediate(TmpFlt); // FLD0/FCHS		addLegalFPImmediate(TmpFlt); // FLD0/FCHS
Show All 19 Lines	if (UseX87) {
setOperationAction(ISD::FNEARBYINT, MVT::f80, Expand);		setOperationAction(ISD::FNEARBYINT, MVT::f80, Expand);
setOperationAction(ISD::FMA, MVT::f80, Expand);		setOperationAction(ISD::FMA, MVT::f80, Expand);
setOperationAction(ISD::LROUND, MVT::f80, Expand);		setOperationAction(ISD::LROUND, MVT::f80, Expand);
setOperationAction(ISD::LLROUND, MVT::f80, Expand);		setOperationAction(ISD::LLROUND, MVT::f80, Expand);
setOperationAction(ISD::LRINT, MVT::f80, Expand);		setOperationAction(ISD::LRINT, MVT::f80, Expand);
setOperationAction(ISD::LLRINT, MVT::f80, Expand);		setOperationAction(ISD::LLRINT, MVT::f80, Expand);
}		}

		// f128 uses xmm registers, but most operations require libcalls.
		if (!Subtarget.useSoftFloat() && Subtarget.is64Bit() && Subtarget.hasSSE1()) {
		addRegisterClass(MVT::f128, Subtarget.hasVLX() ? &X86::VR128XRegClass
		: &X86::VR128RegClass);
		craig.topperAuthorUnsubmitted Done Reply Inline Actions I suspect we can use Expand here and let LegalizeDAG form libcalls for FADD/FSUB/FMUL/FDIV, but what I have here is what AArch64 does. I think LegalizeDAG didn't handle those operations for libcalls at the time the AArch64 code was written. I went conservative for X86 here because LegalizeDAG can form tail calls to the library which legalize types didn't do and my custom handler doesn't either. This avoided some test divergences. craig.topper: I suspect we can use Expand here and let LegalizeDAG form libcalls for FADD/FSUB/FMUL/FDIV, but…

		addLegalFPImmediate(APFloat::getZero(APFloat::IEEEquad())); // xorps

		setOperationAction(ISD::FADD, MVT::f128, Custom);
		setOperationAction(ISD::FSUB, MVT::f128, Custom);
		setOperationAction(ISD::FDIV, MVT::f128, Custom);
		setOperationAction(ISD::FMUL, MVT::f128, Custom);
		setOperationAction(ISD::FMA, MVT::f128, Expand);

		setOperationAction(ISD::FABS, MVT::f128, Custom);
		setOperationAction(ISD::FNEG, MVT::f128, Custom);
		setOperationAction(ISD::FCOPYSIGN, MVT::f128, Custom);

		setOperationAction(ISD::FSIN, MVT::f128, Expand);
		setOperationAction(ISD::FCOS, MVT::f128, Expand);
		setOperationAction(ISD::FSINCOS, MVT::f128, Expand);
		setOperationAction(ISD::FSQRT, MVT::f128, Expand);

		setOperationAction(ISD::FP_EXTEND, MVT::f128, Custom);
		// We need to custom handle any FP_ROUND with an f128 input, but
		chhUnsubmitted Not Done Reply Inline Actions s/ff128/f128/ chh: s/ff128/f128/
		// LegalizeDAG uses the result type to know when to run a custom handler.
		// So we have to list all legal floating point result types here.
		if (isTypeLegal(MVT::f32)) {
		setOperationAction(ISD::FP_ROUND, MVT::f32, Custom);
		setOperationAction(ISD::STRICT_FP_ROUND, MVT::f32, Custom);
		}
		if (isTypeLegal(MVT::f64)) {
		chhUnsubmitted Not Done Reply Inline Actions Are the changes to f32, f64, f80 dependent to this f128 change? If they are, please add some comment. chh: Are the changes to f32, f64, f80 dependent to this f128 change? If they are, please add some…
		setOperationAction(ISD::FP_ROUND, MVT::f64, Custom);
		setOperationAction(ISD::STRICT_FP_ROUND, MVT::f64, Custom);
		}
		if (isTypeLegal(MVT::f80)) {
		setOperationAction(ISD::FP_ROUND, MVT::f80, Custom);
		setOperationAction(ISD::STRICT_FP_ROUND, MVT::f80, Custom);
		}

		setOperationAction(ISD::SETCC, MVT::f128, Custom);

		setLoadExtAction(ISD::EXTLOAD, MVT::f128, MVT::f32, Expand);
		setLoadExtAction(ISD::EXTLOAD, MVT::f128, MVT::f64, Expand);
		setLoadExtAction(ISD::EXTLOAD, MVT::f128, MVT::f80, Expand);
		setTruncStoreAction(MVT::f128, MVT::f32, Expand);
		setTruncStoreAction(MVT::f128, MVT::f64, Expand);
		setTruncStoreAction(MVT::f128, MVT::f80, Expand);
		}

// Always use a library call for pow.		// Always use a library call for pow.
setOperationAction(ISD::FPOW , MVT::f32 , Expand);		setOperationAction(ISD::FPOW , MVT::f32 , Expand);
setOperationAction(ISD::FPOW , MVT::f64 , Expand);		setOperationAction(ISD::FPOW , MVT::f64 , Expand);
setOperationAction(ISD::FPOW , MVT::f80 , Expand);		setOperationAction(ISD::FPOW , MVT::f80 , Expand);
		setOperationAction(ISD::FPOW , MVT::f128 , Expand);

setOperationAction(ISD::FLOG, MVT::f80, Expand);		setOperationAction(ISD::FLOG, MVT::f80, Expand);
setOperationAction(ISD::FLOG2, MVT::f80, Expand);		setOperationAction(ISD::FLOG2, MVT::f80, Expand);
setOperationAction(ISD::FLOG10, MVT::f80, Expand);		setOperationAction(ISD::FLOG10, MVT::f80, Expand);
setOperationAction(ISD::FEXP, MVT::f80, Expand);		setOperationAction(ISD::FEXP, MVT::f80, Expand);
setOperationAction(ISD::FEXP2, MVT::f80, Expand);		setOperationAction(ISD::FEXP2, MVT::f80, Expand);
setOperationAction(ISD::FMINNUM, MVT::f80, Expand);		setOperationAction(ISD::FMINNUM, MVT::f80, Expand);
setOperationAction(ISD::FMAXNUM, MVT::f80, Expand);		setOperationAction(ISD::FMAXNUM, MVT::f80, Expand);
▲ Show 20 Lines • Show All 93 Lines • ▼ Show 20 Lines	if (!Subtarget.useSoftFloat() && Subtarget.hasSSE1()) {
setOperationAction(ISD::VECTOR_SHUFFLE, MVT::v4f32, Custom);		setOperationAction(ISD::VECTOR_SHUFFLE, MVT::v4f32, Custom);
setOperationAction(ISD::VSELECT, MVT::v4f32, Custom);		setOperationAction(ISD::VSELECT, MVT::v4f32, Custom);
setOperationAction(ISD::EXTRACT_VECTOR_ELT, MVT::v4f32, Custom);		setOperationAction(ISD::EXTRACT_VECTOR_ELT, MVT::v4f32, Custom);
setOperationAction(ISD::SELECT, MVT::v4f32, Custom);		setOperationAction(ISD::SELECT, MVT::v4f32, Custom);
setOperationAction(ISD::UINT_TO_FP, MVT::v4i32, Custom);		setOperationAction(ISD::UINT_TO_FP, MVT::v4i32, Custom);

setOperationAction(ISD::LOAD, MVT::v2f32, Custom);		setOperationAction(ISD::LOAD, MVT::v2f32, Custom);
setOperationAction(ISD::STORE, MVT::v2f32, Custom);		setOperationAction(ISD::STORE, MVT::v2f32, Custom);

		setOperationAction(ISD::STRICT_FP_ROUND, MVT::v4f32, Custom);
}		}

if (!Subtarget.useSoftFloat() && Subtarget.hasSSE2()) {		if (!Subtarget.useSoftFloat() && Subtarget.hasSSE2()) {
addRegisterClass(MVT::v2f64, Subtarget.hasVLX() ? &X86::VR128XRegClass		addRegisterClass(MVT::v2f64, Subtarget.hasVLX() ? &X86::VR128XRegClass
: &X86::VR128RegClass);		: &X86::VR128RegClass);

// FIXME: Unfortunately, -soft-float and -no-implicit-float mean XMM		// FIXME: Unfortunately, -soft-float and -no-implicit-float mean XMM
// registers cannot be used even for integer operations.		// registers cannot be used even for integer operations.
▲ Show 20 Lines • Show All 337 Lines • ▼ Show 20 Lines	if (!Subtarget.useSoftFloat() && Subtarget.hasAVX()) {
// (fp_to_int:v8i16 (v8f32 ..)) requires the result type to be promoted		// (fp_to_int:v8i16 (v8f32 ..)) requires the result type to be promoted
// even though v8i16 is a legal type.		// even though v8i16 is a legal type.
setOperationPromotedToType(ISD::FP_TO_SINT, MVT::v8i16, MVT::v8i32);		setOperationPromotedToType(ISD::FP_TO_SINT, MVT::v8i16, MVT::v8i32);
setOperationPromotedToType(ISD::FP_TO_UINT, MVT::v8i16, MVT::v8i32);		setOperationPromotedToType(ISD::FP_TO_UINT, MVT::v8i16, MVT::v8i32);
setOperationAction(ISD::FP_TO_SINT, MVT::v8i32, Legal);		setOperationAction(ISD::FP_TO_SINT, MVT::v8i32, Legal);

setOperationAction(ISD::SINT_TO_FP, MVT::v8i32, Legal);		setOperationAction(ISD::SINT_TO_FP, MVT::v8i32, Legal);

		setOperationAction(ISD::STRICT_FP_ROUND, MVT::v8f32, Custom);

if (!Subtarget.hasAVX512())		if (!Subtarget.hasAVX512())
setOperationAction(ISD::BITCAST, MVT::v32i1, Custom);		setOperationAction(ISD::BITCAST, MVT::v32i1, Custom);

// In the customized shift lowering, the legal v8i32/v4i64 cases		// In the customized shift lowering, the legal v8i32/v4i64 cases
// in AVX2 will be recognized.		// in AVX2 will be recognized.
for (auto VT : { MVT::v32i8, MVT::v16i16, MVT::v8i32, MVT::v4i64 }) {		for (auto VT : { MVT::v32i8, MVT::v16i16, MVT::v8i32, MVT::v4i64 }) {
setOperationAction(ISD::SRL, VT, Custom);		setOperationAction(ISD::SRL, VT, Custom);
setOperationAction(ISD::SHL, VT, Custom);		setOperationAction(ISD::SHL, VT, Custom);
▲ Show 20 Lines • Show All 245 Lines • ▼ Show 20 Lines	if (!Subtarget.useSoftFloat() && Subtarget.useAVX512Regs()) {
setOperationPromotedToType(ISD::FP_TO_SINT, MVT::v16i1, MVT::v16i32);		setOperationPromotedToType(ISD::FP_TO_SINT, MVT::v16i1, MVT::v16i32);
setOperationAction(ISD::FP_TO_UINT, MVT::v16i32, Legal);		setOperationAction(ISD::FP_TO_UINT, MVT::v16i32, Legal);
setOperationPromotedToType(ISD::FP_TO_UINT, MVT::v16i1, MVT::v16i32);		setOperationPromotedToType(ISD::FP_TO_UINT, MVT::v16i1, MVT::v16i32);
setOperationPromotedToType(ISD::FP_TO_UINT, MVT::v16i8, MVT::v16i32);		setOperationPromotedToType(ISD::FP_TO_UINT, MVT::v16i8, MVT::v16i32);
setOperationPromotedToType(ISD::FP_TO_UINT, MVT::v16i16, MVT::v16i32);		setOperationPromotedToType(ISD::FP_TO_UINT, MVT::v16i16, MVT::v16i32);
setOperationAction(ISD::SINT_TO_FP, MVT::v16i32, Legal);		setOperationAction(ISD::SINT_TO_FP, MVT::v16i32, Legal);
setOperationAction(ISD::UINT_TO_FP, MVT::v16i32, Legal);		setOperationAction(ISD::UINT_TO_FP, MVT::v16i32, Legal);

		setOperationAction(ISD::STRICT_FP_ROUND, MVT::v16f32, Custom);

setTruncStoreAction(MVT::v8i64, MVT::v8i8, Legal);		setTruncStoreAction(MVT::v8i64, MVT::v8i8, Legal);
setTruncStoreAction(MVT::v8i64, MVT::v8i16, Legal);		setTruncStoreAction(MVT::v8i64, MVT::v8i16, Legal);
setTruncStoreAction(MVT::v8i64, MVT::v8i32, Legal);		setTruncStoreAction(MVT::v8i64, MVT::v8i32, Legal);
setTruncStoreAction(MVT::v16i32, MVT::v16i8, Legal);		setTruncStoreAction(MVT::v16i32, MVT::v16i8, Legal);
setTruncStoreAction(MVT::v16i32, MVT::v16i16, Legal);		setTruncStoreAction(MVT::v16i32, MVT::v16i16, Legal);

// With 512-bit vectors and no VLX, we prefer to widen MLOAD/MSTORE		// With 512-bit vectors and no VLX, we prefer to widen MLOAD/MSTORE
// to 512-bit rather than use the AVX2 instructions so that we can use		// to 512-bit rather than use the AVX2 instructions so that we can use
▲ Show 20 Lines • Show All 3,245 Lines • ▼ Show 20 Lines	if (ConstantSDNode *RHSC = dyn_cast<ConstantSDNode>(RHS)) {
// X > -1 -> X == 0, jump !sign.		// X > -1 -> X == 0, jump !sign.
RHS = DAG.getConstant(0, DL, RHS.getValueType());		RHS = DAG.getConstant(0, DL, RHS.getValueType());
return X86::COND_NS;		return X86::COND_NS;
}		}
if (SetCCOpcode == ISD::SETLT && RHSC->isNullValue()) {		if (SetCCOpcode == ISD::SETLT && RHSC->isNullValue()) {
// X < 0 -> X == 0, jump on sign.		// X < 0 -> X == 0, jump on sign.
return X86::COND_S;		return X86::COND_S;
}		}
		if (SetCCOpcode == ISD::SETGE && RHSC->isNullValue()) {
		// X >= 0 -> X == 0, jump on !sign.
		return X86::COND_NS;
		}
if (SetCCOpcode == ISD::SETLT && RHSC->getAPIntValue() == 1) {		if (SetCCOpcode == ISD::SETLT && RHSC->getAPIntValue() == 1) {
// X < 1 -> X <= 0		// X < 1 -> X <= 0
RHS = DAG.getConstant(0, DL, RHS.getValueType());		RHS = DAG.getConstant(0, DL, RHS.getValueType());
return X86::COND_LE;		return X86::COND_LE;
}		}
}		}

return TranslateIntegerX86CC(SetCCOpcode);		return TranslateIntegerX86CC(SetCCOpcode);
▲ Show 20 Lines • Show All 13,598 Lines • ▼ Show 20 Lines

SDValue X86TargetLowering::LowerSINT_TO_FP(SDValue Op,		SDValue X86TargetLowering::LowerSINT_TO_FP(SDValue Op,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
SDValue Src = Op.getOperand(0);		SDValue Src = Op.getOperand(0);
MVT SrcVT = Src.getSimpleValueType();		MVT SrcVT = Src.getSimpleValueType();
MVT VT = Op.getSimpleValueType();		MVT VT = Op.getSimpleValueType();
SDLoc dl(Op);		SDLoc dl(Op);

		if (VT == MVT::f128)
		return LowerF128Call(Op, DAG, RTLIB::getSINTTOFP(SrcVT, VT));

if (SDValue Extract = vectorizeExtractedCast(Op, DAG, Subtarget))		if (SDValue Extract = vectorizeExtractedCast(Op, DAG, Subtarget))
return Extract;		return Extract;

if (SrcVT.isVector()) {		if (SrcVT.isVector()) {
if (SrcVT == MVT::v2i32 && VT == MVT::v2f64) {		if (SrcVT == MVT::v2i32 && VT == MVT::v2f64) {
return DAG.getNode(X86ISD::CVTSI2P, dl, VT,		return DAG.getNode(X86ISD::CVTSI2P, dl, VT,
DAG.getNode(ISD::CONCAT_VECTORS, dl, MVT::v4i32, Src,		DAG.getNode(ISD::CONCAT_VECTORS, dl, MVT::v4i32, Src,
DAG.getUNDEF(SrcVT)));		DAG.getUNDEF(SrcVT)));
▲ Show 20 Lines • Show All 343 Lines • ▼ Show 20 Lines	static SDValue lowerUINT_TO_FP_vec(SDValue Op, SelectionDAG &DAG,
}		}
}		}

SDValue X86TargetLowering::LowerUINT_TO_FP(SDValue Op,		SDValue X86TargetLowering::LowerUINT_TO_FP(SDValue Op,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
SDValue N0 = Op.getOperand(0);		SDValue N0 = Op.getOperand(0);
SDLoc dl(Op);		SDLoc dl(Op);
auto PtrVT = getPointerTy(DAG.getDataLayout());		auto PtrVT = getPointerTy(DAG.getDataLayout());
		MVT SrcVT = N0.getSimpleValueType();
		MVT DstVT = Op.getSimpleValueType();

		if (DstVT == MVT::f128)
		return LowerF128Call(Op, DAG, RTLIB::getUINTTOFP(SrcVT, DstVT));

if (Op.getSimpleValueType().isVector())		if (DstVT.isVector())
		chhUnsubmitted Not Done Reply Inline Actions Is the change to SrcVT at line 18694 to fix some other bug or an error? Before this change, it was Op.getSimpleValueType() or DstVT. Why is it changed to SrcVT? chh: Is the change to SrcVT at line 18694 to fix some other bug or an error? Before this change, it…
		craig.topperAuthorUnsubmitted Done Reply Inline Actions Looks like a mistake on my part. I didn't mean to change it. If DstVT is a vector, SrcVT will also be a vector and vice versa so it doesn't matter. But I'll change it back to DstVT. craig.topper: Looks like a mistake on my part. I didn't mean to change it. If DstVT is a vector, SrcVT will…
return lowerUINT_TO_FP_vec(Op, DAG, Subtarget);		return lowerUINT_TO_FP_vec(Op, DAG, Subtarget);

if (SDValue Extract = vectorizeExtractedCast(Op, DAG, Subtarget))		if (SDValue Extract = vectorizeExtractedCast(Op, DAG, Subtarget))
return Extract;		return Extract;

MVT SrcVT = N0.getSimpleValueType();
MVT DstVT = Op.getSimpleValueType();

if (Subtarget.hasAVX512() && isScalarFPTypeInSSEReg(DstVT) &&		if (Subtarget.hasAVX512() && isScalarFPTypeInSSEReg(DstVT) &&
(SrcVT == MVT::i32 \|\| (SrcVT == MVT::i64 && Subtarget.is64Bit()))) {		(SrcVT == MVT::i32 \|\| (SrcVT == MVT::i64 && Subtarget.is64Bit()))) {
// Conversions from unsigned i32 to f32/f64 are legal,		// Conversions from unsigned i32 to f32/f64 are legal,
// using VCVTUSI2SS/SD. Same for i64 in 64-bit mode.		// using VCVTUSI2SS/SD. Same for i64 in 64-bit mode.
return Op;		return Op;
}		}

// Promote i32 to i64 and use a signed conversion on 64-bit targets.		// Promote i32 to i64 and use a signed conversion on 64-bit targets.
▲ Show 20 Lines • Show All 711 Lines • ▼ Show 20 Lines

SDValue X86TargetLowering::LowerFP_TO_INT(SDValue Op, SelectionDAG &DAG) const {		SDValue X86TargetLowering::LowerFP_TO_INT(SDValue Op, SelectionDAG &DAG) const {
bool IsSigned = Op.getOpcode() == ISD::FP_TO_SINT;		bool IsSigned = Op.getOpcode() == ISD::FP_TO_SINT;
MVT VT = Op.getSimpleValueType();		MVT VT = Op.getSimpleValueType();
SDValue Src = Op.getOperand(0);		SDValue Src = Op.getOperand(0);
MVT SrcVT = Src.getSimpleValueType();		MVT SrcVT = Src.getSimpleValueType();
SDLoc dl(Op);		SDLoc dl(Op);

		if (SrcVT == MVT::f128) {
		RTLIB::Libcall LC;
		if (Op.getOpcode() == ISD::FP_TO_SINT)
		LC = RTLIB::getFPTOSINT(SrcVT, VT);
		else
		LC = RTLIB::getFPTOUINT(SrcVT, VT);

		MakeLibCallOptions CallOptions;
		return makeLibCall(DAG, LC, VT, Src, CallOptions, SDLoc(Op)).first;
		}

if (VT.isVector()) {		if (VT.isVector()) {
if (VT == MVT::v2i1 && SrcVT == MVT::v2f64) {		if (VT == MVT::v2i1 && SrcVT == MVT::v2f64) {
MVT ResVT = MVT::v4i32;		MVT ResVT = MVT::v4i32;
MVT TruncVT = MVT::v4i1;		MVT TruncVT = MVT::v4i1;
unsigned Opc = IsSigned ? X86ISD::CVTTP2SI : X86ISD::CVTTP2UI;		unsigned Opc = IsSigned ? X86ISD::CVTTP2SI : X86ISD::CVTTP2UI;
if (!IsSigned && !Subtarget.hasVLX()) {		if (!IsSigned && !Subtarget.hasVLX()) {
// Widen to 512-bits.		// Widen to 512-bits.
ResVT = MVT::v8i32;		ResVT = MVT::v8i32;
▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines	SDValue X86TargetLowering::LowerFP_TO_INT(SDValue Op, SelectionDAG &DAG) const {

// Fall back to X87.		// Fall back to X87.
if (SDValue V = FP_TO_INTHelper(Op, DAG, IsSigned))		if (SDValue V = FP_TO_INTHelper(Op, DAG, IsSigned))
return V;		return V;

llvm_unreachable("Expected FP_TO_INTHelper to handle all remaining cases.");		llvm_unreachable("Expected FP_TO_INTHelper to handle all remaining cases.");
}		}

static SDValue LowerFP_EXTEND(SDValue Op, SelectionDAG &DAG) {		SDValue X86TargetLowering::LowerFP_EXTEND(SDValue Op, SelectionDAG &DAG) const {
SDLoc DL(Op);		SDLoc DL(Op);
MVT VT = Op.getSimpleValueType();		MVT VT = Op.getSimpleValueType();
SDValue In = Op.getOperand(0);		SDValue In = Op.getOperand(0);
MVT SVT = In.getSimpleValueType();		MVT SVT = In.getSimpleValueType();

		if (VT == MVT::f128) {
		RTLIB::Libcall LC = RTLIB::getFPEXT(SVT, VT);
		chhUnsubmitted Not Done Reply Inline Actions Coding style comment. Shouldn't it be RTLIB::Libcall LC = RTLIB::getFPEXT(SVT, VT); chh: Coding style comment. Shouldn't it be RTLIB::Libcall LC = RTLIB::getFPEXT(SVT, VT);
		craig.topperAuthorUnsubmitted Done Reply Inline Actions I copied part of this from somewhere else that had an if after the declaration. Looks like I failed to merge the two lines together the way I intended craig.topper: I copied part of this from somewhere else that had an if after the declaration. Looks like I…
		return LowerF128Call(Op, DAG, LC);
		}

assert(SVT == MVT::v2f32 && "Only customize MVT::v2f32 type legalization!");		assert(SVT == MVT::v2f32 && "Only customize MVT::v2f32 type legalization!");

return DAG.getNode(X86ISD::VFPEXT, DL, VT,		return DAG.getNode(X86ISD::VFPEXT, DL, VT,
DAG.getNode(ISD::CONCAT_VECTORS, DL, MVT::v4f32,		DAG.getNode(ISD::CONCAT_VECTORS, DL, MVT::v4f32,
In, DAG.getUNDEF(SVT)));		In, DAG.getUNDEF(SVT)));
}		}

		SDValue X86TargetLowering::LowerFP_ROUND(SDValue Op, SelectionDAG &DAG) const {
		MVT VT = Op.getSimpleValueType();
		SDValue In = Op.getOperand(0);
		MVT SVT = In.getSimpleValueType();

		// It's legal except when f128 is involved
		if (SVT != MVT::f128)
		return Op;

		RTLIB::Libcall LC = RTLIB::getFPROUND(SVT, VT);

		// FP_ROUND node has a second operand indicating whether it is known to be
		// precise. That doesn't take part in the LibCall so we can't directly use
		// LowerF128Call.
		MakeLibCallOptions CallOptions;
		return makeLibCall(DAG, LC, VT, In, CallOptions, SDLoc(Op)).first;
		}

		// FIXME: This is a hack to allow FP_ROUND to be marked Custom without breaking
		// the default expansion of STRICT_FP_ROUND.
		static SDValue LowerSTRICT_FP_ROUND(SDValue Op, SelectionDAG &DAG) {
		// FIXME: Need to form a libcall with an input chain for f128.
		assert(Op.getOperand(0).getValueType() != MVT::f128 &&
		"Don't know how to handle f128 yet!");
		return Op;
		}

/// Horizontal vector math instructions may be slower than normal math with		/// Horizontal vector math instructions may be slower than normal math with
/// shuffles. Limit horizontal op codegen based on size/speed trade-offs, uarch		/// shuffles. Limit horizontal op codegen based on size/speed trade-offs, uarch
/// implementation, and likely shuffle complexity of the alternate sequence.		/// implementation, and likely shuffle complexity of the alternate sequence.
static bool shouldUseHorizontalOp(bool IsSingleSource, SelectionDAG &DAG,		static bool shouldUseHorizontalOp(bool IsSingleSource, SelectionDAG &DAG,
const X86Subtarget &Subtarget) {		const X86Subtarget &Subtarget) {
bool IsOptimizingSize = DAG.getMachineFunction().getFunction().hasOptSize();		bool IsOptimizingSize = DAG.getMachineFunction().getFunction().hasOptSize();
bool HasFastHOps = Subtarget.hasFastHorizontalOps();		bool HasFastHOps = Subtarget.hasFastHorizontalOps();
return !IsSingleSource \|\| IsOptimizingSize \|\| HasFastHOps;		return !IsSingleSource \|\| IsOptimizingSize \|\| HasFastHOps;
▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines	static SDValue lowerAddSubToHorizontalOp(SDValue Op, SelectionDAG &DAG,
// sub (extractelt (X, 0), extractelt (X, 1)) --> extractelt (hsub X, X), 0		// sub (extractelt (X, 0), extractelt (X, 1)) --> extractelt (hsub X, X), 0
SDValue HOp = DAG.getNode(HOpcode, DL, X.getValueType(), X, X);		SDValue HOp = DAG.getNode(HOpcode, DL, X.getValueType(), X, X);
return DAG.getNode(ISD::EXTRACT_VECTOR_ELT, DL, Op.getSimpleValueType(), HOp,		return DAG.getNode(ISD::EXTRACT_VECTOR_ELT, DL, Op.getSimpleValueType(), HOp,
DAG.getIntPtrConstant(LExtIndex / 2, DL));		DAG.getIntPtrConstant(LExtIndex / 2, DL));
}		}

/// Depending on uarch and/or optimizing for size, we might prefer to use a		/// Depending on uarch and/or optimizing for size, we might prefer to use a
/// vector operation in place of the typical scalar operation.		/// vector operation in place of the typical scalar operation.
static SDValue lowerFaddFsub(SDValue Op, SelectionDAG &DAG,		SDValue X86TargetLowering::lowerFaddFsub(SDValue Op, SelectionDAG &DAG) const {
const X86Subtarget &Subtarget) {		if (Op.getValueType() == MVT::f128) {
		RTLIB::Libcall LC = Op.getOpcode() == ISD::FADD ? RTLIB::ADD_F128
		: RTLIB::SUB_F128;
		return LowerF128Call(Op, DAG, LC);
		}

assert((Op.getValueType() == MVT::f32 \|\| Op.getValueType() == MVT::f64) &&		assert((Op.getValueType() == MVT::f32 \|\| Op.getValueType() == MVT::f64) &&
"Only expecting float/double");		"Only expecting float/double");
return lowerAddSubToHorizontalOp(Op, DAG, Subtarget);		return lowerAddSubToHorizontalOp(Op, DAG, Subtarget);
}		}

/// The only differences between FABS and FNEG are the mask and the logic op.		/// The only differences between FABS and FNEG are the mask and the logic op.
/// FNEG also has a folding opportunity for FNEG(FABS(x)).		/// FNEG also has a folding opportunity for FNEG(FABS(x)).
static SDValue LowerFABSorFNEG(SDValue Op, SelectionDAG &DAG) {		static SDValue LowerFABSorFNEG(SDValue Op, SelectionDAG &DAG) {
▲ Show 20 Lines • Show All 1,313 Lines • ▼ Show 20 Lines	SDValue X86TargetLowering::LowerSETCC(SDValue Op, SelectionDAG &DAG) const {
if (VT.isVector()) return LowerVSETCC(Op, Subtarget, DAG);		if (VT.isVector()) return LowerVSETCC(Op, Subtarget, DAG);

assert(VT == MVT::i8 && "SetCC type must be 8-bit integer");		assert(VT == MVT::i8 && "SetCC type must be 8-bit integer");
SDValue Op0 = Op.getOperand(0);		SDValue Op0 = Op.getOperand(0);
SDValue Op1 = Op.getOperand(1);		SDValue Op1 = Op.getOperand(1);
SDLoc dl(Op);		SDLoc dl(Op);
ISD::CondCode CC = cast<CondCodeSDNode>(Op.getOperand(2))->get();		ISD::CondCode CC = cast<CondCodeSDNode>(Op.getOperand(2))->get();

		// Handle f128 first, since one possible outcome is a normal integer
		// comparison which gets handled by emitFlagsForSetcc.
		if (Op0.getValueType() == MVT::f128) {
		softenSetCCOperands(DAG, MVT::f128, Op0, Op1, CC, dl, Op0, Op1);

		// If softenSetCCOperands returned a scalar, use it.
		if (!Op1.getNode()) {
		assert(Op0.getValueType() == Op.getValueType() &&
		"Unexpected setcc expansion!");
		return Op0;
		}
		}

SDValue X86CC;		SDValue X86CC;
SDValue EFLAGS = emitFlagsForSetcc(Op0, Op1, CC, dl, DAG, X86CC);		SDValue EFLAGS = emitFlagsForSetcc(Op0, Op1, CC, dl, DAG, X86CC);
if (!EFLAGS)		if (!EFLAGS)
return SDValue();		return SDValue();

return DAG.getNode(X86ISD::SETCC, dl, MVT::i8, X86CC, EFLAGS);		return DAG.getNode(X86ISD::SETCC, dl, MVT::i8, X86CC, EFLAGS);
}		}

▲ Show 20 Lines • Show All 6,669 Lines • ▼ Show 20 Lines	SDValue X86TargetLowering::LowerGC_TRANSITION_END(SDValue Op,

SDLoc OpDL(Op);		SDLoc OpDL(Op);
SDVTList VTs = DAG.getVTList(MVT::Other, MVT::Glue);		SDVTList VTs = DAG.getVTList(MVT::Other, MVT::Glue);
SDValue NOOP(DAG.getMachineNode(X86::NOOP, SDLoc(Op), VTs, Ops), 0);		SDValue NOOP(DAG.getMachineNode(X86::NOOP, SDLoc(Op), VTs, Ops), 0);

return NOOP;		return NOOP;
}		}

		SDValue X86TargetLowering::LowerF128Call(SDValue Op, SelectionDAG &DAG,
		RTLIB::Libcall Call) const {
		SmallVector<SDValue, 2> Ops(Op->op_begin(), Op->op_end());
		MakeLibCallOptions CallOptions;
		return makeLibCall(DAG, Call, MVT::f128, Ops, CallOptions, SDLoc(Op)).first;
		}

/// Provide custom lowering hooks for some operations.		/// Provide custom lowering hooks for some operations.
SDValue X86TargetLowering::LowerOperation(SDValue Op, SelectionDAG &DAG) const {		SDValue X86TargetLowering::LowerOperation(SDValue Op, SelectionDAG &DAG) const {
switch (Op.getOpcode()) {		switch (Op.getOpcode()) {
default: llvm_unreachable("Should not custom lower this!");		default: llvm_unreachable("Should not custom lower this!");
case ISD::ATOMIC_FENCE: return LowerATOMIC_FENCE(Op, Subtarget, DAG);		case ISD::ATOMIC_FENCE: return LowerATOMIC_FENCE(Op, Subtarget, DAG);
case ISD::ATOMIC_CMP_SWAP_WITH_SUCCESS:		case ISD::ATOMIC_CMP_SWAP_WITH_SUCCESS:
return LowerCMP_SWAP(Op, Subtarget, DAG);		return LowerCMP_SWAP(Op, Subtarget, DAG);
case ISD::CTPOP: return LowerCTPOP(Op, Subtarget, DAG);		case ISD::CTPOP: return LowerCTPOP(Op, Subtarget, DAG);
Show All 30 Lines	SDValue X86TargetLowering::LowerOperation(SDValue Op, SelectionDAG &DAG) const {
case ISD::SIGN_EXTEND: return LowerSIGN_EXTEND(Op, Subtarget, DAG);		case ISD::SIGN_EXTEND: return LowerSIGN_EXTEND(Op, Subtarget, DAG);
case ISD::ANY_EXTEND: return LowerANY_EXTEND(Op, Subtarget, DAG);		case ISD::ANY_EXTEND: return LowerANY_EXTEND(Op, Subtarget, DAG);
case ISD::ZERO_EXTEND_VECTOR_INREG:		case ISD::ZERO_EXTEND_VECTOR_INREG:
case ISD::SIGN_EXTEND_VECTOR_INREG:		case ISD::SIGN_EXTEND_VECTOR_INREG:
return LowerEXTEND_VECTOR_INREG(Op, Subtarget, DAG);		return LowerEXTEND_VECTOR_INREG(Op, Subtarget, DAG);
case ISD::FP_TO_SINT:		case ISD::FP_TO_SINT:
case ISD::FP_TO_UINT: return LowerFP_TO_INT(Op, DAG);		case ISD::FP_TO_UINT: return LowerFP_TO_INT(Op, DAG);
case ISD::FP_EXTEND: return LowerFP_EXTEND(Op, DAG);		case ISD::FP_EXTEND: return LowerFP_EXTEND(Op, DAG);
		case ISD::FP_ROUND: return LowerFP_ROUND(Op, DAG);
		case ISD::STRICT_FP_ROUND: return LowerSTRICT_FP_ROUND(Op, DAG);
case ISD::LOAD: return LowerLoad(Op, Subtarget, DAG);		case ISD::LOAD: return LowerLoad(Op, Subtarget, DAG);
case ISD::STORE: return LowerStore(Op, Subtarget, DAG);		case ISD::STORE: return LowerStore(Op, Subtarget, DAG);
case ISD::FADD:		case ISD::FADD:
case ISD::FSUB: return lowerFaddFsub(Op, DAG, Subtarget);		case ISD::FSUB: return lowerFaddFsub(Op, DAG);
		case ISD::FMUL: return LowerF128Call(Op, DAG, RTLIB::MUL_F128);
		case ISD::FDIV: return LowerF128Call(Op, DAG, RTLIB::DIV_F128);
case ISD::FABS:		case ISD::FABS:
case ISD::FNEG: return LowerFABSorFNEG(Op, DAG);		case ISD::FNEG: return LowerFABSorFNEG(Op, DAG);
case ISD::FCOPYSIGN: return LowerFCOPYSIGN(Op, DAG);		case ISD::FCOPYSIGN: return LowerFCOPYSIGN(Op, DAG);
case ISD::FGETSIGN: return LowerFGETSIGN(Op, DAG);		case ISD::FGETSIGN: return LowerFGETSIGN(Op, DAG);
case ISD::SETCC: return LowerSETCC(Op, DAG);		case ISD::SETCC: return LowerSETCC(Op, DAG);
case ISD::SETCCCARRY: return LowerSETCCCARRY(Op, DAG);		case ISD::SETCCCARRY: return LowerSETCCCARRY(Op, DAG);
case ISD::SELECT: return LowerSELECT(Op, DAG);		case ISD::SELECT: return LowerSELECT(Op, DAG);
case ISD::BRCOND: return LowerBRCOND(Op, DAG);		case ISD::BRCOND: return LowerBRCOND(Op, DAG);
▲ Show 20 Lines • Show All 18,629 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/fp128-cast.ll

Show First 20 Lines • Show All 499 Lines • ▼ Show 20 Lines	entry:
%conv = fptrunc fp128 %0 to double		%conv = fptrunc fp128 %0 to double
store double %conv, double* @vf64, align 8		store double %conv, double* @vf64, align 8
ret void		ret void
}		}

define void @TestFPTruncF128_F80() nounwind {		define void @TestFPTruncF128_F80() nounwind {
; X64-SSE-LABEL: TestFPTruncF128_F80:		; X64-SSE-LABEL: TestFPTruncF128_F80:
; X64-SSE: # %bb.0: # %entry		; X64-SSE: # %bb.0: # %entry
; X64-SSE-NEXT: subq $24, %rsp		; X64-SSE-NEXT: pushq %rax
; X64-SSE-NEXT: movaps {{.*}}(%rip), %xmm0		; X64-SSE-NEXT: movaps {{.*}}(%rip), %xmm0
; X64-SSE-NEXT: callq __trunctfxf2		; X64-SSE-NEXT: callq __trunctfxf2
; X64-SSE-NEXT: fstpt (%rsp)		; X64-SSE-NEXT: fstpt {{.*}}(%rip)
; X64-SSE-NEXT: movq (%rsp), %rax		; X64-SSE-NEXT: popq %rax
; X64-SSE-NEXT: movq %rax, {{.*}}(%rip)
; X64-SSE-NEXT: movl {{[0-9]+}}(%rsp), %eax
; X64-SSE-NEXT: movw %ax, vf80+{{.*}}(%rip)
; X64-SSE-NEXT: addq $24, %rsp
; X64-SSE-NEXT: retq		; X64-SSE-NEXT: retq
;		;
; X32-LABEL: TestFPTruncF128_F80:		; X32-LABEL: TestFPTruncF128_F80:
; X32: # %bb.0: # %entry		; X32: # %bb.0: # %entry
; X32-NEXT: subl $12, %esp		; X32-NEXT: subl $12, %esp
; X32-NEXT: pushl vf128+12		; X32-NEXT: pushl vf128+12
; X32-NEXT: pushl vf128+8		; X32-NEXT: pushl vf128+8
; X32-NEXT: pushl vf128+4		; X32-NEXT: pushl vf128+4
; X32-NEXT: pushl vf128		; X32-NEXT: pushl vf128
; X32-NEXT: calll __trunctfxf2		; X32-NEXT: calll __trunctfxf2
; X32-NEXT: addl $16, %esp		; X32-NEXT: addl $16, %esp
; X32-NEXT: fstpt vf80		; X32-NEXT: fstpt vf80
; X32-NEXT: addl $12, %esp		; X32-NEXT: addl $12, %esp
; X32-NEXT: retl		; X32-NEXT: retl
;		;
; X64-AVX-LABEL: TestFPTruncF128_F80:		; X64-AVX-LABEL: TestFPTruncF128_F80:
; X64-AVX: # %bb.0: # %entry		; X64-AVX: # %bb.0: # %entry
; X64-AVX-NEXT: subq $24, %rsp		; X64-AVX-NEXT: pushq %rax
; X64-AVX-NEXT: vmovaps {{.*}}(%rip), %xmm0		; X64-AVX-NEXT: vmovaps {{.*}}(%rip), %xmm0
; X64-AVX-NEXT: callq __trunctfxf2		; X64-AVX-NEXT: callq __trunctfxf2
; X64-AVX-NEXT: fstpt (%rsp)		; X64-AVX-NEXT: fstpt {{.*}}(%rip)
; X64-AVX-NEXT: movq (%rsp), %rax		; X64-AVX-NEXT: popq %rax
; X64-AVX-NEXT: movq %rax, {{.*}}(%rip)
; X64-AVX-NEXT: movl {{[0-9]+}}(%rsp), %eax
; X64-AVX-NEXT: movw %ax, vf80+{{.*}}(%rip)
; X64-AVX-NEXT: addq $24, %rsp
; X64-AVX-NEXT: retq		; X64-AVX-NEXT: retq
entry:		entry:
%0 = load fp128, fp128* @vf128, align 16		%0 = load fp128, fp128* @vf128, align 16
%conv = fptrunc fp128 %0 to x86_fp80		%conv = fptrunc fp128 %0 to x86_fp80
store x86_fp80 %conv, x86_fp80* @vf80, align 8		store x86_fp80 %conv, x86_fp80* @vf80, align 8
ret void		ret void
}		}

▲ Show 20 Lines • Show All 708 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/fp128-compare.ll

	Show First 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	}			}

	define i32 @TestComp128LT(fp128 %d1, fp128 %d2) {			define i32 @TestComp128LT(fp128 %d1, fp128 %d2) {
	; CHECK-LABEL: TestComp128LT:			; CHECK-LABEL: TestComp128LT:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: pushq %rax			; CHECK-NEXT: pushq %rax
	; CHECK-NEXT: .cfi_def_cfa_offset 16			; CHECK-NEXT: .cfi_def_cfa_offset 16
	; CHECK-NEXT: callq __lttf2			; CHECK-NEXT: callq __lttf2
	; CHECK-NEXT: shrl $31, %eax			; CHECK-NEXT: xorl %ecx, %ecx
				; CHECK-NEXT: testl %eax, %eax
				; CHECK-NEXT: sets %cl
				; CHECK-NEXT: movl %ecx, %eax
	; CHECK-NEXT: popq %rcx			; CHECK-NEXT: popq %rcx
	; CHECK-NEXT: .cfi_def_cfa_offset 8			; CHECK-NEXT: .cfi_def_cfa_offset 8
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%cmp = fcmp olt fp128 %d1, %d2			%cmp = fcmp olt fp128 %d1, %d2
	%conv = zext i1 %cmp to i32			%conv = zext i1 %cmp to i32
	ret i32 %conv			ret i32 %conv
	; The 'shrl' is a special optimization in llvm to combine			; FIXME: This used to generate a shrl to move the sign bit of eax into bit 0.
				craig.topperAuthorUnsubmitted Done Reply Inline Actions I need to remove this comment until we go back to shr. craig.topper: I need to remove this comment until we go back to shr.
	; the effect of 'fcmp olt' and 'zext'. The main purpose is			; This no longer happens with fp128 compares being expanded by LegalizeDAG.
	; to test soften call to __lttf2.			; We can add a new DAG combine for X86ISD::CMP/SETCC to restore this.
	}			}

	define i32 @TestComp128LE(fp128 %d1, fp128 %d2) {			define i32 @TestComp128LE(fp128 %d1, fp128 %d2) {
	; CHECK-LABEL: TestComp128LE:			; CHECK-LABEL: TestComp128LE:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: pushq %rax			; CHECK-NEXT: pushq %rax
	; CHECK-NEXT: .cfi_def_cfa_offset 16			; CHECK-NEXT: .cfi_def_cfa_offset 16
	; CHECK-NEXT: callq __letf2			; CHECK-NEXT: callq __letf2
	▲ Show 20 Lines • Show All 73 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/fp128-i128.ll

	Show First 20 Lines • Show All 154 Lines • ▼ Show 20 Lines
	; AVX-NEXT: movabsq $9223372036854775807, %rax # imm = 0x7FFFFFFFFFFFFFFF			; AVX-NEXT: movabsq $9223372036854775807, %rax # imm = 0x7FFFFFFFFFFFFFFF
	; AVX-NEXT: andq {{[0-9]+}}(%rsp), %rax			; AVX-NEXT: andq {{[0-9]+}}(%rsp), %rax
	; AVX-NEXT: movq {{[0-9]+}}(%rsp), %rcx			; AVX-NEXT: movq {{[0-9]+}}(%rsp), %rcx
	; AVX-NEXT: movq %rax, {{[0-9]+}}(%rsp)			; AVX-NEXT: movq %rax, {{[0-9]+}}(%rsp)
	; AVX-NEXT: movq %rcx, (%rsp)			; AVX-NEXT: movq %rcx, (%rsp)
	; AVX-NEXT: vmovaps (%rsp), %xmm0			; AVX-NEXT: vmovaps (%rsp), %xmm0
	; AVX-NEXT: vmovaps {{.*}}(%rip), %xmm1			; AVX-NEXT: vmovaps {{.*}}(%rip), %xmm1
	; AVX-NEXT: callq __lttf2			; AVX-NEXT: callq __lttf2
	; AVX-NEXT: xorl %ecx, %ecx
	; AVX-NEXT: testl %eax, %eax			; AVX-NEXT: testl %eax, %eax
	; AVX-NEXT: sets %cl			; AVX-NEXT: js .LBB2_1
	; AVX-NEXT: shlq $4, %rcx			; AVX-NEXT: # %bb.2: # %entry
	; AVX-NEXT: vmovaps {{\.LCPI.*}}(%rcx), %xmm0			; AVX-NEXT: vmovaps {{.*}}(%rip), %xmm0
				; AVX-NEXT: addq $40, %rsp
				; AVX-NEXT: retq
				; AVX-NEXT: .LBB2_1:
				; AVX-NEXT: vmovaps {{.*}}(%rip), %xmm0
	; AVX-NEXT: addq $40, %rsp			; AVX-NEXT: addq $40, %rsp
	; AVX-NEXT: retq			; AVX-NEXT: retq
	entry:			entry:
	%0 = bitcast fp128 %x to i128			%0 = bitcast fp128 %x to i128
	%bf.clear = and i128 %0, 170141183460469231731687303715884105727			%bf.clear = and i128 %0, 170141183460469231731687303715884105727
	%1 = bitcast i128 %bf.clear to fp128			%1 = bitcast i128 %bf.clear to fp128
	%cmp = fcmp olt fp128 %1, 0xL999999999999999A3FFB999999999999			%cmp = fcmp olt fp128 %1, 0xL999999999999999A3FFB999999999999
	%cond = select i1 %cmp, fp128 0xL00000000000000003FFF000000000000, fp128 0xL00000000000000004000000000000000			%cond = select i1 %cmp, fp128 0xL00000000000000003FFF000000000000, fp128 0xL00000000000000004000000000000000
	▲ Show 20 Lines • Show All 381 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Move x86_64 fp128 conversion to libcalls from type legalization to DAG legalization
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 219658

llvm/lib/Target/X86/X86ISelLowering.h

llvm/lib/Target/X86/X86ISelLowering.cpp

llvm/test/CodeGen/X86/fp128-cast.ll

llvm/test/CodeGen/X86/fp128-compare.ll

llvm/test/CodeGen/X86/fp128-i128.ll

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Move x86_64 fp128 conversion to libcalls from type legalization to DAG legalizationClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 219658

llvm/lib/Target/X86/X86ISelLowering.h

llvm/lib/Target/X86/X86ISelLowering.cpp

llvm/test/CodeGen/X86/fp128-cast.ll

llvm/test/CodeGen/X86/fp128-compare.ll

llvm/test/CodeGen/X86/fp128-i128.ll

[X86] Move x86_64 fp128 conversion to libcalls from type legalization to DAG legalization
ClosedPublic