Diff 141966

llvm/trunk/lib/Target/ARM/ARMISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 1,041 Lines • ▼ Show 20 Lines	ARMTargetLowering::ARMTargetLowering(const TargetMachine &TM,
setOperationAction(ISD::INTRINSIC_WO_CHAIN, MVT::Other, Custom);		setOperationAction(ISD::INTRINSIC_WO_CHAIN, MVT::Other, Custom);
setOperationAction(ISD::EH_SJLJ_SETJMP, MVT::i32, Custom);		setOperationAction(ISD::EH_SJLJ_SETJMP, MVT::i32, Custom);
setOperationAction(ISD::EH_SJLJ_LONGJMP, MVT::Other, Custom);		setOperationAction(ISD::EH_SJLJ_LONGJMP, MVT::Other, Custom);
setOperationAction(ISD::EH_SJLJ_SETUP_DISPATCH, MVT::Other, Custom);		setOperationAction(ISD::EH_SJLJ_SETUP_DISPATCH, MVT::Other, Custom);
if (Subtarget->useSjLjEH())		if (Subtarget->useSjLjEH())
setLibcallName(RTLIB::UNWIND_RESUME, "_Unwind_SjLj_Resume");		setLibcallName(RTLIB::UNWIND_RESUME, "_Unwind_SjLj_Resume");

setOperationAction(ISD::SETCC, MVT::i32, Expand);		setOperationAction(ISD::SETCC, MVT::i32, Expand);
setOperationAction(ISD::SETCC, MVT::f16, Expand);
setOperationAction(ISD::SETCC, MVT::f32, Expand);		setOperationAction(ISD::SETCC, MVT::f32, Expand);
setOperationAction(ISD::SETCC, MVT::f64, Expand);		setOperationAction(ISD::SETCC, MVT::f64, Expand);
setOperationAction(ISD::SELECT, MVT::i32, Custom);		setOperationAction(ISD::SELECT, MVT::i32, Custom);
setOperationAction(ISD::SELECT, MVT::f32, Custom);		setOperationAction(ISD::SELECT, MVT::f32, Custom);
setOperationAction(ISD::SELECT, MVT::f64, Custom);		setOperationAction(ISD::SELECT, MVT::f64, Custom);
setOperationAction(ISD::SELECT_CC, MVT::f16, Custom);
setOperationAction(ISD::SELECT_CC, MVT::i32, Custom);		setOperationAction(ISD::SELECT_CC, MVT::i32, Custom);
setOperationAction(ISD::SELECT_CC, MVT::f32, Custom);		setOperationAction(ISD::SELECT_CC, MVT::f32, Custom);
setOperationAction(ISD::SELECT_CC, MVT::f64, Custom);		setOperationAction(ISD::SELECT_CC, MVT::f64, Custom);
		if (Subtarget->hasFullFP16()) {
		setOperationAction(ISD::SETCC, MVT::f16, Expand);
		setOperationAction(ISD::SELECT, MVT::f16, Custom);
		setOperationAction(ISD::SELECT_CC, MVT::f16, Custom);
		}

// Thumb-1 cannot currently select ARMISD::SUBE.		// Thumb-1 cannot currently select ARMISD::SUBE.
if (!Subtarget->isThumb1Only())		if (!Subtarget->isThumb1Only())
setOperationAction(ISD::SETCCE, MVT::i32, Custom);		setOperationAction(ISD::SETCCE, MVT::i32, Custom);

setOperationAction(ISD::BRCOND, MVT::Other, Custom);		setOperationAction(ISD::BRCOND, MVT::Other, Custom);
setOperationAction(ISD::BR_CC, MVT::i32, Custom);		setOperationAction(ISD::BR_CC, MVT::i32, Custom);
		if (Subtarget->hasFullFP16())
setOperationAction(ISD::BR_CC, MVT::f16, Custom);		setOperationAction(ISD::BR_CC, MVT::f16, Custom);
setOperationAction(ISD::BR_CC, MVT::f32, Custom);		setOperationAction(ISD::BR_CC, MVT::f32, Custom);
setOperationAction(ISD::BR_CC, MVT::f64, Custom);		setOperationAction(ISD::BR_CC, MVT::f64, Custom);
setOperationAction(ISD::BR_JT, MVT::Other, Custom);		setOperationAction(ISD::BR_JT, MVT::Other, Custom);

// We don't support sin/cos/fmod/copysign/pow		// We don't support sin/cos/fmod/copysign/pow
setOperationAction(ISD::FSIN, MVT::f64, Expand);		setOperationAction(ISD::FSIN, MVT::f64, Expand);
setOperationAction(ISD::FSIN, MVT::f32, Expand);		setOperationAction(ISD::FSIN, MVT::f32, Expand);
setOperationAction(ISD::FCOS, MVT::f32, Expand);		setOperationAction(ISD::FCOS, MVT::f32, Expand);
▲ Show 20 Lines • Show All 3,441 Lines • ▼ Show 20 Lines	SDValue ARMTargetLowering::LowerSELECT_CC(SDValue Op, SelectionDAG &DAG) const {

ARMCC::CondCodes CondCode, CondCode2;		ARMCC::CondCodes CondCode, CondCode2;
bool InvalidOnQNaN;		bool InvalidOnQNaN;
FPCCToARMCC(CC, CondCode, CondCode2, InvalidOnQNaN);		FPCCToARMCC(CC, CondCode, CondCode2, InvalidOnQNaN);

// Normalize the fp compare. If RHS is zero we keep it there so we match		// Normalize the fp compare. If RHS is zero we keep it there so we match
// CMPFPw0 instead of CMPFP.		// CMPFPw0 instead of CMPFP.
if (Subtarget->hasFPARMv8() && !isFloatingPointZero(RHS) &&		if (Subtarget->hasFPARMv8() && !isFloatingPointZero(RHS) &&
(TrueVal.getValueType() == MVT::f32 \|\| TrueVal.getValueType() == MVT::f64)) {		(TrueVal.getValueType() == MVT::f16 \|\|
		TrueVal.getValueType() == MVT::f32 \|\|
		TrueVal.getValueType() == MVT::f64)) {
bool swpCmpOps = false;		bool swpCmpOps = false;
bool swpVselOps = false;		bool swpVselOps = false;
checkVSELConstraints(CC, CondCode, swpCmpOps, swpVselOps);		checkVSELConstraints(CC, CondCode, swpCmpOps, swpVselOps);

if (CondCode == ARMCC::GT \|\| CondCode == ARMCC::GE \|\|		if (CondCode == ARMCC::GT \|\| CondCode == ARMCC::GE \|\|
CondCode == ARMCC::VS \|\| CondCode == ARMCC::EQ) {		CondCode == ARMCC::VS \|\| CondCode == ARMCC::EQ) {
if (swpCmpOps)		if (swpCmpOps)
std::swap(LHS, RHS);		std::swap(LHS, RHS);
▲ Show 20 Lines • Show All 10,324 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/ARM/fp16-instructions.ll

	; SOFT:			; SOFT:
	; RUN: llc < %s -mtriple=arm-none-eabi -float-abi=soft \| FileCheck %s --check-prefixes=CHECK,CHECK-SOFT			; RUN: llc < %s -mtriple=arm-none-eabi -float-abi=soft \| FileCheck %s --check-prefixes=CHECK,CHECK-SOFT
	; RUN: llc < %s -mtriple=thumb-none-eabi -float-abi=soft \| FileCheck %s --check-prefixes=CHECK,CHECK-SOFT			; RUN: llc < %s -mtriple=thumb-none-eabi -float-abi=soft \| FileCheck %s --check-prefixes=CHECK,CHECK-SOFT

	; SOFTFP:			; SOFTFP:
	; RUN: llc < %s -mtriple=arm-none-eabi -mattr=+vfp3 \| FileCheck %s --check-prefixes=CHECK,CHECK-SOFTFP-VFP3			; RUN: llc < %s -mtriple=arm-none-eabi -mattr=+vfp3 \| FileCheck %s --check-prefixes=CHECK,CHECK-SOFTFP-VFP3
	; RUN: llc < %s -mtriple=arm-none-eabi -mattr=+vfp4 \| FileCheck %s --check-prefixes=CHECK,CHECK-SOFTFP-FP16			; RUN: llc < %s -mtriple=arm-none-eabi -mattr=+vfp4 \| FileCheck %s --check-prefixes=CHECK,CHECK-SOFTFP-FP16,CHECK-SOFTFP-FP16-A32
	; RUN: llc < %s -mtriple=arm-none-eabi -mattr=+fullfp16 \| FileCheck %s --check-prefixes=CHECK,CHECK-SOFTFP-FULLFP16			; RUN: llc < %s -mtriple=arm-none-eabi -mattr=+fullfp16 \| FileCheck %s --check-prefixes=CHECK,CHECK-SOFTFP-FULLFP16

	; RUN: llc < %s -mtriple=thumbv7-none-eabi -mattr=+vfp3 \| FileCheck %s --check-prefixes=CHECK,CHECK-SOFTFP-VFP3			; RUN: llc < %s -mtriple=thumbv7-none-eabi -mattr=+vfp3 \| FileCheck %s --check-prefixes=CHECK,CHECK-SOFTFP-VFP3
	; RUN: llc < %s -mtriple=thumbv7-none-eabi -mattr=+vfp4 \| FileCheck %s --check-prefixes=CHECK,CHECK-SOFTFP-FP16			; RUN: llc < %s -mtriple=thumbv7-none-eabi -mattr=+vfp4 \| FileCheck %s --check-prefixes=CHECK,CHECK-SOFTFP-FP16,CHECK-SOFTFP-FP16-T32
	; RUN: llc < %s -mtriple=thumbv7-none-eabi -mattr=+fullfp16 \| FileCheck %s --check-prefixes=CHECK,CHECK-SOFTFP-FULLFP16			; RUN: llc < %s -mtriple=thumbv7-none-eabi -mattr=+fullfp16 \| FileCheck %s --check-prefixes=CHECK,CHECK-SOFTFP-FULLFP16

	; Test fast-isel			; Test fast-isel
	; RUN: llc < %s -mtriple=arm-none-eabi -mattr=+fullfp16 -O0 \| FileCheck %s --check-prefixes=CHECK-SPILL-RELOAD			; RUN: llc < %s -mtriple=arm-none-eabi -mattr=+fullfp16 -O0 \| FileCheck %s --check-prefixes=CHECK-SPILL-RELOAD
	; RUN: llc < %s -mtriple=thumbv7-none-eabi -mattr=+fullfp16 -O0 \| FileCheck %s --check-prefixes=CHECK-SPILL-RELOAD			; RUN: llc < %s -mtriple=thumbv7-none-eabi -mattr=+fullfp16 -O0 \| FileCheck %s --check-prefixes=CHECK-SPILL-RELOAD

	; HARD:			; HARD:
	; RUN: llc < %s -mtriple=arm-none-eabihf -mattr=+vfp3 \| FileCheck %s --check-prefixes=CHECK,CHECK-HARDFP-VFP3			; RUN: llc < %s -mtriple=arm-none-eabihf -mattr=+vfp3 \| FileCheck %s --check-prefixes=CHECK,CHECK-HARDFP-VFP3
	▲ Show 20 Lines • Show All 678 Lines • ▼ Show 20 Lines

	; 35. VSELEQ			; 35. VSELEQ
	define half @select_cc1() {			define half @select_cc1() {
	%1 = fcmp nsz oeq half undef, 0xH0001			%1 = fcmp nsz oeq half undef, 0xH0001
	%2 = select i1 %1, half 0xHC000, half 0xH0002			%2 = select i1 %1, half 0xHC000, half 0xH0002
	ret half %2			ret half %2

	; CHECK-LABEL: select_cc1:			; CHECK-LABEL: select_cc1:

				; CHECK-HARDFP-FULLFP16: vcmp.f16 s0, s0
				; CHECK-HARDFP-FULLFP16-NEXT: vmrs APSR_nzcv, fpscr
	; CHECK-HARDFP-FULLFP16: vseleq.f16 s0, s{{.}}, s{{.}}			; CHECK-HARDFP-FULLFP16: vseleq.f16 s0, s{{.}}, s{{.}}

				; CHECK-SOFTFP-FP16-A32: vcmp.f32 s0, s0
				; CHECK-SOFTFP-FP16-A32-NEXT: vmrs APSR_nzcv, fpscr
				; CHECK-SOFTFP-FP16-A32-NEXT: vmoveq.f32 s{{.}}, s{{.}}

				; CHECK-SOFTFP-FP16-T32: vcmp.f32 s0, s0
				; CHECK-SOFTFP-FP16-T32: vmrs APSR_nzcv, fpscr
				; CHECK-SOFTFP-FP16-T32: it eq
				; CHECK-SOFTFP-FP16-T32: vmoveq.f32 s{{.}}, s{{.}}
	}			}

				; FIXME: more tests need to be added for VSELGE and VSELGT.
				; That is, more combinations of immediate operands that can or can't
				; be encoded as an FP16 immediate need to be added here.
				;
	; 36. VSELGE			; 36. VSELGE
	define half @select_cc2() {			define half @select_cc_ge1() {
	%1 = fcmp nsz oge half undef, 0xH0001			%1 = fcmp nsz oge half undef, 0xH0001
	%2 = select i1 %1, half 0xHC000, half 0xH0002			%2 = select i1 %1, half 0xHC000, half 0xH0002
	ret half %2			ret half %2

	; CHECK-LABEL: select_cc2:			; CHECK-LABEL: select_cc_ge1:
	; CHECK-HARDFP-FULLFP16: vselge.f16 s0, s{{.}}, s{{.}}
				; CHECK-HARDFP-FULLFP16: vcmpe.f16 s0, s0
				; CHECK-HARDFP-FULLFP16-NEXT: vmrs APSR_nzcv, fpscr
				; CHECK-HARDFP-FULLFP16-NEXT: vselge.f16 s0, s{{.}}, s{{.}}

				; CHECK-SOFTFP-FP16-A32: vcmpe.f32 s0, s0
				; CHECK-SOFTFP-FP16-A32-NEXT: vmrs APSR_nzcv, fpscr
				; CHECK-SOFTFP-FP16-A32-NEXT: vmovge.f32 s{{.}}, s{{.}}

				; CHECK-SOFTFP-FP16-T32: vcmpe.f32 s0, s0
				; CHECK-SOFTFP-FP16-T32-NEXT: vmrs APSR_nzcv, fpscr
				; CHECK-SOFTFP-FP16-T32-NEXT: it ge
				; CHECK-SOFTFP-FP16-T32-NEXT: vmovge.f32 s{{.}}, s{{.}}
				}

				;
				; FIXME: add fcmp ole, ult here.
				;

				define half @select_cc_ge3() {
				%1 = fcmp nsz ugt half undef, 0xH0001
				%2 = select i1 %1, half 0xHC000, half 0xH0002
				ret half %2

				; CHECK-LABEL: select_cc_ge3:

				; CHECK-HARDFP-FULLFP16: vcmpe.f16 s0, s0
				; CHECK-HARDFP-FULLFP16-NEXT: vmrs APSR_nzcv, fpscr
				; CHECK-HARDFP-FULLFP16-NEXT: vselge.f16 s0, s{{.}}, s{{.}}

				; CHECK-SOFTFP-FP16-A32: vcmpe.f32 s0, s0
				; CHECK-SOFTFP-FP16-A32-NEXT: vmrs APSR_nzcv, fpscr
				; CHECK-SOFTFP-FP16-A32-NEXT: vmovhi.f32 s{{.}}, s{{.}}

				; CHECK-SOFTFP-FP16-T32: vcmpe.f32 s0, s0
				; CHECK-SOFTFP-FP16-T32-NEXT: vmrs APSR_nzcv, fpscr
				; CHECK-SOFTFP-FP16-T32-NEXT: it hi
				; CHECK-SOFTFP-FP16-T32-NEXT: vmovhi.f32 s{{.}}, s{{.}}
	}			}

	; 37. VSELGT			; 37. VSELGT
	define half @select_cc3() {			define half @select_cc_gt1() {
	%1 = fcmp nsz ogt half undef, 0xH0001			%1 = fcmp nsz ogt half undef, 0xH0001
	%2 = select i1 %1, half 0xHC000, half 0xH0002			%2 = select i1 %1, half 0xHC000, half 0xH0002
	ret half %2			ret half %2

	; CHECK-LABEL: select_cc3:			; CHECK-LABEL: select_cc_gt1:
	; CHECK-HARDFP-FULLFP16: vselgt.f16 s0, s{{.}}, s{{.}}
				; CHECK-HARDFP-FULLFP16: vcmpe.f16 s0, s0
				; CHECK-HARDFP-FULLFP16-NEXT: vmrs APSR_nzcv, fpscr
				; CHECK-HARDFP-FULLFP16-NEXT: vselgt.f16 s0, s{{.}}, s{{.}}

				; CHECK-SOFTFP-FP16-A32: vcmpe.f32 s0, s0
				; CHECK-SOFTFP-FP16-A32-NEXT: vmrs APSR_nzcv, fpscr
				; CHECK-SOFTFP-FP16-A32-NEXT: vmovgt.f32 s{{.}}, s{{.}}

				; CHECK-SOFTFP-FP16-T32: vcmpe.f32 s0, s0
				; CHECK-SOFTFP-FP16-T32-NEXT: vmrs APSR_nzcv, fpscr
				; CHECK-SOFTFP-FP16-T32-NEXT: it gt
				; CHECK-SOFTFP-FP16-T32-NEXT: vmovgt.f32 s{{.}}, s{{.}}
	}			}

	; 38. VSELVS			define half @select_cc_gt2() {
	define half @select_cc4() {			%1 = fcmp nsz uge half undef, 0xH0001
	%1 = fcmp nsz ueq half undef, 0xH0001
	%2 = select i1 %1, half 0xHC000, half 0xH0002			%2 = select i1 %1, half 0xHC000, half 0xH0002
	ret half %2			ret half %2

				; CHECK-LABEL: select_cc_gt2:

				; CHECK-HARDFP-FULLFP16: vcmpe.f16 s0, s0
				; CHECK-HARDFP-FULLFP16-NEXT: vmrs APSR_nzcv, fpscr
				; CHECK-HARDFP-FULLFP16-NEXT: vselgt.f16 s0, s{{.}}, s{{.}}

				; CHECK-SOFTFP-FP16-A32: vcmpe.f32 s0, s0
				; CHECK-SOFTFP-FP16-A32-NEXT: vmrs APSR_nzcv, fpscr
				; CHECK-SOFTFP-FP16-A32-NEXT: vmovpl.f32 s{{.}}, s{{.}}

				; CHECK-SOFTFP-FP16-T32: vcmpe.f32 s0, s0
				; CHECK-SOFTFP-FP16-T32-NEXT: vmrs APSR_nzcv, fpscr
				; CHECK-SOFTFP-FP16-T32-NEXT: it pl
				; CHECK-SOFTFP-FP16-T32-NEXT: vmovpl.f32 s{{.}}, s{{.}}
				}

				;
				; FIXME: add fcmp ule, olt here.
				;

				; 38. VSELVS
				define float @select_cc4(float %a.coerce) {
				entry:
				%0 = bitcast float %a.coerce to i32
				%tmp.0.extract.trunc = trunc i32 %0 to i16
				%1 = bitcast i16 %tmp.0.extract.trunc to half

				%2 = fcmp nsz ueq half %1, 0xH0001
				%3 = select i1 %2, half 0xHC000, half 0xH0002

				%4 = bitcast half %3 to i16
				%tmp4.0.insert.ext = zext i16 %4 to i32
				%5 = bitcast i32 %tmp4.0.insert.ext to float
				ret float %5

	; CHECK-LABEL: select_cc4:			; CHECK-LABEL: select_cc4:
	; CHECK-HARDFP-FULLFP16: vselvs.f16 s0, s{{.}}, s{{.}}
				; CHECK-HARDFP-FULLFP16: vldr.16 [[S2:s[0-9]]], .LCPI{{.*}}
				; CHECK-HARDFP-FULLFP16: vldr.16 [[S4:s[0-9]]], .LCPI{{.*}}
				; CHECK-HARDFP-FULLFP16: vmov.f16 [[S6:s[0-9]]], #-2.000000e+00
				; CHECK-HARDFP-FULLFP16: vcmp.f16 s0, [[S2]]
				; CHECK-HARDFP-FULLFP16-NEXT: vmrs APSR_nzcv, fpscr
				; CHECK-HARDFP-FULLFP16-NEXT: vseleq.f16 [[S0:s[0-9]]], [[S6]], [[S4]]
				; CHECK-HARDFP-FULLFP16-NEXT: vselvs.f16 s0, [[S6]], [[S0]]

				; CHECK-SOFTFP-FP16-A32: vmov [[S6:s[0-9]]], r0
				; CHECK-SOFTFP-FP16-A32: vldr s0, .LCP{{.*}}
				; CHECK-SOFTFP-FP16-A32: vcvtb.f32.f16 [[S6]], [[S6]]
				; CHECK-SOFTFP-FP16-A32: vmov.f32 [[S2:s[0-9]]], #-2.000000e+00
				; CHECK-SOFTFP-FP16-A32: vcmp.f32 [[S6]], s0
				; CHECK-SOFTFP-FP16-A32: vldr [[S4:s[0-9]]], .LCPI{{.*}}
				; CHECK-SOFTFP-FP16-A32: vmrs APSR_nzcv, fpscr
				; CHECK-SOFTFP-FP16-A32: vmoveq.f32 [[S4]], [[S2]]
				; CHECK-SOFTFP-FP16-A32-NEXT: vmovvs.f32 [[S4]], [[S2]]
				; CHECK-SOFTFP-FP16-A32-NEXT: vcvtb.f16.f32 s0, [[S4]]

				; CHECK-SOFTFP-FP16-T32: vmov [[S6:s[0-9]]], r0
				; CHECK-SOFTFP-FP16-T32: vldr s0, .LCP{{.*}}
				; CHECK-SOFTFP-FP16-T32: vcvtb.f32.f16 [[S6]], [[S6]]
				; CHECK-SOFTFP-FP16-T32: vmov.f32 [[S2:s[0-9]]], #-2.000000e+00
				; CHECK-SOFTFP-FP16-T32: vcmp.f32 [[S6]], s0
				; CHECK-SOFTFP-FP16-T32: vldr [[S4:s[0-9]]], .LCPI{{.*}}
				; CHECK-SOFTFP-FP16-T32: vmrs APSR_nzcv, fpscr
				; CHECK-SOFTFP-FP16-T32: it eq
				; CHECK-SOFTFP-FP16-T32: vmoveq.f32 [[S4]], [[S2]]
				; CHECK-SOFTFP-FP16-T32: it vs
				; CHECK-SOFTFP-FP16-T32-NEXT: vmovvs.f32 [[S4]], [[S2]]
				; CHECK-SOFTFP-FP16-T32-NEXT: vcvtb.f16.f32 s0, [[S4]]
	}			}

	; 39. VSQRT - TODO			; 39. VSQRT - TODO

	; 40. VSUB			; 40. VSUB
	define float @Sub(float %a.coerce, float %b.coerce) {			define float @Sub(float %a.coerce, float %b.coerce) {
	entry:			entry:
	%0 = bitcast float %a.coerce to i32			%0 = bitcast float %a.coerce to i32
	▲ Show 20 Lines • Show All 97 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[ARM] FP16 VSEL codegen follow up
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 141966

llvm/trunk/lib/Target/ARM/ARMISelLowering.cpp

llvm/trunk/test/CodeGen/ARM/fp16-instructions.ll

This is an archive of the discontinued LLVM Phabricator instance.

[ARM] FP16 VSEL codegen follow upClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 141966

llvm/trunk/lib/Target/ARM/ARMISelLowering.cpp

llvm/trunk/test/CodeGen/ARM/fp16-instructions.ll

[ARM] FP16 VSEL codegen follow up
ClosedPublic