This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Use softPromoteHalf legalization for fp16 without Zfh rather than PromoteFloat.
ClosedPublic

Authored by craig.topper on Mar 22 2021, 11:53 PM.

Download Raw Diff

Details

Reviewers

asb
luismarques
kito-cheng
HsiangKai
evandro
frasercrmck

Commits

rGdbbc95e3e5aa: [RISCV] Use softPromoteHalf legalization for fp16 without Zfh rather than…

Summary

The default legalization strategy is PromoteFloat which keeps
half in single precision format through multiple floating point
operations. Conversion to/from float is done at loads, stores,
bitcasts, and other places that care about the exact size being 16
bits.

This patches switches to the alternative method softPromoteHalf.
This aims to keep the type in 16-bit format between every operation.
So we promote to float and immediately round for any arithmetic
operation. This should be closer to the IR semantics since we
are rounding after each operation and not accumulating extra
precision across multiple operations. X86 is the only other
target that enables this today. See https://reviews.llvm.org/D73749

I had to update getRegisterTypeForCallingConv to force f16 to
use f32 when the F extension is enabled. This way we can still
pass it in the lower bits of an FPR for ilp32f and lp64f ABIs.
The softPromoteHalf would otherwise always give i16 as the
argument type.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

craig.topper created this revision.Mar 22 2021, 11:53 PM

Herald added subscribers: StephenFan, vkmr, frasercrmck and 23 others. · View Herald TranscriptMar 22 2021, 11:53 PM

craig.topper requested review of this revision.Mar 22 2021, 11:53 PM

Herald added a project: Restricted Project. · View Herald TranscriptMar 22 2021, 11:53 PM

Herald added a subscriber: MaskRay. · View Herald Transcript

Harbormaster completed remote builds in B95176: Diff 332543.Mar 22 2021, 11:54 PM

LGTM. Waiting for the consent of others.

Let's mention it in the community call today just in case anyone has strong differing opinions, but this lowering strategy makes much more intuitive sense to me.

This revision is now accepted and ready to land.Apr 1 2021, 3:46 AM

General code gen behavior change is look good to me.

Indeed. And it is also good to have a second in-tree target test this strategy.

This revision was landed with ongoing or failed builds.Apr 1 2021, 12:42 PM

Closed by commit rGdbbc95e3e5aa: [RISCV] Use softPromoteHalf legalization for fp16 without Zfh rather than… (authored by craig.topper). · Explain Why

This revision was automatically updated to reflect the committed changes.

craig.topper added a commit: rGdbbc95e3e5aa: [RISCV] Use softPromoteHalf legalization for fp16 without Zfh rather than….

asb mentioned this in D151284: [RISCV] Custom lower FP_TO_FP16 and FP16_TO_FP to correct ABI of of libcall.May 23 2023, 8:55 PM

asb mentioned this in rG5ba40c7be356: [RISCV] Custom lower FP_TO_FP16 and FP16_TO_FP to correct ABI of of libcall.Jun 30 2023, 8:42 AM

Revision Contents

Path

Size

llvm/

lib/

Target/

RISCV/

RISCVISelLowering.h

13 lines

RISCVISelLowering.cpp

22 lines

test/

CodeGen/

RISCV/

calling-conv-half.ll

8 lines

copysign-casts.ll

211 lines

fp16-promote.ll

24 lines

half-bitmanip-dagcombines.ll

42 lines

rv32i-rv64i-half.ll

30 lines

Diff 334799

llvm/lib/Target/RISCV/RISCVISelLowering.h

Show First 20 Lines • Show All 255 Lines • ▼ Show 20 Lines	public:
bool isTruncateFree(EVT SrcVT, EVT DstVT) const override;		bool isTruncateFree(EVT SrcVT, EVT DstVT) const override;
bool isZExtFree(SDValue Val, EVT VT2) const override;		bool isZExtFree(SDValue Val, EVT VT2) const override;
bool isSExtCheaperThanZExt(EVT SrcVT, EVT DstVT) const override;		bool isSExtCheaperThanZExt(EVT SrcVT, EVT DstVT) const override;
bool isCheapToSpeculateCttz() const override;		bool isCheapToSpeculateCttz() const override;
bool isCheapToSpeculateCtlz() const override;		bool isCheapToSpeculateCtlz() const override;
bool isFPImmLegal(const APFloat &Imm, EVT VT,		bool isFPImmLegal(const APFloat &Imm, EVT VT,
bool ForCodeSize) const override;		bool ForCodeSize) const override;

		bool softPromoteHalfType() const override { return true; }

		/// Return the register type for a given MVT, ensuring vectors are treated
		/// as a series of gpr sized integers.
		MVT getRegisterTypeForCallingConv(LLVMContext &Context, CallingConv::ID CC,
		EVT VT) const override;

		/// Return the number of registers for a given MVT, ensuring vectors are
		/// treated as a series of gpr sized integers.
		unsigned getNumRegistersForCallingConv(LLVMContext &Context,
		CallingConv::ID CC,
		EVT VT) const override;

/// Return true if the given shuffle mask can be codegen'd directly, or if it		/// Return true if the given shuffle mask can be codegen'd directly, or if it
/// should be stack expanded.		/// should be stack expanded.
bool isShuffleMaskLegal(ArrayRef<int> M, EVT VT) const override;		bool isShuffleMaskLegal(ArrayRef<int> M, EVT VT) const override;

bool hasBitPreservingFPLogic(EVT VT) const override;		bool hasBitPreservingFPLogic(EVT VT) const override;
bool		bool
shouldExpandBuildVectorWithShuffles(EVT VT,		shouldExpandBuildVectorWithShuffles(EVT VT,
unsigned DefinedValues) const override;		unsigned DefinedValues) const override;
▲ Show 20 Lines • Show All 267 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 852 Lines • ▼ Show 20 Lines
	}			}

	bool RISCVTargetLowering::hasBitPreservingFPLogic(EVT VT) const {			bool RISCVTargetLowering::hasBitPreservingFPLogic(EVT VT) const {
	return (VT == MVT::f16 && Subtarget.hasStdExtZfh()) \|\|			return (VT == MVT::f16 && Subtarget.hasStdExtZfh()) \|\|
	(VT == MVT::f32 && Subtarget.hasStdExtF()) \|\|			(VT == MVT::f32 && Subtarget.hasStdExtF()) \|\|
	(VT == MVT::f64 && Subtarget.hasStdExtD());			(VT == MVT::f64 && Subtarget.hasStdExtD());
	}			}

				MVT RISCVTargetLowering::getRegisterTypeForCallingConv(LLVMContext &Context,
				CallingConv::ID CC,
				EVT VT) const {
				// Use f32 to pass f16 if it is legal and Zfh is not enabled. We might still
				// end up using a GPR but that will be decided based on ABI.
				if (VT == MVT::f16 && Subtarget.hasStdExtF() && !Subtarget.hasStdExtZfh())
				return MVT::f32;

				return TargetLowering::getRegisterTypeForCallingConv(Context, CC, VT);
				}

				unsigned RISCVTargetLowering::getNumRegistersForCallingConv(LLVMContext &Context,
				CallingConv::ID CC,
				EVT VT) const {
				// Use f32 to pass f16 if it is legal and Zfh is not enabled. We might still
				// end up using a GPR but that will be decided based on ABI.
				if (VT == MVT::f16 && Subtarget.hasStdExtF() && !Subtarget.hasStdExtZfh())
				return 1;

				return TargetLowering::getNumRegistersForCallingConv(Context, CC, VT);
				}

	// Changes the condition code and swaps operands if necessary, so the SetCC			// Changes the condition code and swaps operands if necessary, so the SetCC
	// operation matches one of the comparisons supported directly by branches			// operation matches one of the comparisons supported directly by branches
	// in the RISC-V ISA. May adjust compares to favor compare with 0 over compare			// in the RISC-V ISA. May adjust compares to favor compare with 0 over compare
	// with 1/-1.			// with 1/-1.
	static void translateSetCCForBranch(const SDLoc &DL, SDValue &LHS, SDValue &RHS,			static void translateSetCCForBranch(const SDLoc &DL, SDValue &LHS, SDValue &RHS,
	ISD::CondCode &CC, SelectionDAG &DAG) {			ISD::CondCode &CC, SelectionDAG &DAG) {
	// Convert X > -1 to X >= 0.			// Convert X > -1 to X >= 0.
	if (CC == ISD::SETGT && isAllOnesConstant(RHS)) {			if (CC == ISD::SETGT && isAllOnesConstant(RHS)) {
	▲ Show 20 Lines • Show All 6,740 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/calling-conv-half.ll

	Show First 20 Lines • Show All 185 Lines • ▼ Show 20 Lines
	}			}

	define i32 @callee_half_on_stack(i32 %a, i32 %b, i32 %c, i32 %d, i32 %e, i32 %f, i32 %g, i32 %h, half %i) nounwind {			define i32 @callee_half_on_stack(i32 %a, i32 %b, i32 %c, i32 %d, i32 %e, i32 %f, i32 %g, i32 %h, half %i) nounwind {
	; RV32I-LABEL: callee_half_on_stack:			; RV32I-LABEL: callee_half_on_stack:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill
	; RV32I-NEXT: mv s0, a7
	; RV32I-NEXT: lhu a0, 16(sp)			; RV32I-NEXT: lhu a0, 16(sp)
				; RV32I-NEXT: mv s0, a7
	; RV32I-NEXT: call __gnu_h2f_ieee@plt			; RV32I-NEXT: call __gnu_h2f_ieee@plt
	; RV32I-NEXT: call __fixsfsi@plt			; RV32I-NEXT: call __fixsfsi@plt
	; RV32I-NEXT: add a0, s0, a0			; RV32I-NEXT: add a0, s0, a0
	; RV32I-NEXT: lw s0, 8(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw s0, 8(sp) # 4-byte Folded Reload
	; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 16			; RV32I-NEXT: addi sp, sp, 16
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: callee_half_on_stack:			; RV64I-LABEL: callee_half_on_stack:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -16			; RV64I-NEXT: addi sp, sp, -16
	; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill			; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill
	; RV64I-NEXT: sd s0, 0(sp) # 8-byte Folded Spill			; RV64I-NEXT: sd s0, 0(sp) # 8-byte Folded Spill
	; RV64I-NEXT: mv s0, a7
	; RV64I-NEXT: lhu a0, 16(sp)			; RV64I-NEXT: lhu a0, 16(sp)
				; RV64I-NEXT: mv s0, a7
	; RV64I-NEXT: call __gnu_h2f_ieee@plt			; RV64I-NEXT: call __gnu_h2f_ieee@plt
	; RV64I-NEXT: call __fixsfdi@plt			; RV64I-NEXT: call __fixsfdi@plt
	; RV64I-NEXT: addw a0, s0, a0			; RV64I-NEXT: addw a0, s0, a0
	; RV64I-NEXT: ld s0, 0(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 0(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV32IF-LABEL: callee_half_on_stack:			; RV32IF-LABEL: callee_half_on_stack:
	; RV32IF: # %bb.0:			; RV32IF: # %bb.0:
	; RV32IF-NEXT: addi sp, sp, -16			; RV32IF-NEXT: addi sp, sp, -16
	; RV32IF-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32IF-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32IF-NEXT: sw s0, 8(sp) # 4-byte Folded Spill			; RV32IF-NEXT: sw s0, 8(sp) # 4-byte Folded Spill
	; RV32IF-NEXT: mv s0, a7
	; RV32IF-NEXT: lhu a0, 16(sp)			; RV32IF-NEXT: lhu a0, 16(sp)
				; RV32IF-NEXT: mv s0, a7
	; RV32IF-NEXT: call __gnu_h2f_ieee@plt			; RV32IF-NEXT: call __gnu_h2f_ieee@plt
	; RV32IF-NEXT: fmv.w.x ft0, a0			; RV32IF-NEXT: fmv.w.x ft0, a0
	; RV32IF-NEXT: fcvt.w.s a0, ft0, rtz			; RV32IF-NEXT: fcvt.w.s a0, ft0, rtz
	; RV32IF-NEXT: add a0, s0, a0			; RV32IF-NEXT: add a0, s0, a0
	; RV32IF-NEXT: lw s0, 8(sp) # 4-byte Folded Reload			; RV32IF-NEXT: lw s0, 8(sp) # 4-byte Folded Reload
	; RV32IF-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32IF-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32IF-NEXT: addi sp, sp, 16			; RV32IF-NEXT: addi sp, sp, 16
	; RV32IF-NEXT: ret			; RV32IF-NEXT: ret
	;			;
	; RV64IF-LABEL: callee_half_on_stack:			; RV64IF-LABEL: callee_half_on_stack:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: addi sp, sp, -16			; RV64IF-NEXT: addi sp, sp, -16
	; RV64IF-NEXT: sd ra, 8(sp) # 8-byte Folded Spill			; RV64IF-NEXT: sd ra, 8(sp) # 8-byte Folded Spill
	; RV64IF-NEXT: sd s0, 0(sp) # 8-byte Folded Spill			; RV64IF-NEXT: sd s0, 0(sp) # 8-byte Folded Spill
	; RV64IF-NEXT: mv s0, a7
	; RV64IF-NEXT: lhu a0, 16(sp)			; RV64IF-NEXT: lhu a0, 16(sp)
				; RV64IF-NEXT: mv s0, a7
	; RV64IF-NEXT: call __gnu_h2f_ieee@plt			; RV64IF-NEXT: call __gnu_h2f_ieee@plt
	; RV64IF-NEXT: fmv.w.x ft0, a0			; RV64IF-NEXT: fmv.w.x ft0, a0
	; RV64IF-NEXT: fcvt.l.s a0, ft0, rtz			; RV64IF-NEXT: fcvt.l.s a0, ft0, rtz
	; RV64IF-NEXT: addw a0, s0, a0			; RV64IF-NEXT: addw a0, s0, a0
	; RV64IF-NEXT: ld s0, 0(sp) # 8-byte Folded Reload			; RV64IF-NEXT: ld s0, 0(sp) # 8-byte Folded Reload
	; RV64IF-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64IF-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64IF-NEXT: addi sp, sp, 16			; RV64IF-NEXT: addi sp, sp, 16
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	▲ Show 20 Lines • Show All 279 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/copysign-casts.ll

Show First 20 Lines • Show All 334 Lines • ▼ Show 20 Lines	; RV64IFDZFH-NEXT: ret
%c = fptrunc double %b to float		%c = fptrunc double %b to float
%t = call float @llvm.copysign.f32(float %a, float %c)		%t = call float @llvm.copysign.f32(float %a, float %c)
ret float %t		ret float %t
}		}

define half @fold_demote_h_s(half %a, float %b) nounwind {		define half @fold_demote_h_s(half %a, float %b) nounwind {
; RV32I-LABEL: fold_demote_h_s:		; RV32I-LABEL: fold_demote_h_s:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: lui a2, 8
; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill		; RV32I-NEXT: addi a2, a2, -1
; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill		; RV32I-NEXT: and a0, a0, a2
; RV32I-NEXT: mv s0, a1		; RV32I-NEXT: lui a2, 524288
; RV32I-NEXT: lui a1, 16		; RV32I-NEXT: and a1, a1, a2
; RV32I-NEXT: addi a1, a1, -1		; RV32I-NEXT: srli a1, a1, 16
; RV32I-NEXT: and a0, a0, a1		; RV32I-NEXT: or a0, a0, a1
; RV32I-NEXT: call __gnu_h2f_ieee@plt
; RV32I-NEXT: lui a1, 524288
; RV32I-NEXT: and a2, s0, a1
; RV32I-NEXT: addi a1, a1, -1
; RV32I-NEXT: and a0, a0, a1
; RV32I-NEXT: or a0, a0, a2
; RV32I-NEXT: call __gnu_f2h_ieee@plt
; RV32I-NEXT: lw s0, 8(sp) # 4-byte Folded Reload
; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
; RV32I-NEXT: addi sp, sp, 16
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV64I-LABEL: fold_demote_h_s:		; RV64I-LABEL: fold_demote_h_s:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: lui a2, 8
; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill		; RV64I-NEXT: addiw a2, a2, -1
; RV64I-NEXT: sd s0, 0(sp) # 8-byte Folded Spill		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: mv s0, a1		; RV64I-NEXT: addi a2, zero, 1
; RV64I-NEXT: lui a1, 16		; RV64I-NEXT: slli a2, a2, 31
; RV64I-NEXT: addiw a1, a1, -1		; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: and a0, a0, a1		; RV64I-NEXT: srli a1, a1, 16
; RV64I-NEXT: call __gnu_h2f_ieee@plt		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: lui a1, 524288
; RV64I-NEXT: and a2, s0, a1
; RV64I-NEXT: addiw a1, a1, -1
; RV64I-NEXT: and a0, a0, a1
; RV64I-NEXT: or a0, a0, a2
; RV64I-NEXT: call __gnu_f2h_ieee@plt
; RV64I-NEXT: ld s0, 0(sp) # 8-byte Folded Reload
; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV32IF-LABEL: fold_demote_h_s:		; RV32IF-LABEL: fold_demote_h_s:
; RV32IF: # %bb.0:		; RV32IF: # %bb.0:
; RV32IF-NEXT: addi sp, sp, -16		; RV32IF-NEXT: fmv.x.w a0, fa1
; RV32IF-NEXT: sw ra, 12(sp) # 4-byte Folded Spill		; RV32IF-NEXT: fmv.x.w a1, fa0
; RV32IF-NEXT: fsw fs0, 8(sp) # 4-byte Folded Spill		; RV32IF-NEXT: lui a2, 8
; RV32IF-NEXT: fmv.s fs0, fa1		; RV32IF-NEXT: addi a2, a2, -1
; RV32IF-NEXT: fmv.x.w a0, fa0		; RV32IF-NEXT: and a1, a1, a2
; RV32IF-NEXT: call __gnu_h2f_ieee@plt		; RV32IF-NEXT: lui a2, 524288
; RV32IF-NEXT: fsgnj.s fa0, fa0, fs0		; RV32IF-NEXT: and a0, a0, a2
; RV32IF-NEXT: call __gnu_f2h_ieee@plt		; RV32IF-NEXT: srli a0, a0, 16
		; RV32IF-NEXT: or a0, a1, a0
; RV32IF-NEXT: lui a1, 1048560		; RV32IF-NEXT: lui a1, 1048560
; RV32IF-NEXT: or a0, a0, a1		; RV32IF-NEXT: or a0, a0, a1
; RV32IF-NEXT: fmv.w.x fa0, a0		; RV32IF-NEXT: fmv.w.x fa0, a0
; RV32IF-NEXT: flw fs0, 8(sp) # 4-byte Folded Reload
; RV32IF-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
; RV32IF-NEXT: addi sp, sp, 16
; RV32IF-NEXT: ret		; RV32IF-NEXT: ret
;		;
; RV32IFD-LABEL: fold_demote_h_s:		; RV32IFD-LABEL: fold_demote_h_s:
; RV32IFD: # %bb.0:		; RV32IFD: # %bb.0:
; RV32IFD-NEXT: addi sp, sp, -16		; RV32IFD-NEXT: fmv.x.w a0, fa1
; RV32IFD-NEXT: sw ra, 12(sp) # 4-byte Folded Spill		; RV32IFD-NEXT: fmv.x.w a1, fa0
; RV32IFD-NEXT: fsd fs0, 0(sp) # 8-byte Folded Spill		; RV32IFD-NEXT: lui a2, 8
; RV32IFD-NEXT: fmv.s fs0, fa1		; RV32IFD-NEXT: addi a2, a2, -1
; RV32IFD-NEXT: fmv.x.w a0, fa0		; RV32IFD-NEXT: and a1, a1, a2
; RV32IFD-NEXT: call __gnu_h2f_ieee@plt		; RV32IFD-NEXT: lui a2, 524288
; RV32IFD-NEXT: fsgnj.s fa0, fa0, fs0		; RV32IFD-NEXT: and a0, a0, a2
; RV32IFD-NEXT: call __gnu_f2h_ieee@plt		; RV32IFD-NEXT: srli a0, a0, 16
		; RV32IFD-NEXT: or a0, a1, a0
; RV32IFD-NEXT: lui a1, 1048560		; RV32IFD-NEXT: lui a1, 1048560
; RV32IFD-NEXT: or a0, a0, a1		; RV32IFD-NEXT: or a0, a0, a1
; RV32IFD-NEXT: fmv.w.x fa0, a0		; RV32IFD-NEXT: fmv.w.x fa0, a0
; RV32IFD-NEXT: fld fs0, 0(sp) # 8-byte Folded Reload
; RV32IFD-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
; RV32IFD-NEXT: addi sp, sp, 16
; RV32IFD-NEXT: ret		; RV32IFD-NEXT: ret
;		;
; RV64IFD-LABEL: fold_demote_h_s:		; RV64IFD-LABEL: fold_demote_h_s:
; RV64IFD: # %bb.0:		; RV64IFD: # %bb.0:
; RV64IFD-NEXT: addi sp, sp, -16		; RV64IFD-NEXT: fmv.x.w a0, fa1
; RV64IFD-NEXT: sd ra, 8(sp) # 8-byte Folded Spill		; RV64IFD-NEXT: fmv.x.w a1, fa0
; RV64IFD-NEXT: fsd fs0, 0(sp) # 8-byte Folded Spill		; RV64IFD-NEXT: lui a2, 8
; RV64IFD-NEXT: fmv.s fs0, fa1		; RV64IFD-NEXT: addiw a2, a2, -1
; RV64IFD-NEXT: fmv.x.w a0, fa0		; RV64IFD-NEXT: and a1, a1, a2
; RV64IFD-NEXT: call __gnu_h2f_ieee@plt		; RV64IFD-NEXT: lui a2, 524288
; RV64IFD-NEXT: fsgnj.s fa0, fa0, fs0		; RV64IFD-NEXT: and a0, a0, a2
; RV64IFD-NEXT: call __gnu_f2h_ieee@plt		; RV64IFD-NEXT: srli a0, a0, 16
		; RV64IFD-NEXT: or a0, a1, a0
; RV64IFD-NEXT: lui a1, 1048560		; RV64IFD-NEXT: lui a1, 1048560
; RV64IFD-NEXT: or a0, a0, a1		; RV64IFD-NEXT: or a0, a0, a1
; RV64IFD-NEXT: fmv.w.x fa0, a0		; RV64IFD-NEXT: fmv.w.x fa0, a0
; RV64IFD-NEXT: fld fs0, 0(sp) # 8-byte Folded Reload
; RV64IFD-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
; RV64IFD-NEXT: addi sp, sp, 16
; RV64IFD-NEXT: ret		; RV64IFD-NEXT: ret
;		;
; RV32IFZFH-LABEL: fold_demote_h_s:		; RV32IFZFH-LABEL: fold_demote_h_s:
; RV32IFZFH: # %bb.0:		; RV32IFZFH: # %bb.0:
; RV32IFZFH-NEXT: fcvt.h.s ft0, fa1		; RV32IFZFH-NEXT: fcvt.h.s ft0, fa1
; RV32IFZFH-NEXT: fsgnj.h fa0, fa0, ft0		; RV32IFZFH-NEXT: fsgnj.h fa0, fa0, ft0
; RV32IFZFH-NEXT: ret		; RV32IFZFH-NEXT: ret
;		;
Show All 11 Lines	; RV64IFDZFH-NEXT: ret
%c = fptrunc float %b to half		%c = fptrunc float %b to half
%t = call half @llvm.copysign.f16(half %a, half %c)		%t = call half @llvm.copysign.f16(half %a, half %c)
ret half %t		ret half %t
}		}

define half @fold_demote_h_d(half %a, double %b) nounwind {		define half @fold_demote_h_d(half %a, double %b) nounwind {
; RV32I-LABEL: fold_demote_h_d:		; RV32I-LABEL: fold_demote_h_d:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: lui a1, 8
; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill
; RV32I-NEXT: mv s0, a2
; RV32I-NEXT: lui a1, 16
; RV32I-NEXT: addi a1, a1, -1		; RV32I-NEXT: addi a1, a1, -1
; RV32I-NEXT: and a0, a0, a1		; RV32I-NEXT: and a0, a0, a1
; RV32I-NEXT: call __gnu_h2f_ieee@plt
; RV32I-NEXT: lui a1, 524288		; RV32I-NEXT: lui a1, 524288
; RV32I-NEXT: and a2, s0, a1		; RV32I-NEXT: and a1, a2, a1
; RV32I-NEXT: addi a1, a1, -1		; RV32I-NEXT: srli a1, a1, 16
; RV32I-NEXT: and a0, a0, a1		; RV32I-NEXT: or a0, a0, a1
; RV32I-NEXT: or a0, a0, a2
; RV32I-NEXT: call __gnu_f2h_ieee@plt
; RV32I-NEXT: lw s0, 8(sp) # 4-byte Folded Reload
; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
; RV32I-NEXT: addi sp, sp, 16
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV64I-LABEL: fold_demote_h_d:		; RV64I-LABEL: fold_demote_h_d:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: lui a2, 8
; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill		; RV64I-NEXT: addiw a2, a2, -1
; RV64I-NEXT: sd s0, 0(sp) # 8-byte Folded Spill		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: mv s0, a1		; RV64I-NEXT: addi a2, zero, -1
; RV64I-NEXT: lui a1, 16		; RV64I-NEXT: slli a2, a2, 63
; RV64I-NEXT: addiw a1, a1, -1		; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: and a0, a0, a1		; RV64I-NEXT: srli a1, a1, 48
; RV64I-NEXT: call __gnu_h2f_ieee@plt
; RV64I-NEXT: lui a1, 524288
; RV64I-NEXT: addiw a1, a1, -1
; RV64I-NEXT: and a0, a0, a1
; RV64I-NEXT: addi a1, zero, -1
; RV64I-NEXT: slli a1, a1, 63
; RV64I-NEXT: and a1, s0, a1
; RV64I-NEXT: srli a1, a1, 32
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: call __gnu_f2h_ieee@plt
; RV64I-NEXT: ld s0, 0(sp) # 8-byte Folded Reload
; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV32IF-LABEL: fold_demote_h_d:		; RV32IF-LABEL: fold_demote_h_d:
; RV32IF: # %bb.0:		; RV32IF: # %bb.0:
; RV32IF-NEXT: addi sp, sp, -16
; RV32IF-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
; RV32IF-NEXT: sw s0, 8(sp) # 4-byte Folded Spill
; RV32IF-NEXT: mv s0, a1
; RV32IF-NEXT: fmv.x.w a0, fa0		; RV32IF-NEXT: fmv.x.w a0, fa0
; RV32IF-NEXT: call __gnu_h2f_ieee@plt		; RV32IF-NEXT: lui a2, 8
; RV32IF-NEXT: fmv.w.x ft0, s0		; RV32IF-NEXT: addi a2, a2, -1
; RV32IF-NEXT: fsgnj.s fa0, fa0, ft0		; RV32IF-NEXT: and a0, a0, a2
; RV32IF-NEXT: call __gnu_f2h_ieee@plt		; RV32IF-NEXT: lui a2, 524288
		; RV32IF-NEXT: and a1, a1, a2
		; RV32IF-NEXT: srli a1, a1, 16
		; RV32IF-NEXT: or a0, a0, a1
; RV32IF-NEXT: lui a1, 1048560		; RV32IF-NEXT: lui a1, 1048560
; RV32IF-NEXT: or a0, a0, a1		; RV32IF-NEXT: or a0, a0, a1
; RV32IF-NEXT: fmv.w.x fa0, a0		; RV32IF-NEXT: fmv.w.x fa0, a0
; RV32IF-NEXT: lw s0, 8(sp) # 4-byte Folded Reload
; RV32IF-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
; RV32IF-NEXT: addi sp, sp, 16
; RV32IF-NEXT: ret		; RV32IF-NEXT: ret
;		;
; RV32IFD-LABEL: fold_demote_h_d:		; RV32IFD-LABEL: fold_demote_h_d:
; RV32IFD: # %bb.0:		; RV32IFD: # %bb.0:
; RV32IFD-NEXT: addi sp, sp, -16		; RV32IFD-NEXT: addi sp, sp, -16
; RV32IFD-NEXT: sw ra, 12(sp) # 4-byte Folded Spill		; RV32IFD-NEXT: fsd fa1, 8(sp)
; RV32IFD-NEXT: fsd fs0, 0(sp) # 8-byte Folded Spill
; RV32IFD-NEXT: fmv.d fs0, fa1
; RV32IFD-NEXT: fmv.x.w a0, fa0		; RV32IFD-NEXT: fmv.x.w a0, fa0
; RV32IFD-NEXT: call __gnu_h2f_ieee@plt		; RV32IFD-NEXT: lw a1, 12(sp)
; RV32IFD-NEXT: fcvt.s.d ft0, fs0		; RV32IFD-NEXT: lui a2, 8
; RV32IFD-NEXT: fsgnj.s fa0, fa0, ft0		; RV32IFD-NEXT: addi a2, a2, -1
; RV32IFD-NEXT: call __gnu_f2h_ieee@plt		; RV32IFD-NEXT: and a0, a0, a2
		; RV32IFD-NEXT: lui a2, 524288
		; RV32IFD-NEXT: and a1, a1, a2
		; RV32IFD-NEXT: srli a1, a1, 16
		; RV32IFD-NEXT: or a0, a0, a1
; RV32IFD-NEXT: lui a1, 1048560		; RV32IFD-NEXT: lui a1, 1048560
; RV32IFD-NEXT: or a0, a0, a1		; RV32IFD-NEXT: or a0, a0, a1
; RV32IFD-NEXT: fmv.w.x fa0, a0		; RV32IFD-NEXT: fmv.w.x fa0, a0
; RV32IFD-NEXT: fld fs0, 0(sp) # 8-byte Folded Reload
; RV32IFD-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
; RV32IFD-NEXT: addi sp, sp, 16		; RV32IFD-NEXT: addi sp, sp, 16
; RV32IFD-NEXT: ret		; RV32IFD-NEXT: ret
;		;
; RV64IFD-LABEL: fold_demote_h_d:		; RV64IFD-LABEL: fold_demote_h_d:
; RV64IFD: # %bb.0:		; RV64IFD: # %bb.0:
; RV64IFD-NEXT: addi sp, sp, -16		; RV64IFD-NEXT: fmv.x.d a0, fa1
; RV64IFD-NEXT: sd ra, 8(sp) # 8-byte Folded Spill		; RV64IFD-NEXT: fmv.x.w a1, fa0
; RV64IFD-NEXT: fsd fs0, 0(sp) # 8-byte Folded Spill		; RV64IFD-NEXT: lui a2, 8
; RV64IFD-NEXT: fmv.d fs0, fa1		; RV64IFD-NEXT: addiw a2, a2, -1
; RV64IFD-NEXT: fmv.x.w a0, fa0		; RV64IFD-NEXT: and a1, a1, a2
; RV64IFD-NEXT: call __gnu_h2f_ieee@plt		; RV64IFD-NEXT: addi a2, zero, -1
; RV64IFD-NEXT: fcvt.s.d ft0, fs0		; RV64IFD-NEXT: slli a2, a2, 63
; RV64IFD-NEXT: fsgnj.s fa0, fa0, ft0		; RV64IFD-NEXT: and a0, a0, a2
; RV64IFD-NEXT: call __gnu_f2h_ieee@plt		; RV64IFD-NEXT: srli a0, a0, 48
		; RV64IFD-NEXT: or a0, a1, a0
; RV64IFD-NEXT: lui a1, 1048560		; RV64IFD-NEXT: lui a1, 1048560
; RV64IFD-NEXT: or a0, a0, a1		; RV64IFD-NEXT: or a0, a0, a1
; RV64IFD-NEXT: fmv.w.x fa0, a0		; RV64IFD-NEXT: fmv.w.x fa0, a0
; RV64IFD-NEXT: fld fs0, 0(sp) # 8-byte Folded Reload
; RV64IFD-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
; RV64IFD-NEXT: addi sp, sp, 16
; RV64IFD-NEXT: ret		; RV64IFD-NEXT: ret
;		;
; RV32IFZFH-LABEL: fold_demote_h_d:		; RV32IFZFH-LABEL: fold_demote_h_d:
; RV32IFZFH: # %bb.0:		; RV32IFZFH: # %bb.0:
; RV32IFZFH-NEXT: srli a0, a1, 16		; RV32IFZFH-NEXT: srli a0, a1, 16
; RV32IFZFH-NEXT: fmv.h.x ft0, a0		; RV32IFZFH-NEXT: fmv.h.x ft0, a0
; RV32IFZFH-NEXT: fsgnj.h fa0, fa0, ft0		; RV32IFZFH-NEXT: fsgnj.h fa0, fa0, ft0
; RV32IFZFH-NEXT: ret		; RV32IFZFH-NEXT: ret
Show All 16 Lines

llvm/test/CodeGen/RISCV/fp16-promote.ll

	Show First 20 Lines • Show All 81 Lines • ▼ Show 20 Lines
	define void @test_fadd(half* %p, half* %q) nounwind {			define void @test_fadd(half* %p, half* %q) nounwind {
	; CHECK-LABEL: test_fadd:			; CHECK-LABEL: test_fadd:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: addi sp, sp, -32			; CHECK-NEXT: addi sp, sp, -32
	; CHECK-NEXT: sw ra, 28(sp) # 4-byte Folded Spill			; CHECK-NEXT: sw ra, 28(sp) # 4-byte Folded Spill
	; CHECK-NEXT: sw s0, 24(sp) # 4-byte Folded Spill			; CHECK-NEXT: sw s0, 24(sp) # 4-byte Folded Spill
	; CHECK-NEXT: sw s1, 20(sp) # 4-byte Folded Spill			; CHECK-NEXT: sw s1, 20(sp) # 4-byte Folded Spill
	; CHECK-NEXT: fsd fs0, 8(sp) # 8-byte Folded Spill			; CHECK-NEXT: fsd fs0, 8(sp) # 8-byte Folded Spill
	; CHECK-NEXT: mv s0, a1			; CHECK-NEXT: mv s0, a0
	; CHECK-NEXT: mv s1, a0			; CHECK-NEXT: lhu s1, 0(a0)
	; CHECK-NEXT: lhu a0, 0(a0)			; CHECK-NEXT: lhu a0, 0(a1)
	; CHECK-NEXT: call __gnu_h2f_ieee@plt			; CHECK-NEXT: call __gnu_h2f_ieee@plt
	; CHECK-NEXT: fmv.s fs0, fa0			; CHECK-NEXT: fmv.s fs0, fa0
	; CHECK-NEXT: lhu a0, 0(s0)			; CHECK-NEXT: mv a0, s1
	; CHECK-NEXT: call __gnu_h2f_ieee@plt			; CHECK-NEXT: call __gnu_h2f_ieee@plt
	; CHECK-NEXT: fadd.s fa0, fs0, fa0			; CHECK-NEXT: fadd.s fa0, fa0, fs0
	; CHECK-NEXT: call __gnu_f2h_ieee@plt			; CHECK-NEXT: call __gnu_f2h_ieee@plt
	; CHECK-NEXT: sh a0, 0(s1)			; CHECK-NEXT: sh a0, 0(s0)
	; CHECK-NEXT: fld fs0, 8(sp) # 8-byte Folded Reload			; CHECK-NEXT: fld fs0, 8(sp) # 8-byte Folded Reload
	; CHECK-NEXT: lw s1, 20(sp) # 4-byte Folded Reload			; CHECK-NEXT: lw s1, 20(sp) # 4-byte Folded Reload
	; CHECK-NEXT: lw s0, 24(sp) # 4-byte Folded Reload			; CHECK-NEXT: lw s0, 24(sp) # 4-byte Folded Reload
	; CHECK-NEXT: lw ra, 28(sp) # 4-byte Folded Reload			; CHECK-NEXT: lw ra, 28(sp) # 4-byte Folded Reload
	; CHECK-NEXT: addi sp, sp, 32			; CHECK-NEXT: addi sp, sp, 32
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load half, half* %p			%a = load half, half* %p
	%b = load half, half* %q			%b = load half, half* %q
	%r = fadd half %a, %b			%r = fadd half %a, %b
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	define void @test_fmul(half* %p, half* %q) nounwind {			define void @test_fmul(half* %p, half* %q) nounwind {
	; CHECK-LABEL: test_fmul:			; CHECK-LABEL: test_fmul:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: addi sp, sp, -32			; CHECK-NEXT: addi sp, sp, -32
	; CHECK-NEXT: sw ra, 28(sp) # 4-byte Folded Spill			; CHECK-NEXT: sw ra, 28(sp) # 4-byte Folded Spill
	; CHECK-NEXT: sw s0, 24(sp) # 4-byte Folded Spill			; CHECK-NEXT: sw s0, 24(sp) # 4-byte Folded Spill
	; CHECK-NEXT: sw s1, 20(sp) # 4-byte Folded Spill			; CHECK-NEXT: sw s1, 20(sp) # 4-byte Folded Spill
	; CHECK-NEXT: fsd fs0, 8(sp) # 8-byte Folded Spill			; CHECK-NEXT: fsd fs0, 8(sp) # 8-byte Folded Spill
	; CHECK-NEXT: mv s0, a1			; CHECK-NEXT: mv s0, a0
	; CHECK-NEXT: mv s1, a0			; CHECK-NEXT: lhu s1, 0(a0)
	; CHECK-NEXT: lhu a0, 0(a0)			; CHECK-NEXT: lhu a0, 0(a1)
	; CHECK-NEXT: call __gnu_h2f_ieee@plt			; CHECK-NEXT: call __gnu_h2f_ieee@plt
	; CHECK-NEXT: fmv.s fs0, fa0			; CHECK-NEXT: fmv.s fs0, fa0
	; CHECK-NEXT: lhu a0, 0(s0)			; CHECK-NEXT: mv a0, s1
	; CHECK-NEXT: call __gnu_h2f_ieee@plt			; CHECK-NEXT: call __gnu_h2f_ieee@plt
	; CHECK-NEXT: fmul.s fa0, fs0, fa0			; CHECK-NEXT: fmul.s fa0, fa0, fs0
	; CHECK-NEXT: call __gnu_f2h_ieee@plt			; CHECK-NEXT: call __gnu_f2h_ieee@plt
	; CHECK-NEXT: sh a0, 0(s1)			; CHECK-NEXT: sh a0, 0(s0)
	; CHECK-NEXT: fld fs0, 8(sp) # 8-byte Folded Reload			; CHECK-NEXT: fld fs0, 8(sp) # 8-byte Folded Reload
	; CHECK-NEXT: lw s1, 20(sp) # 4-byte Folded Reload			; CHECK-NEXT: lw s1, 20(sp) # 4-byte Folded Reload
	; CHECK-NEXT: lw s0, 24(sp) # 4-byte Folded Reload			; CHECK-NEXT: lw s0, 24(sp) # 4-byte Folded Reload
	; CHECK-NEXT: lw ra, 28(sp) # 4-byte Folded Reload			; CHECK-NEXT: lw ra, 28(sp) # 4-byte Folded Reload
	; CHECK-NEXT: addi sp, sp, 32			; CHECK-NEXT: addi sp, sp, 32
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load half, half* %p			%a = load half, half* %p
	%b = load half, half* %q			%b = load half, half* %q
	%r = fmul half %a, %b			%r = fmul half %a, %b
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

llvm/test/CodeGen/RISCV/half-bitmanip-dagcombines.ll

	Show First 20 Lines • Show All 75 Lines • ▼ Show 20 Lines

	; DAGTypeLegalizer::SoftenFloatRes_FCOPYSIGN will convert to bitwise			; DAGTypeLegalizer::SoftenFloatRes_FCOPYSIGN will convert to bitwise
	; operations if half precision floating point isn't supported. A combine could			; operations if half precision floating point isn't supported. A combine could
	; be written to do the same even when f16 is legal.			; be written to do the same even when f16 is legal.

	define half @fcopysign_fneg(half %a, half %b) nounwind {			define half @fcopysign_fneg(half %a, half %b) nounwind {
	; RV32I-LABEL: fcopysign_fneg:			; RV32I-LABEL: fcopysign_fneg:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: not a1, a1
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: lui a2, 1048568
	; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill			; RV32I-NEXT: and a1, a1, a2
	; RV32I-NEXT: mv s0, a1			; RV32I-NEXT: lui a2, 8
	; RV32I-NEXT: lui a1, 16
	; RV32I-NEXT: addi a1, a1, -1
	; RV32I-NEXT: and a0, a0, a1
	; RV32I-NEXT: call __gnu_h2f_ieee@plt
	; RV32I-NEXT: not a1, s0
	; RV32I-NEXT: lui a2, 524288
	; RV32I-NEXT: addi a2, a2, -1			; RV32I-NEXT: addi a2, a2, -1
	; RV32I-NEXT: and a0, a0, a2			; RV32I-NEXT: and a0, a0, a2
	; RV32I-NEXT: lui a2, 8
	; RV32I-NEXT: and a1, a1, a2
	; RV32I-NEXT: slli a1, a1, 16
	; RV32I-NEXT: or a0, a0, a1			; RV32I-NEXT: or a0, a0, a1
	; RV32I-NEXT: call __gnu_f2h_ieee@plt
	; RV32I-NEXT: lw s0, 8(sp) # 4-byte Folded Reload
	; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 16
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32IZFH-LABEL: fcopysign_fneg:			; RV32IZFH-LABEL: fcopysign_fneg:
	; RV32IZFH: # %bb.0:			; RV32IZFH: # %bb.0:
	; RV32IZFH-NEXT: fsgnjn.h fa0, fa0, fa1			; RV32IZFH-NEXT: fsgnjn.h fa0, fa0, fa1
	; RV32IZFH-NEXT: ret			; RV32IZFH-NEXT: ret
	;			;
	; RV64I-LABEL: fcopysign_fneg:			; RV64I-LABEL: fcopysign_fneg:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -16			; RV64I-NEXT: not a1, a1
	; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill
	; RV64I-NEXT: sd s0, 0(sp) # 8-byte Folded Spill
	; RV64I-NEXT: mv s0, a1
	; RV64I-NEXT: lui a1, 16
	; RV64I-NEXT: addiw a1, a1, -1
	; RV64I-NEXT: and a0, a0, a1
	; RV64I-NEXT: call __gnu_h2f_ieee@plt
	; RV64I-NEXT: not a1, s0
	; RV64I-NEXT: lui a2, 524288
	; RV64I-NEXT: addiw a2, a2, -1
	; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: lui a2, 1048568			; RV64I-NEXT: lui a2, 1048568
	; RV64I-NEXT: and a1, a1, a2			; RV64I-NEXT: and a1, a1, a2
	; RV64I-NEXT: slli a1, a1, 16			; RV64I-NEXT: lui a2, 8
				; RV64I-NEXT: addiw a2, a2, -1
				; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: or a0, a0, a1			; RV64I-NEXT: or a0, a0, a1
	; RV64I-NEXT: call __gnu_f2h_ieee@plt
	; RV64I-NEXT: ld s0, 0(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IZFH-LABEL: fcopysign_fneg:			; RV64IZFH-LABEL: fcopysign_fneg:
	; RV64IZFH: # %bb.0:			; RV64IZFH: # %bb.0:
	; RV64IZFH-NEXT: fsgnjn.h fa0, fa0, fa1			; RV64IZFH-NEXT: fsgnjn.h fa0, fa0, fa1
	; RV64IZFH-NEXT: ret			; RV64IZFH-NEXT: ret
	%1 = fneg half %b			%1 = fneg half %b
	%2 = call half @llvm.copysign.f16(half %a, half %1)			%2 = call half @llvm.copysign.f16(half %a, half %1)
	ret half %2			ret half %2
	}			}

llvm/test/CodeGen/RISCV/rv32i-rv64i-half.ll

	Show All 11 Lines
	define half @half_test(half %a, half %b) nounwind {			define half @half_test(half %a, half %b) nounwind {
	; RV32I-LABEL: half_test:			; RV32I-LABEL: half_test:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s2, 0(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s2, 0(sp) # 4-byte Folded Spill
	; RV32I-NEXT: mv s2, a1			; RV32I-NEXT: mv s0, a1
	; RV32I-NEXT: lui a1, 16			; RV32I-NEXT: lui a1, 16
	; RV32I-NEXT: addi s0, a1, -1			; RV32I-NEXT: addi s1, a1, -1
	; RV32I-NEXT: and a0, a0, s0			; RV32I-NEXT: and a0, a0, s1
	; RV32I-NEXT: call __gnu_h2f_ieee@plt			; RV32I-NEXT: call __gnu_h2f_ieee@plt
	; RV32I-NEXT: mv s1, a0			; RV32I-NEXT: mv s2, a0
	; RV32I-NEXT: and a0, s2, s0			; RV32I-NEXT: and a0, s0, s1
	; RV32I-NEXT: call __gnu_h2f_ieee@plt			; RV32I-NEXT: call __gnu_h2f_ieee@plt
	; RV32I-NEXT: mv s0, a0			; RV32I-NEXT: mv s0, a0
	; RV32I-NEXT: mv a0, s1			; RV32I-NEXT: mv a0, s2
	; RV32I-NEXT: mv a1, s0			; RV32I-NEXT: mv a1, s0
	; RV32I-NEXT: call __addsf3@plt			; RV32I-NEXT: call __addsf3@plt
				; RV32I-NEXT: call __gnu_f2h_ieee@plt
				; RV32I-NEXT: and a0, a0, s1
				; RV32I-NEXT: call __gnu_h2f_ieee@plt
	; RV32I-NEXT: mv a1, s0			; RV32I-NEXT: mv a1, s0
	; RV32I-NEXT: call __divsf3@plt			; RV32I-NEXT: call __divsf3@plt
	; RV32I-NEXT: call __gnu_f2h_ieee@plt			; RV32I-NEXT: call __gnu_f2h_ieee@plt
	; RV32I-NEXT: lw s2, 0(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw s2, 0(sp) # 4-byte Folded Reload
	; RV32I-NEXT: lw s1, 4(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw s1, 4(sp) # 4-byte Folded Reload
	; RV32I-NEXT: lw s0, 8(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw s0, 8(sp) # 4-byte Folded Reload
	; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 16			; RV32I-NEXT: addi sp, sp, 16
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: half_test:			; RV64I-LABEL: half_test:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -32			; RV64I-NEXT: addi sp, sp, -32
	; RV64I-NEXT: sd ra, 24(sp) # 8-byte Folded Spill			; RV64I-NEXT: sd ra, 24(sp) # 8-byte Folded Spill
	; RV64I-NEXT: sd s0, 16(sp) # 8-byte Folded Spill			; RV64I-NEXT: sd s0, 16(sp) # 8-byte Folded Spill
	; RV64I-NEXT: sd s1, 8(sp) # 8-byte Folded Spill			; RV64I-NEXT: sd s1, 8(sp) # 8-byte Folded Spill
	; RV64I-NEXT: sd s2, 0(sp) # 8-byte Folded Spill			; RV64I-NEXT: sd s2, 0(sp) # 8-byte Folded Spill
	; RV64I-NEXT: mv s2, a1			; RV64I-NEXT: mv s0, a1
	; RV64I-NEXT: lui a1, 16			; RV64I-NEXT: lui a1, 16
	; RV64I-NEXT: addiw s0, a1, -1			; RV64I-NEXT: addiw s1, a1, -1
	; RV64I-NEXT: and a0, a0, s0			; RV64I-NEXT: and a0, a0, s1
	; RV64I-NEXT: call __gnu_h2f_ieee@plt			; RV64I-NEXT: call __gnu_h2f_ieee@plt
	; RV64I-NEXT: mv s1, a0			; RV64I-NEXT: mv s2, a0
	; RV64I-NEXT: and a0, s2, s0			; RV64I-NEXT: and a0, s0, s1
	; RV64I-NEXT: call __gnu_h2f_ieee@plt			; RV64I-NEXT: call __gnu_h2f_ieee@plt
	; RV64I-NEXT: mv s0, a0			; RV64I-NEXT: mv s0, a0
	; RV64I-NEXT: mv a0, s1			; RV64I-NEXT: mv a0, s2
	; RV64I-NEXT: mv a1, s0			; RV64I-NEXT: mv a1, s0
	; RV64I-NEXT: call __addsf3@plt			; RV64I-NEXT: call __addsf3@plt
				; RV64I-NEXT: call __gnu_f2h_ieee@plt
				; RV64I-NEXT: and a0, a0, s1
				; RV64I-NEXT: call __gnu_h2f_ieee@plt
	; RV64I-NEXT: mv a1, s0			; RV64I-NEXT: mv a1, s0
	; RV64I-NEXT: call __divsf3@plt			; RV64I-NEXT: call __divsf3@plt
	; RV64I-NEXT: call __gnu_f2h_ieee@plt			; RV64I-NEXT: call __gnu_f2h_ieee@plt
	; RV64I-NEXT: ld s2, 0(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s2, 0(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s1, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s1, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s0, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 24(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 24(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 32			; RV64I-NEXT: addi sp, sp, 32
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	%1 = fadd half %a, %b			%1 = fadd half %a, %b
	%2 = fdiv half %1, %b			%2 = fdiv half %1, %b
	ret half %2			ret half %2
	}			}