This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/RISCV/
-
Target/
-
RISCV/
1/1
RISCVISelLowering.cpp
2/2
RISCVInstrInfoF.td
-
test/CodeGen/RISCV/
-
CodeGen/
-
RISCV/
-
float-arith-strict.ll
-
float-arith.ll

Differential D122918

[RISCV][CodeGen] Support Zfinx,Zdinx,Zhinx,Zhinxmin codegen
AbandonedPublic

Authored by sunshaoce on Apr 1 2022, 10:33 AM.

Download Raw Diff

Details

Reviewers

craig.topper
jrtc27
asb
rogfer01
luismarques
frasercrmck
reames

Summary

Co-Author: @liaolucy @realqhc

Diff Detail

Repository: rG LLVM Github Monorepo

Unit TestsFailed

	Time	Test
	60,090 ms	x64 debian > AddressSanitizer-x86_64-linux-dynamic.TestCases::scariness_score_test.cpp
	60,100 ms	x64 debian > AddressSanitizer-x86_64-linux.TestCases::scariness_score_test.cpp
	60,030 ms	x64 debian > libFuzzer.libFuzzer::fuzzer-leak.test
	60,110 ms	x64 debian > libFuzzer.libFuzzer::large.test
	60,030 ms	x64 debian > libFuzzer.libFuzzer::minimize_crash.test
		View Full Test Results (7 Failed)

Event Timeline

sunshaoce created this revision.Apr 1 2022, 10:33 AM

Herald added a project: Restricted Project. · View Herald TranscriptApr 1 2022, 10:33 AM

Herald added subscribers: VincentWu, luke957, StephenFan and 23 others. · View Herald Transcript

sunshaoce requested review of this revision.Apr 1 2022, 10:33 AM

Herald added a project: Restricted Project. · View Herald TranscriptApr 1 2022, 10:33 AM

Herald added subscribers: llvm-commits, • pcwang-thead, eopXD, MaskRay. · View Herald Transcript

Harbormaster completed remote builds in B157446: Diff 419800.Apr 1 2022, 11:10 AM

Support float-arith in RV64 Zfinx

sunshaoce edited the summary of this revision. (Show Details)Apr 3 2022, 9:06 AM

sunshaoce retitled this revision from [RISCV][CodeGen] Support float-arith in RV32 zfinx to [RISCV][CodeGen] Support float-arith in Zfinx.

sunshaoce added subscribers: realqhc, liaolucy.

Harbormaster completed remote builds in B157648: Diff 420063.Apr 3 2022, 9:45 AM

gabcoh added a subscriber: gabcoh.Apr 3 2022, 10:49 AM

Add abi info in test files

Harbormaster completed remote builds in B158120: Diff 420709.Apr 5 2022, 11:21 PM

Rebase

Harbormaster completed remote builds in B158405: Diff 421096.Apr 7 2022, 12:18 AM

Note: I get a crash when I try to compile some LLVM IR. Crash trace:

$ bin/llc --march riscv32 -mattr +zfinx test.ll
LLVM ERROR: Cannot select: t8: ch = store<(store (s32) into %ir.4)> t7, t4, t6, undef:i32
  t4: f32,ch = load<(dereferenceable load (s32) from %ir.2)> t0, FrameIndex:i32<1>, undef:i32
    t1: i32 = FrameIndex<1>
    t3: i32 = undef
  t6: i32,ch = load<(dereferenceable load (s32) from %ir.1, align 8)> t0, FrameIndex:i32<0>, undef:i32
    t5: i32 = FrameIndex<0>
    t3: i32 = undef
  t3: i32 = undef
In function: _Z10sum_floatsPfjS_
PLEASE submit a bug report to https://github.com/llvm/llvm-project/issues/ and include the crash backtrace.
Stack dump:
0.	Program arguments: bin/llc --march riscv32 -mattr +zfinx test.ll
1.	Running pass 'Function Pass Manager' on module 'test.ll'.
2.	Running pass 'RISCV DAG->DAG Pattern Instruction Selection' on function '@_Z10sum_floatsPfjS_'
Stack dump without symbol names (ensure you have llvm-symbolizer in your PATH or set the environment var `LLVM_SYMBOLIZER_PATH` to point to it):
0  llc                      0x000000010974962d llvm::sys::PrintStackTrace(llvm::raw_ostream&, int) + 61
1  llc                      0x0000000109749bdb PrintStackTraceSignalHandler(void*) + 27
2  llc                      0x000000010974785b llvm::sys::RunSignalHandlers() + 139
3  llc                      0x000000010974b7d8 SignalHandler(int) + 232
4  libsystem_platform.dylib 0x00007fff206e5d7d _sigtramp + 29
5  libsystem_platform.dylib 000000000000000000 _sigtramp + 18446603339972059808
6  libsystem_c.dylib        0x00007fff205f5406 abort + 125
7  llc                      0x00000001095aae4a llvm::report_fatal_error(llvm::Twine const&, bool) + 394
8  llc                      0x0000000109432305 llvm::SelectionDAGISel::CannotYetSelect(llvm::SDNode*) + 725
9  llc                      0x000000010942dd72 llvm::SelectionDAGISel::SelectCodeCommon(llvm::SDNode*, unsigned char const*, unsigned int) + 26690
10 llc                      0x0000000106faec6c llvm::RISCVDAGToDAGISel::SelectCode(llvm::SDNode*) + 44
11 llc                      0x0000000106fade73 llvm::RISCVDAGToDAGISel::Select(llvm::SDNode*) + 31299
12 llc                      0x000000010941e7fd llvm::SelectionDAGISel::DoInstructionSelection() + 1629
13 llc                      0x000000010941cf4d llvm::SelectionDAGISel::CodeGenAndEmitDAG() + 6205
14 llc                      0x000000010941b56f llvm::SelectionDAGISel::SelectBasicBlock(llvm::ilist_iterator<llvm::ilist_detail::node_options<llvm::Instruction, true, false, void>, false, true>, llvm::ilist_iterator<llvm::ilist_detail::node_options<llvm::Instruction, true, false, void>, false, true>, bool&) + 399
15 llc                      0x0000000109419649 llvm::SelectionDAGISel::SelectAllBasicBlocks(llvm::Function const&) + 6329
16 llc                      0x0000000109415d2c llvm::SelectionDAGISel::runOnMachineFunction(llvm::MachineFunction&) + 2268
17 llc                      0x0000000106fb0668 llvm::RISCVDAGToDAGISel::runOnMachineFunction(llvm::MachineFunction&) + 56
18 llc                      0x0000000107cc0dcd llvm::MachineFunctionPass::runOnFunction(llvm::Function&) + 541
19 llc                      0x0000000108645dbc llvm::FPPassManager::runOnFunction(llvm::Function&) + 700
20 llc                      0x000000010864dce5 llvm::FPPassManager::runOnModule(llvm::Module&) + 117
21 llc                      0x0000000108646784 (anonymous namespace)::MPPassManager::runOnModule(llvm::Module&) + 772
22 llc                      0x00000001086462a8 llvm::legacy::PassManagerImpl::run(llvm::Module&) + 296
23 llc                      0x000000010864e081 llvm::legacy::PassManager::run(llvm::Module&) + 33
24 llc                      0x0000000106eeba16 compileModule(char**, llvm::LLVMContext&) + 6742
25 llc                      0x0000000106ee977d main + 1501
26 libdyld.dylib            0x00007fff206bbf3d start + 1
27 libdyld.dylib            0x0000000000000006 start + 18446603339972231370
Abort trap: 6

Corresponding LLVM IR:

define dso_local void @_Z10sum_floatsPfjS_() #0 {
  %1 = alloca float*, align 8
  %2 = alloca float, align 4
  %3 = load float, float* %2, align 4
  %4 = load float*, float** %1, align 8
  store float %3, float* %4, align 4
  ret void
}

(Note that it compiles just fine with +f (but using float registers...), or with nothing (but uses softwawre emulation for the fadd)

(Edited to shorten llvm ir code a lot :) )

Ok, I've since learned that this PR doesnt handle load/store. Only arithmetic.

However note that immediate float arithmetic also seems to be missing, e.g. the following crashes

define noundef float @_Z4funcf(float noundef %0) #0 {
  %2 = fadd float %0, 3.000000e+00
  ret float %2
}

Compiled with:

bin/llc --march riscv32 -mattr +zfinx test_fadd_imm.ll

Gives:

LLVM ERROR: Cannot select: t15: f32,ch = load<(load (s32) from constant-pool)> t0, t19, undef:i32
  t19: i32 = ADDI t18, TargetConstantPool:i32<float 3.000000e+00> 0 [TF=3]
    t18: i32 = LUI TargetConstantPool:i32<float 3.000000e+00> 0 [TF=4]
      t16: i32 = TargetConstantPool<float 3.000000e+00> 0 [TF=4]
    t17: i32 = TargetConstantPool<float 3.000000e+00> 0 [TF=3]
  t14: i32 = undef
In function: _Z4funcf

(but compiles ok with +f)

hughperkins added inline comments.Apr 13 2022, 3:39 AM

llvm/lib/Target/RISCV/RISCVInstrInfoF.td
515	I think it's confusing that `FINX` in this context means `F` and `F_INX`. I feel it might be good to make more explicit that `FINX` includes `F`. How to do that is an open question. I'd suggest `FFINX`, but `FFINX` is already taken to mean `FF` with `FF_INX`. Maybe we need an explicit acronym to mean 'F and F_INX', like e.g. 'ALLF'. Or perhaps use a verbose form like 'F_AND_FINX'? (If it was my own decision I'd go for the explicit `F_AND_FINX`)

Also, not really part of this PR, but I don't know where else to put this. This code:

def FF        : ExtInfo_rr<FExt,       FPR32,    FPR32>;
def FF_INX    : ExtInfo_rr<ZfinxExt,   FPR32INX, FPR32INX>;
def FX        : ExtInfo_rr<FExt,       FPR32,    GPR>;
def FX_INX    : ExtInfo_rr<ZfinxExt,   FPR32INX, GPR>;
def FX_64     : ExtInfo_rr<F64Ext,     FPR32,    GPR>;
def FX_INX_64 : ExtInfo_rr<Zfinx64Ext, FPR32INX, GPR>;
def XF        : ExtInfo_rr<FExt,       GPR,      FPR32>;
def XF_64     : ExtInfo_rr<F64Ext,     GPR,      FPR32>;
def XF_INX    : ExtInfo_rr<ZfinxExt,   GPR,      FPR32INX>;
def XF_INX_64 : ExtInfo_rr<Zfinx64Ext, GPR,      FPR32INX>;

... I feel it would be good to add a docstring explaining what this is, like e.g. something like:

Each of these definitions represents a single combination of register spaces.
For example, `FX` means that the destination register is a float register (`FPR32`), e.g. `ft1`,
and that the source register is a general `x` register (`GPR`), e.g. `x1`.
The `_INX` versions are for the `+zfinx` extension. In this case, `FPR32INX` is effectively a synonym in practice
for `GPR`. At least `FPR32INX` are emitted as general `x` registers, even though they 'look like' float registers
for much of the tablegen process.

In D122918#3447845, @hughperkins wrote:
Ok, I've since learned that this PR doesnt handle load/store. Only arithmetic.

However note that immediate float arithmetic also seems to be missing, e.g. the following crashes
define noundef float @_Z4funcf(float noundef %0) #0 {
  %2 = fadd float %0, 3.000000e+00
  ret float %2
}
Compiled with:
bin/llc --march riscv32 -mattr +zfinx test_fadd_imm.ll
Gives:
LLVM ERROR: Cannot select: t15: f32,ch = load<(load (s32) from constant-pool)> t0, t19, undef:i32
  t19: i32 = ADDI t18, TargetConstantPool:i32<float 3.000000e+00> 0 [TF=3]
    t18: i32 = LUI TargetConstantPool:i32<float 3.000000e+00> 0 [TF=4]
      t16: i32 = TargetConstantPool<float 3.000000e+00> 0 [TF=4]
    t17: i32 = TargetConstantPool<float 3.000000e+00> 0 [TF=3]
  t14: i32 = undef
In function: _Z4funcf
(but compiles ok with +f)

Thanks, I'll try to fix it.

llvm/lib/Target/RISCV/RISCVInstrInfoF.td
515	Your suggestion is very good, but I think `FINX` should be replaced with a shorter name because it appears as a parameter, eg `F_INX`. And consider changing the name of `F_INX` to `FprINX`. Would you like to submit a new patch about this?

In D122918#3447973, @sunshaoce wrote:

Thanks, I'll try to fix it.

Awesome :) Thank you :)

As a general comment, after thinking about this whilst brushing my teeth, I kind of feel that it might be clearer and simpler for everyone, both F people and Zfinx people, if we decoupled F and Zfinx into two separate files. This way F people don't have to figure out what is Zfinx. They just keep their clean separate F file. and Zfinx people dont have to think about how our bits mangle with F bits. Yes involves a bit of duplication, but if it's clearer/cleaner for everyone, maybe it might be a good approach?

After all, Zfinx is not an extension of F. It's a separate, mutually incompatible extension. And it's a fairly niche extension, I feel.

(Conversely, if we feel that zfinx is a non-niche extension, then it should have a shorter name I feel, eg maybe U for untyped registers)

In D122918#3448001, @hughperkins wrote:

As a general comment, after thinking about this whilst brushing my teeth, I kind of feel that it might be clearer and simpler for everyone, both F people and Zfinx people, if we decoupled F and Zfinx into two separate files. This way F people don't have to figure out what is Zfinx. They just keep their clean separate F file. and Zfinx people dont have to think about how our bits mangle with F bits. Yes involves a bit of duplication, but if it's clearer/cleaner for everyone, maybe it might be a good approach?

After all, Zfinx is not an extension of F. It's a separate, mutually incompatible extension. And it's a fairly niche extension, I feel.

Hi Hugh, and welcome! The naming of the extension is outside of our control I'm afraid.

I see your point, though the main reasoning about keeping F and Zfinx together is that they are largely the same instructions, and the hope is to define instructions and patterns together where feasible.

In D122918#3448555, @asb wrote:

I see your point, though the main reasoning about keeping F and Zfinx together is that they are largely the same instructions, and the hope is to define instructions and patterns together where feasible.

Yeah, I totally understand that. And when I first looked at this PR, I thought that made total sense. But then I saw how challenging it is to try to combine the two.

As far as the general principle of 'lets keep things together with similar patterns', the same argument can be levied against the pair of F and D, and yet they are in separate files, and I currently feel putting F and D in separate files is likely a reasonable idea. Despite their apparent similarities (32 vs 64 bits...), it is simpler and easier to keep D and F separate. Compared to D vs F, F vs Zfinx are I feel more different, and there is more reason to keep them apart. But even if they were the same difference as D and F, I feel keeping Zfinx and F apart coudl be a good idea:

Zfinx is fairly niche, and seems unfair to 'pollute' F with it?
I suspect Zfinx might be easier to implement if it is kept separaet fomr F.

Anyway, I seem likely to at least dabble in creating a decoupled version of Zfinx. I sort of have a hunch it will be eiaser. If it's not, well, I will come back, and say "well, yes, you were right, it is good to keep Zfinx and F together because ... [reasons X, Y, Z]".

@hughperkins: You make good points. It's not immediately obvious what kind of splitting would be better, and at what point the added complexity of trying to have piggy-back zfinx on current F/D patterns hampers readability and maintainability rather than enhance it. If you have time to play around with some options, I'd be really interested in hearing what you come up with.

Fix crash

Harbormaster completed remote builds in B159692: Diff 422867.Apr 14 2022, 8:53 AM

Oooo. you've made load and store work :) Taht's fantastic :) Thank you :)

Fully support zfinx codegen

sunshaoce retitled this revision from [RISCV][CodeGen] Support float-arith in Zfinx to [RISCV][CodeGen] Support Zfinx codegen.May 8 2022, 6:19 AM

By the way, whilst I remember, since @sunshaoce has implemented all the functionality I need (for now), so I'm not intending to spend any time on working on this. Everything I tested in this PR worked great for me :)

Fix errors

Harbormaster completed remote builds in B163377: Diff 427933.May 8 2022, 7:45 AM

ping

Herald added a subscriber: shiva0217. · View Herald TranscriptMay 17 2022, 9:29 AM

Support zdinx,zhinx codegen

Herald added a subscriber: qcolombet. · View Herald TranscriptJun 20 2022, 10:47 PM

Harbormaster completed remote builds in B170978: Diff 438558.Jun 20 2022, 10:47 PM

sunshaoce retitled this revision from [RISCV][CodeGen] Support Zfinx codegen to [RISCV][CodeGen] Support Zfinx,Zdinx,Zhinx,Zhinxmin codegen.Jun 20 2022, 10:47 PM

Rebase

Harbormaster completed remote builds in B183824: Diff 456214.Aug 28 2022, 5:15 PM

Ping

Harbormaster completed remote builds in B184324: Diff 456908.Aug 31 2022, 3:30 AM

A couple of very high level review comments.

This patch commingles the assembler/disassembly support and the pattern matching required for IR lowering. The typical process for an extension is to start with a patch specific to the MC layer (i.e. assembler/disassembler), and then move to codegen support in a later patch. I strongly strongly recommend you split if you want meaningful chance of review.

You don't appear to have any assembler tests. That's a show stopper right there.

On the MC part, please try to get the new extension as separate as possible from the existing floating point ones. I realize there's some potential for code savings, but the change will be lower risk if it touches as little as possible. Once it's in, and tested, changes to share code incrementally would be reasonable.

I strongly recommend you address these points. This patch is unlikely to get meaningful review without them addressed.

This revision now requires changes to proceed.Aug 31 2022, 3:13 PM

Assembler and disassembler support was already commited in https://reviews.llvm.org/D93298

craig.topper added inline comments.Aug 31 2022, 3:19 PM

llvm/lib/Target/RISCV/RISCVInstrInfoD.td
105 ↗	(On Diff #456908)	Is this something that should have been in the MC layer patch?

jrtc27 added inline comments.Aug 31 2022, 3:25 PM

llvm/lib/Target/RISCV/RISCVInstrInfoD.td
105 ↗	(On Diff #456908)	No. These don't exist. From the spec: Load-pair and store-pair instructions are not provided, so transferring double-precision operands in RV32Zdinx from or to memory requires two loads or stores.

In D122918#3762537, @craig.topper wrote:

Assembler and disassembler support was already commited in https://reviews.llvm.org/D93298

Then why does this contain what look to be MC related changes to .td files? Looking closer, I do see that something has already landed, but there's definitely MC pieces in this. Confusing to say the least.

In D122918#3762574, @reames wrote:

In D122918#3762537, @craig.topper wrote:

Assembler and disassembler support was already commited in https://reviews.llvm.org/D93298

Then why does this contain what look to be MC related changes to .td files? Looking closer, I do see that something has already landed, but there's definitely MC pieces in this. Confusing to say the least.

Can you point to a specific example?

llvm/lib/Target/RISCV/RISCVInstrInfoD.td
105 ↗	(On Diff #456908)	Are these expanded somewhere that I'm not seeing?

craig.topper added inline comments.Aug 31 2022, 3:48 PM

llvm/test/CodeGen/RISCV/double-mem.ll
22 ↗	(On Diff #456908)	This seems to be emitting an ld instruction in rv32 which is illegal.

jrtc27 added inline comments.Aug 31 2022, 3:51 PM

llvm/lib/Target/RISCV/RISCVInstrInfoD.td
105 ↗	(On Diff #456908)	Nope, you can see them in the test output for the RV32Zdinx tests... it's just wrong. Whether these should be pseudos or we should be teaching the legaliser that f64 is legal except for loads/stores I don't know; the latter would be nice, but the interaction with spills sounds bad. I had a similar issue downstream in CHERI-LLVM where, depending on the mode and pointer address space, there is no FLD/FSD available (when the pointer address space doesn't match the default for the encoding mode used for the current ABI). I used BuildPairF64Pseudo on loading from the address and loading from adding 4 to the address in the TableGen patterns, and added new (Cheri)SplitStoreF64Pseudo's for the store side that do SplitF64Pseudo plus storing to additional addresses. Presumably some of that could be reused if adopting that approach rather than legalisation, though if there's a nicer way without going to legalisation I'd be interested to see it as it's rather ugly (and the only user I can see of `(KILL ...)` in TableGen patterns themselves...). https://github.com/CTSRD-CHERI/llvm-project/pull/635/files, for what it's worth.

Replace ld with lw in RV32 Zdinx

Harbormaster completed remote builds in B186029: Diff 459306.Sep 10 2022, 1:32 PM

In D122918#3762609, @craig.topper wrote:

In D122918#3762574, @reames wrote:

In D122918#3762537, @craig.topper wrote:

Assembler and disassembler support was already commited in https://reviews.llvm.org/D93298

Then why does this contain what look to be MC related changes to .td files? Looking closer, I do see that something has already landed, but there's definitely MC pieces in this. Confusing to say the least.

Can you point to a specific example?

I think I was seeing the FLD_IN32X definition from the Aug 28th version of the patch. This has since been removed, and even at the time of my comment, I must have been looking at a stale diff. Sorry for the noise.

Two minor optional style comments.

llvm/lib/Target/RISCV/RISCVISelLowering.cpp
11497	This pattern repeats a lot. Maybe worth introducing a "Subtarget.hasStdExtZfhorZhinx()" cover? Also for corresponding F/D variants.
llvm/lib/Target/RISCV/RISCVInstrInfoZfh.td
474 ↗	(On Diff #459306)	For the rounding modes, defining symbolic constant names would make the code easier to read. I see that this pattern exists in the current code, so this is a non-blocking suggestion.

Address @reames's comment

Harbormaster completed remote builds in B186919: Diff 460481.Sep 15 2022, 1:07 PM

Ping

jrtc27 added inline comments.Sep 28 2022, 8:50 AM

llvm/lib/Target/RISCV/RISCVExpandPseudoInsts.cpp
53 ↗	(On Diff #463574)	Way too generic a name that also isn't correctly capitalised
93 ↗	(On Diff #463574)	Is that guaranteed to be 0?
102 ↗	(On Diff #463574)	Think about whether this is actually safe, please...

Harbormaster completed remote builds in B189188: Diff 463574.Sep 28 2022, 9:28 AM

Address comment

jrtc27 added inline comments.Oct 2 2022, 9:36 AM

llvm/lib/Target/RISCV/RISCVExpandPseudoInsts.cpp
53–56 ↗	(On Diff #464557)	These still are not consistently named

Harbormaster completed remote builds in B189891: Diff 464557.Oct 2 2022, 10:02 AM

Rebase

Harbormaster completed remote builds in B191108: Diff 466297.Oct 8 2022, 10:30 AM

Address @jrtc27's comments

jrtc27 added inline comments.Oct 21 2022, 12:21 PM

llvm/lib/Target/RISCV/RISCVExpandPseudoInsts.cpp
102 ↗	(On Diff #463574)	I don't know why you've marked this as done; the line in question (which is now the line below) is not correct, the immediate could be 0x7f[cdef] at which point the arithmetic here will wrap to 0x80[0123] (which the machine verifier probably catches as out of range due to the immediate being signed?..). That is: void foo(void p, double d) { (double )((char )p + 0x7fc) = d; } will be miscompiled, surely.

jrtc27 added inline comments.Oct 21 2022, 12:22 PM

llvm/lib/Target/RISCV/RISCVExpandPseudoInsts.cpp
102 ↗	(On Diff #463574)	Note this doesn't have to mean the store is to an unaligned location, either, p could be unaligned and then the addition of 0x7fc results in a well-aligned location. Though we want to support unaligned accesses anyway so that shouldn't be relevant.

Harbormaster completed remote builds in B193598: Diff 469711.Oct 21 2022, 1:03 PM

We plan to split this patch into the following four parts:

zfinx
zdinx on rv32
zdinx on rv64
zhinx, zhinxmin

And, we will address Jessica’s comments in the new patch. Thanks!

Herald added subscribers: jobnoorman, luke. · View Herald TranscriptApr 20 2023, 9:34 PM

sunshaoce mentioned this in D148874: [RISCV][CodeGen] Support Zfinx codegen.Apr 20 2023, 9:48 PM

In D122918#4285895, @sunshaoce wrote:

We plan to split this patch into the following four parts:

zfinx

zdinx on rv32

zdinx on rv64

zhinx, zhinxmin

And, we will address Jessica’s comments in the new patch. Thanks!

Thank you - I think this is a piece of work where you need to have implemented everything to be sure that your approach works, but splitting to allow reviewing it in smaller chunks will be much better.

In D122918#4287273, @asb wrote:

In D122918#4285895, @sunshaoce wrote:

We plan to split this patch into the following four parts:

zfinx

zdinx on rv32

zdinx on rv64

zhinx, zhinxmin

And, we will address Jessica’s comments in the new patch. Thanks!

Thank you - I think this is a piece of work where you need to have implemented everything to be sure that your approach works, but splitting to allow reviewing it in smaller chunks will be much better.

Thanks, we will make sure to do it well.

sunshaoce mentioned this in rGfe558efe71c1: [RISCV][CodeGen] Support Zfinx codegen.May 2 2023, 9:13 AM

sunshaoce mentioned this in D149665: [RISCV][CodeGen] Support Zdinx on RV64 codegen.May 2 2023, 10:16 AM

sunshaoce mentioned this in D149743: [RISCV][CodeGen] Support Zdinx on RV32 codegen.May 3 2023, 6:12 AM

sunshaoce mentioned this in rG2dc0fa050eff: [RISCV][CodeGen] Support Zdinx on RV64 codegen.May 3 2023, 6:00 PM

realqhc mentioned this in D149811: [RISCV][CodeGen] Support Zhinx and Zhinxmin.May 3 2023, 8:04 PM

Qihan Cai <qcai8733@uni.sydney.edu.au> mentioned this in rG773b0aaa4917: [RISCV][CodeGen] Support Zhinx and Zhinxmin.May 12 2023, 1:31 AM

sunshaoce mentioned this in rG8b90f8e04b8d: [RISCV][CodeGen] Support Zdinx on RV32 codegen.May 24 2023, 11:13 PM

sunshaoce abandoned this revision.May 24 2023, 11:15 PM

evandro removed a subscriber: evandro.May 25 2023, 1:42 PM

Revision Contents

Path

Size

llvm/

lib/

Target/

RISCV/

RISCVISelLowering.cpp

11 lines

RISCVInstrInfoF.td

106 lines

test/

CodeGen/

RISCV/

float-arith-strict.ll

166 lines

float-arith.ll

250 lines

Diff 420063

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 86 Lines • ▼ Show 20 Lines	RISCVTargetLowering::RISCVTargetLowering(const TargetMachine &TM,
addRegisterClass(XLenVT, &RISCV::GPRRegClass);		addRegisterClass(XLenVT, &RISCV::GPRRegClass);

if (Subtarget.hasStdExtZfh())		if (Subtarget.hasStdExtZfh())
addRegisterClass(MVT::f16, &RISCV::FPR16RegClass);		addRegisterClass(MVT::f16, &RISCV::FPR16RegClass);
if (Subtarget.hasStdExtF())		if (Subtarget.hasStdExtF())
addRegisterClass(MVT::f32, &RISCV::FPR32RegClass);		addRegisterClass(MVT::f32, &RISCV::FPR32RegClass);
if (Subtarget.hasStdExtD())		if (Subtarget.hasStdExtD())
addRegisterClass(MVT::f64, &RISCV::FPR64RegClass);		addRegisterClass(MVT::f64, &RISCV::FPR64RegClass);
		if (Subtarget.hasStdExtZfinx())
		addRegisterClass(MVT::f32, &RISCV::GPRF32RegClass);

static const MVT::SimpleValueType BoolVecVTs[] = {		static const MVT::SimpleValueType BoolVecVTs[] = {
MVT::nxv1i1, MVT::nxv2i1, MVT::nxv4i1, MVT::nxv8i1,		MVT::nxv1i1, MVT::nxv2i1, MVT::nxv4i1, MVT::nxv8i1,
MVT::nxv16i1, MVT::nxv32i1, MVT::nxv64i1};		MVT::nxv16i1, MVT::nxv32i1, MVT::nxv64i1};
static const MVT::SimpleValueType IntVecVTs[] = {		static const MVT::SimpleValueType IntVecVTs[] = {
MVT::nxv1i8, MVT::nxv2i8, MVT::nxv4i8, MVT::nxv8i8, MVT::nxv16i8,		MVT::nxv1i8, MVT::nxv2i8, MVT::nxv4i8, MVT::nxv8i8, MVT::nxv16i8,
MVT::nxv32i8, MVT::nxv64i8, MVT::nxv1i16, MVT::nxv2i16, MVT::nxv4i16,		MVT::nxv32i8, MVT::nxv64i8, MVT::nxv1i16, MVT::nxv2i16, MVT::nxv4i16,
MVT::nxv8i16, MVT::nxv16i16, MVT::nxv32i16, MVT::nxv1i32, MVT::nxv2i32,		MVT::nxv8i16, MVT::nxv16i16, MVT::nxv32i16, MVT::nxv1i32, MVT::nxv2i32,
▲ Show 20 Lines • Show All 271 Lines • ▼ Show 20 Lines	if (Subtarget.hasStdExtZfh()) {
// FIXME: Need to promote f16 STRICT_* to f32 libcalls, but we don't have		// FIXME: Need to promote f16 STRICT_* to f32 libcalls, but we don't have
// complete support for all operations in LegalizeDAG.		// complete support for all operations in LegalizeDAG.

// We need to custom promote this.		// We need to custom promote this.
if (Subtarget.is64Bit())		if (Subtarget.is64Bit())
setOperationAction(ISD::FPOWI, MVT::i32, Custom);		setOperationAction(ISD::FPOWI, MVT::i32, Custom);
}		}

if (Subtarget.hasStdExtF()) {		if (Subtarget.hasStdExtF() \|\| Subtarget.hasStdExtZfinx()) {
for (auto NT : FPLegalNodeTypes)		for (auto NT : FPLegalNodeTypes)
setOperationAction(NT, MVT::f32, Legal);		setOperationAction(NT, MVT::f32, Legal);
for (auto CC : FPCCToExpand)		for (auto CC : FPCCToExpand)
setCondCodeAction(CC, MVT::f32, Expand);		setCondCodeAction(CC, MVT::f32, Expand);
setOperationAction(ISD::SELECT_CC, MVT::f32, Expand);		setOperationAction(ISD::SELECT_CC, MVT::f32, Expand);
setOperationAction(ISD::SELECT, MVT::f32, Custom);		setOperationAction(ISD::SELECT, MVT::f32, Custom);
setOperationAction(ISD::BR_CC, MVT::f32, Expand);		setOperationAction(ISD::BR_CC, MVT::f32, Expand);
for (auto Op : FPOpToExpand)		for (auto Op : FPOpToExpand)
▲ Show 20 Lines • Show All 946 Lines • ▼ Show 20 Lines	bool RISCVTargetLowering::shouldSinkOperands(
return true;		return true;
}		}

bool RISCVTargetLowering::isFPImmLegal(const APFloat &Imm, EVT VT,		bool RISCVTargetLowering::isFPImmLegal(const APFloat &Imm, EVT VT,
bool ForCodeSize) const {		bool ForCodeSize) const {
// FIXME: Change to Zfhmin once f16 becomes a legal type with Zfhmin.		// FIXME: Change to Zfhmin once f16 becomes a legal type with Zfhmin.
if (VT == MVT::f16 && !Subtarget.hasStdExtZfh())		if (VT == MVT::f16 && !Subtarget.hasStdExtZfh())
return false;		return false;
if (VT == MVT::f32 && !Subtarget.hasStdExtF())		if (VT == MVT::f32 && !Subtarget.hasStdExtF() && !Subtarget.hasStdExtZfinx())
return false;		return false;
if (VT == MVT::f64 && !Subtarget.hasStdExtD())		if (VT == MVT::f64 && !Subtarget.hasStdExtD())
return false;		return false;
return Imm.isZero();		return Imm.isZero();
}		}

bool RISCVTargetLowering::hasBitPreservingFPLogic(EVT VT) const {		bool RISCVTargetLowering::hasBitPreservingFPLogic(EVT VT) const {
return (VT == MVT::f16 && Subtarget.hasStdExtZfh()) \|\|		return (VT == MVT::f16 && Subtarget.hasStdExtZfh()) \|\|
(VT == MVT::f32 && Subtarget.hasStdExtF()) \|\|		(VT == MVT::f32 &&
		(Subtarget.hasStdExtF() \|\| Subtarget.hasStdExtZfinx())) \|\|
(VT == MVT::f64 && Subtarget.hasStdExtD());		(VT == MVT::f64 && Subtarget.hasStdExtD());
}		}

MVT RISCVTargetLowering::getRegisterTypeForCallingConv(LLVMContext &Context,		MVT RISCVTargetLowering::getRegisterTypeForCallingConv(LLVMContext &Context,
CallingConv::ID CC,		CallingConv::ID CC,
EVT VT) const {		EVT VT) const {
// Use f32 to pass f16 if it is legal and Zfh is not enabled.		// Use f32 to pass f16 if it is legal and Zfh is not enabled.
// We might still end up using a GPR but that will be decided based on ABI.		// We might still end up using a GPR but that will be decided based on ABI.
▲ Show 20 Lines • Show All 10,123 Lines • ▼ Show 20 Lines	bool RISCVTargetLowering::isFMAFasterThanFMulAndFAdd(const MachineFunction &MF,
EVT VT) const {		EVT VT) const {
VT = VT.getScalarType();		VT = VT.getScalarType();

if (!VT.isSimple())		if (!VT.isSimple())
return false;		return false;

switch (VT.getSimpleVT().SimpleTy) {		switch (VT.getSimpleVT().SimpleTy) {
case MVT::f16:		case MVT::f16:
return Subtarget.hasStdExtZfh();		return Subtarget.hasStdExtZfh();
		reamesUnsubmitted Done Reply Inline Actions This pattern repeats a lot. Maybe worth introducing a "Subtarget.hasStdExtZfhorZhinx()" cover? Also for corresponding F/D variants. reames: This pattern repeats a lot. Maybe worth introducing a "Subtarget.hasStdExtZfhorZhinx()" cover?
case MVT::f32:		case MVT::f32:
return Subtarget.hasStdExtF();		return Subtarget.hasStdExtF() \|\| Subtarget.hasStdExtZfinx();
case MVT::f64:		case MVT::f64:
return Subtarget.hasStdExtD();		return Subtarget.hasStdExtD();
default:		default:
break;		break;
}		}

return false;		return false;
}		}
▲ Show 20 Lines • Show All 285 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVInstrInfoF.td

	Show First 20 Lines • Show All 455 Lines • ▼ Show 20 Lines
	// Pseudo-instructions and codegen patterns			// Pseudo-instructions and codegen patterns
	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//

	/// Floating point constants			/// Floating point constants
	def fpimm0 : PatLeaf<(fpimm), [{ return N->isExactlyValue(+0.0); }]>;			def fpimm0 : PatLeaf<(fpimm), [{ return N->isExactlyValue(+0.0); }]>;
	def fpimmneg0 : PatLeaf<(fpimm), [{ return N->isExactlyValue(-0.0); }]>;			def fpimmneg0 : PatLeaf<(fpimm), [{ return N->isExactlyValue(-0.0); }]>;

	/// Generic pattern classes			/// Generic pattern classes
	class PatSetCC<RegisterClass Ty, SDPatternOperator OpNode, CondCode Cond, RVInst Inst>			class PatSetCC<DAGOperand Ty, SDPatternOperator OpNode, CondCode Cond,
				RVInst Inst>
	: Pat<(OpNode Ty:$rs1, Ty:$rs2, Cond), (Inst $rs1, $rs2)>;			: Pat<(OpNode Ty:$rs1, Ty:$rs2, Cond), (Inst $rs1, $rs2)>;
				multiclass PatSetCC_m<SDPatternOperator OpNode, CondCode Cond,
				RVInst Inst, list<ExtInfo_r> Exts> {
				foreach Ext = Exts in
				let Predicates = Ext.Predicates in
				def Ext.Suffix : PatSetCC<Ext.Reg, OpNode, Cond,
				!cast<RVInst>(Inst#Ext.Suffix)>;
				}

	class PatFprFpr<SDPatternOperator OpNode, RVInstR Inst,			class PatFprFpr<SDPatternOperator OpNode, RVInstR Inst,
	RegisterClass RegTy>			DAGOperand RegTy>
	: Pat<(OpNode RegTy:$rs1, RegTy:$rs2), (Inst $rs1, $rs2)>;			: Pat<(OpNode RegTy:$rs1, RegTy:$rs2), (Inst $rs1, $rs2)>;
				multiclass PatFprFpr_m<SDPatternOperator OpNode, RVInstR Inst,
				list<ExtInfo_r> Exts> {
				foreach Ext = Exts in
				let Predicates = Ext.Predicates in
				def Ext.Suffix : PatFprFpr<OpNode, !cast<RVInstR>(Inst#Ext.Suffix),
				Ext.Reg>;
				}

	class PatFprFprDynFrm<SDPatternOperator OpNode, RVInstRFrm Inst,			class PatFprFprDynFrm<SDPatternOperator OpNode, RVInstRFrm Inst,
	RegisterClass RegTy>			DAGOperand RegTy>
	: Pat<(OpNode RegTy:$rs1, RegTy:$rs2), (Inst $rs1, $rs2, 0b111)>;			: Pat<(OpNode RegTy:$rs1, RegTy:$rs2), (Inst $rs1, $rs2, 0b111)>;
				multiclass PatFprFprDynFrm_m<SDPatternOperator OpNode, RVInstRFrm Inst,
				list<ExtInfo_r> Exts> {
				foreach Ext = Exts in
				let Predicates = Ext.Predicates in
				def Ext.Suffix : PatFprFprDynFrm<OpNode,
				!cast<RVInstRFrm>(Inst#Ext.Suffix),
				Ext.Reg>;
				}

	let Predicates = [HasStdExtF] in {			let Predicates = [HasStdExtF] in {

	/// Float constants			/// Float constants
	def : Pat<(f32 (fpimm0)), (FMV_W_X X0)>;			def : Pat<(f32 (fpimm0)), (FMV_W_X X0)>;
	def : Pat<(f32 (fpimmneg0)), (FSGNJN_S (FMV_W_X X0), (FMV_W_X X0))>;			def : Pat<(f32 (fpimmneg0)), (FSGNJN_S (FMV_W_X X0), (FMV_W_X X0))>;
				} // Predicates = [HasStdExtF]

				let Predicates = [HasStdExtZfinx] in {
				def : Pat<(f32 (fpimm0)), (COPY (f32 X0))>;
				def : Pat<(f32 (fpimmneg0)), (FSGNJN_S_INX (COPY (f32 X0)), (COPY (f32 X0)))>;
				} // Predicates = [HasStdExtZfinx]

	/// Float conversion operations			/// Float conversion operations

	// [u]int32<->float conversion patterns must be gated on IsRV32 or IsRV64, so			// [u]int32<->float conversion patterns must be gated on IsRV32 or IsRV64, so
	// are defined later.			// are defined later.

	/// Float arithmetic operations			/// Float arithmetic operations
				defm : PatFprFprDynFrm_m<any_fadd, FADD_S, FINX>;
				hughperkinsUnsubmitted Done Reply Inline Actions I think it's confusing that `FINX` in this context means `F` and `F_INX`. I feel it might be good to make more explicit that `FINX` includes `F`. How to do that is an open question. I'd suggest `FFINX`, but `FFINX` is already taken to mean `FF` with `FF_INX`. Maybe we need an explicit acronym to mean 'F and F_INX', like e.g. 'ALLF'. Or perhaps use a verbose form like 'F_AND_FINX'? (If it was my own decision I'd go for the explicit `F_AND_FINX`) hughperkins: I think it's confusing that `FINX` in this context means `F` and `F_INX`. I feel it might be…
				sunshaoceAuthorUnsubmitted Done Reply Inline Actions Your suggestion is very good, but I think `FINX` should be replaced with a shorter name because it appears as a parameter, eg `F_INX`. And consider changing the name of `F_INX` to `FprINX`. Would you like to submit a new patch about this? sunshaoce: Your suggestion is very good, but I think `FINX` should be replaced with a shorter name because…
				defm : PatFprFprDynFrm_m<any_fsub, FSUB_S, FINX>;
				defm : PatFprFprDynFrm_m<any_fmul, FMUL_S, FINX>;
				defm : PatFprFprDynFrm_m<any_fdiv, FDIV_S, FINX>;

	def : PatFprFprDynFrm<any_fadd, FADD_S, FPR32>;			let Predicates = [HasStdExtF] in {
	def : PatFprFprDynFrm<any_fsub, FSUB_S, FPR32>;
	def : PatFprFprDynFrm<any_fmul, FMUL_S, FPR32>;
	def : PatFprFprDynFrm<any_fdiv, FDIV_S, FPR32>;

	def : Pat<(any_fsqrt FPR32:$rs1), (FSQRT_S FPR32:$rs1, 0b111)>;			def : Pat<(any_fsqrt FPR32:$rs1), (FSQRT_S FPR32:$rs1, 0b111)>;

	def : Pat<(fneg FPR32:$rs1), (FSGNJN_S $rs1, $rs1)>;			def : Pat<(fneg FPR32:$rs1), (FSGNJN_S $rs1, $rs1)>;
	def : Pat<(fabs FPR32:$rs1), (FSGNJX_S $rs1, $rs1)>;			def : Pat<(fabs FPR32:$rs1), (FSGNJX_S $rs1, $rs1)>;
				} // Predicates = [HasStdExtF]

				let Predicates = [HasStdExtZfinx] in {
				def : Pat<(any_fsqrt FPR32INX:$rs1), (FSQRT_S_INX FPR32INX:$rs1, 0b111)>;

				def : Pat<(fneg FPR32INX:$rs1), (FSGNJN_S_INX $rs1, $rs1)>;
				def : Pat<(fabs FPR32INX:$rs1), (FSGNJX_S_INX $rs1, $rs1)>;
				} // Predicates = [HasStdExtZfinx]

				defm : PatFprFpr_m<fcopysign, FSGNJ_S, FINX>;

	def : PatFprFpr<fcopysign, FSGNJ_S, FPR32>;			let Predicates = [HasStdExtF] in {
	def : Pat<(fcopysign FPR32:$rs1, (fneg FPR32:$rs2)), (FSGNJN_S $rs1, $rs2)>;			def : Pat<(fcopysign FPR32:$rs1, (fneg FPR32:$rs2)), (FSGNJN_S $rs1, $rs2)>;

	// fmadd: rs1 * rs2 + rs3			// fmadd: rs1 * rs2 + rs3
	def : Pat<(any_fma FPR32:$rs1, FPR32:$rs2, FPR32:$rs3),			def : Pat<(any_fma FPR32:$rs1, FPR32:$rs2, FPR32:$rs3),
	(FMADD_S $rs1, $rs2, $rs3, 0b111)>;			(FMADD_S $rs1, $rs2, $rs3, 0b111)>;

	// fmsub: rs1 * rs2 - rs3			// fmsub: rs1 * rs2 - rs3
	def : Pat<(any_fma FPR32:$rs1, FPR32:$rs2, (fneg FPR32:$rs3)),			def : Pat<(any_fma FPR32:$rs1, FPR32:$rs2, (fneg FPR32:$rs3)),
	(FMSUB_S FPR32:$rs1, FPR32:$rs2, FPR32:$rs3, 0b111)>;			(FMSUB_S FPR32:$rs1, FPR32:$rs2, FPR32:$rs3, 0b111)>;

	// fnmsub: -rs1 * rs2 + rs3			// fnmsub: -rs1 * rs2 + rs3
	def : Pat<(any_fma (fneg FPR32:$rs1), FPR32:$rs2, FPR32:$rs3),			def : Pat<(any_fma (fneg FPR32:$rs1), FPR32:$rs2, FPR32:$rs3),
	(FNMSUB_S FPR32:$rs1, FPR32:$rs2, FPR32:$rs3, 0b111)>;			(FNMSUB_S FPR32:$rs1, FPR32:$rs2, FPR32:$rs3, 0b111)>;

	// fnmadd: -rs1 * rs2 - rs3			// fnmadd: -rs1 * rs2 - rs3
	def : Pat<(any_fma (fneg FPR32:$rs1), FPR32:$rs2, (fneg FPR32:$rs3)),			def : Pat<(any_fma (fneg FPR32:$rs1), FPR32:$rs2, (fneg FPR32:$rs3)),
	(FNMADD_S FPR32:$rs1, FPR32:$rs2, FPR32:$rs3, 0b111)>;			(FNMADD_S FPR32:$rs1, FPR32:$rs2, FPR32:$rs3, 0b111)>;
				} // Predicates = [HasStdExtF]

				let Predicates = [HasStdExtZfinx] in {
				def : Pat<(fcopysign FPR32INX:$rs1, (fneg FPR32INX:$rs2)), (FSGNJN_S_INX $rs1, $rs2)>;

				// fmadd: rs1 * rs2 + rs3
				def : Pat<(any_fma FPR32INX:$rs1, FPR32INX:$rs2, FPR32INX:$rs3),
				(FMADD_S_INX $rs1, $rs2, $rs3, 0b111)>;

				// fmsub: rs1 * rs2 - rs3
				def : Pat<(any_fma FPR32INX:$rs1, FPR32INX:$rs2, (fneg FPR32INX:$rs3)),
				(FMSUB_S_INX FPR32INX:$rs1, FPR32INX:$rs2, FPR32INX:$rs3, 0b111)>;

				// fnmsub: -rs1 * rs2 + rs3
				def : Pat<(any_fma (fneg FPR32INX:$rs1), FPR32INX:$rs2, FPR32INX:$rs3),
				(FNMSUB_S_INX FPR32INX:$rs1, FPR32INX:$rs2, FPR32INX:$rs3, 0b111)>;

				// fnmadd: -rs1 * rs2 - rs3
				def : Pat<(any_fma (fneg FPR32INX:$rs1), FPR32INX:$rs2, (fneg FPR32INX:$rs3)),
				(FNMADD_S_INX FPR32INX:$rs1, FPR32INX:$rs2, FPR32INX:$rs3, 0b111)>;
				} // Predicates = [HasStdExtZfinx]

	// The ratified 20191213 ISA spec defines fmin and fmax in a way that matches			// The ratified 20191213 ISA spec defines fmin and fmax in a way that matches
	// LLVM's fminnum and fmaxnum			// LLVM's fminnum and fmaxnum
	// <https://github.com/riscv/riscv-isa-manual/commit/cd20cee7efd9bac7c5aa127ec3b451749d2b3cce>.			// <https://github.com/riscv/riscv-isa-manual/commit/cd20cee7efd9bac7c5aa127ec3b451749d2b3cce>.
	def : PatFprFpr<fminnum, FMIN_S, FPR32>;			defm : PatFprFpr_m<fminnum, FMIN_S, FINX>;
	def : PatFprFpr<fmaxnum, FMAX_S, FPR32>;			defm : PatFprFpr_m<fmaxnum, FMAX_S, FINX>;

	/// Setcc			/// Setcc
	// FIXME: SETEQ/SETLT/SETLE imply nonans, can we pick better instructions for			// FIXME: SETEQ/SETLT/SETLE imply nonans, can we pick better instructions for
	// strict versions of those.			// strict versions of those.

	// Match non-signaling FEQ_S			// Match non-signaling FEQ_S
	def : PatSetCC<FPR32, any_fsetcc, SETEQ, FEQ_S>;			defm : PatSetCC_m<any_fsetcc, SETEQ, FEQ_S, FINX>;
	def : PatSetCC<FPR32, any_fsetcc, SETOEQ, FEQ_S>;			defm : PatSetCC_m<any_fsetcc, SETOEQ, FEQ_S, FINX>;
				let Predicates = [HasStdExtF] in {
	def : PatSetCC<FPR32, strict_fsetcc, SETLT, PseudoQuietFLT_S>;			def : PatSetCC<FPR32, strict_fsetcc, SETLT, PseudoQuietFLT_S>;
	def : PatSetCC<FPR32, strict_fsetcc, SETOLT, PseudoQuietFLT_S>;			def : PatSetCC<FPR32, strict_fsetcc, SETOLT, PseudoQuietFLT_S>;
	def : PatSetCC<FPR32, strict_fsetcc, SETLE, PseudoQuietFLE_S>;			def : PatSetCC<FPR32, strict_fsetcc, SETLE, PseudoQuietFLE_S>;
	def : PatSetCC<FPR32, strict_fsetcc, SETOLE, PseudoQuietFLE_S>;			def : PatSetCC<FPR32, strict_fsetcc, SETOLE, PseudoQuietFLE_S>;

	// Match signaling FEQ_S			// Match signaling FEQ_S
	def : Pat<(strict_fsetccs FPR32:$rs1, FPR32:$rs2, SETEQ),			def : Pat<(strict_fsetccs FPR32:$rs1, FPR32:$rs2, SETEQ),
	(AND (FLE_S $rs1, $rs2),			(AND (FLE_S $rs1, $rs2),
	Show All 23 Lines
	defm : StPat<store, FSW, FPR32, f32>;			defm : StPat<store, FSW, FPR32, f32>;

	} // Predicates = [HasStdExtF]			} // Predicates = [HasStdExtF]

	let Predicates = [HasStdExtF, IsRV32] in {			let Predicates = [HasStdExtF, IsRV32] in {
	// Moves (no conversion)			// Moves (no conversion)
	def : Pat<(bitconvert (i32 GPR:$rs1)), (FMV_W_X GPR:$rs1)>;			def : Pat<(bitconvert (i32 GPR:$rs1)), (FMV_W_X GPR:$rs1)>;
	def : Pat<(i32 (bitconvert FPR32:$rs1)), (FMV_X_W FPR32:$rs1)>;			def : Pat<(i32 (bitconvert FPR32:$rs1)), (FMV_X_W FPR32:$rs1)>;
				} // Predicates = [HasStdExtF, IsRV32]

				let Predicates = [HasStdExtZfinx, IsRV32] in {
				// Moves (no conversion)
				def : Pat<(f32 (bitconvert (i32 GPR:$rs1))), (COPY GPR:$rs1)>;
				def : Pat<(i32 (bitconvert FPR32INX:$rs1)), (COPY FPR32INX:$rs1)>;
				} // Predicates = [HasStdExtZfinx, IsRV32]

				let Predicates = [HasStdExtF, IsRV32] in {
	// float->[u]int. Round-to-zero must be used.			// float->[u]int. Round-to-zero must be used.
	def : Pat<(i32 (any_fp_to_sint FPR32:$rs1)), (FCVT_W_S $rs1, 0b001)>;			def : Pat<(i32 (any_fp_to_sint FPR32:$rs1)), (FCVT_W_S $rs1, 0b001)>;
	def : Pat<(i32 (any_fp_to_uint FPR32:$rs1)), (FCVT_WU_S $rs1, 0b001)>;			def : Pat<(i32 (any_fp_to_uint FPR32:$rs1)), (FCVT_WU_S $rs1, 0b001)>;

	// Saturating float->[u]int32.			// Saturating float->[u]int32.
	def : Pat<(i32 (riscv_fcvt_x FPR32:$rs1, timm:$frm)), (FCVT_W_S $rs1, timm:$frm)>;			def : Pat<(i32 (riscv_fcvt_x FPR32:$rs1, timm:$frm)), (FCVT_W_S $rs1, timm:$frm)>;
	def : Pat<(i32 (riscv_fcvt_xu FPR32:$rs1, timm:$frm)), (FCVT_WU_S $rs1, timm:$frm)>;			def : Pat<(i32 (riscv_fcvt_xu FPR32:$rs1, timm:$frm)), (FCVT_WU_S $rs1, timm:$frm)>;

	Show All 9 Lines
	} // Predicates = [HasStdExtF, IsRV32]			} // Predicates = [HasStdExtF, IsRV32]

	let Predicates = [HasStdExtF, IsRV64] in {			let Predicates = [HasStdExtF, IsRV64] in {
	// Moves (no conversion)			// Moves (no conversion)
	def : Pat<(riscv_fmv_w_x_rv64 GPR:$src), (FMV_W_X GPR:$src)>;			def : Pat<(riscv_fmv_w_x_rv64 GPR:$src), (FMV_W_X GPR:$src)>;
	def : Pat<(riscv_fmv_x_anyextw_rv64 FPR32:$src), (FMV_X_W FPR32:$src)>;			def : Pat<(riscv_fmv_x_anyextw_rv64 FPR32:$src), (FMV_X_W FPR32:$src)>;
	def : Pat<(sext_inreg (riscv_fmv_x_anyextw_rv64 FPR32:$src), i32),			def : Pat<(sext_inreg (riscv_fmv_x_anyextw_rv64 FPR32:$src), i32),
	(FMV_X_W FPR32:$src)>;			(FMV_X_W FPR32:$src)>;
				} // Predicates = [HasStdExtF, IsRV64]

				let Predicates = [HasStdExtZfinx, IsRV64] in {
				// Moves (no conversion)
				def : Pat<(riscv_fmv_w_x_rv64 GPR:$src), (COPY GPR:$src)>;
				def : Pat<(riscv_fmv_x_anyextw_rv64 GPRF32:$src), (COPY GPRF32:$src)>;
				def : Pat<(sext_inreg (riscv_fmv_x_anyextw_rv64 GPRF32:$src), i32),
				(COPY GPRF32:$src)>;
				} // Predicates = [HasStdExtZfinx, IsRV64]

				let Predicates = [HasStdExtF, IsRV64] in {
	// Use target specific isd nodes to help us remember the result is sign			// Use target specific isd nodes to help us remember the result is sign
	// extended. Matching sext_inreg+fptoui/fptosi may cause the conversion to be			// extended. Matching sext_inreg+fptoui/fptosi may cause the conversion to be
	// duplicated if it has another user that didn't need the sign_extend.			// duplicated if it has another user that didn't need the sign_extend.
	def : Pat<(riscv_any_fcvt_w_rv64 FPR32:$rs1, timm:$frm), (FCVT_W_S $rs1, timm:$frm)>;			def : Pat<(riscv_any_fcvt_w_rv64 FPR32:$rs1, timm:$frm), (FCVT_W_S $rs1, timm:$frm)>;
	def : Pat<(riscv_any_fcvt_wu_rv64 FPR32:$rs1, timm:$frm), (FCVT_WU_S $rs1, timm:$frm)>;			def : Pat<(riscv_any_fcvt_wu_rv64 FPR32:$rs1, timm:$frm), (FCVT_WU_S $rs1, timm:$frm)>;

	// float->[u]int64. Round-to-zero must be used.			// float->[u]int64. Round-to-zero must be used.
	def : Pat<(i64 (any_fp_to_sint FPR32:$rs1)), (FCVT_L_S $rs1, 0b001)>;			def : Pat<(i64 (any_fp_to_sint FPR32:$rs1)), (FCVT_L_S $rs1, 0b001)>;
	Show All 20 Lines

llvm/test/CodeGen/RISCV/float-arith-strict.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=riscv32 -mattr=+f -verify-machineinstrs < %s \			; RUN: llc -mtriple=riscv32 -mattr=+f -verify-machineinstrs < %s \
	; RUN: -disable-strictnode-mutation -target-abi=ilp32f \			; RUN: -disable-strictnode-mutation -target-abi=ilp32f \
	; RUN: \| FileCheck -check-prefix=RV32IF %s			; RUN: \| FileCheck -check-prefix=RV32IF %s
	; RUN: llc -mtriple=riscv64 -mattr=+f -verify-machineinstrs < %s \			; RUN: llc -mtriple=riscv64 -mattr=+f -verify-machineinstrs < %s \
	; RUN: -disable-strictnode-mutation -target-abi=lp64f \			; RUN: -disable-strictnode-mutation -target-abi=lp64f \
	; RUN: \| FileCheck -check-prefix=RV64IF %s			; RUN: \| FileCheck -check-prefix=RV64IF %s
				; RUN: llc -mtriple=riscv32 -mattr=+zfinx -verify-machineinstrs < %s \
				; RUN: -disable-strictnode-mutation \
				; RUN: \| FileCheck -check-prefix=RV32IZFINX %s
				; RUN: llc -mtriple=riscv64 -mattr=+zfinx -verify-machineinstrs < %s \
				; RUN: -disable-strictnode-mutation \
				; RUN: \| FileCheck -check-prefix=RV64IZFINX %s
	; RUN: llc -mtriple=riscv32 -verify-machineinstrs < %s \			; RUN: llc -mtriple=riscv32 -verify-machineinstrs < %s \
	; RUN: -disable-strictnode-mutation \| FileCheck -check-prefix=RV32I %s			; RUN: -disable-strictnode-mutation \| FileCheck -check-prefix=RV32I %s
	; RUN: llc -mtriple=riscv64 -verify-machineinstrs < %s \			; RUN: llc -mtriple=riscv64 -verify-machineinstrs < %s \
	; RUN: -disable-strictnode-mutation \| FileCheck -check-prefix=RV64I %s			; RUN: -disable-strictnode-mutation \| FileCheck -check-prefix=RV64I %s

	define float @fadd_s(float %a, float %b) nounwind strictfp {			define float @fadd_s(float %a, float %b) nounwind strictfp {
	; RV32IF-LABEL: fadd_s:			; RV32IF-LABEL: fadd_s:
	; RV32IF: # %bb.0:			; RV32IF: # %bb.0:
	; RV32IF-NEXT: fadd.s fa0, fa0, fa1			; RV32IF-NEXT: fadd.s fa0, fa0, fa1
	; RV32IF-NEXT: ret			; RV32IF-NEXT: ret
	;			;
	; RV64IF-LABEL: fadd_s:			; RV64IF-LABEL: fadd_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fadd.s fa0, fa0, fa1			; RV64IF-NEXT: fadd.s fa0, fa0, fa1
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fadd_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fadd.s a0, a0, a1
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fadd_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fadd.s a0, a0, a1
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fadd_s:			; RV32I-LABEL: fadd_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: call __addsf3@plt			; RV32I-NEXT: call __addsf3@plt
	; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 16			; RV32I-NEXT: addi sp, sp, 16
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	Show All 17 Lines
	; RV32IF-NEXT: fsub.s fa0, fa0, fa1			; RV32IF-NEXT: fsub.s fa0, fa0, fa1
	; RV32IF-NEXT: ret			; RV32IF-NEXT: ret
	;			;
	; RV64IF-LABEL: fsub_s:			; RV64IF-LABEL: fsub_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fsub.s fa0, fa0, fa1			; RV64IF-NEXT: fsub.s fa0, fa0, fa1
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fsub_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fsub.s a0, a0, a1
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fsub_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fsub.s a0, a0, a1
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fsub_s:			; RV32I-LABEL: fsub_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: call __subsf3@plt			; RV32I-NEXT: call __subsf3@plt
	; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 16			; RV32I-NEXT: addi sp, sp, 16
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	Show All 17 Lines
	; RV32IF-NEXT: fmul.s fa0, fa0, fa1			; RV32IF-NEXT: fmul.s fa0, fa0, fa1
	; RV32IF-NEXT: ret			; RV32IF-NEXT: ret
	;			;
	; RV64IF-LABEL: fmul_s:			; RV64IF-LABEL: fmul_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fmul.s fa0, fa0, fa1			; RV64IF-NEXT: fmul.s fa0, fa0, fa1
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fmul_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fmul.s a0, a0, a1
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fmul_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fmul.s a0, a0, a1
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fmul_s:			; RV32I-LABEL: fmul_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: call __mulsf3@plt			; RV32I-NEXT: call __mulsf3@plt
	; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 16			; RV32I-NEXT: addi sp, sp, 16
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	Show All 17 Lines
	; RV32IF-NEXT: fdiv.s fa0, fa0, fa1			; RV32IF-NEXT: fdiv.s fa0, fa0, fa1
	; RV32IF-NEXT: ret			; RV32IF-NEXT: ret
	;			;
	; RV64IF-LABEL: fdiv_s:			; RV64IF-LABEL: fdiv_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fdiv.s fa0, fa0, fa1			; RV64IF-NEXT: fdiv.s fa0, fa0, fa1
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fdiv_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fdiv.s a0, a0, a1
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fdiv_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fdiv.s a0, a0, a1
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fdiv_s:			; RV32I-LABEL: fdiv_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: call __divsf3@plt			; RV32I-NEXT: call __divsf3@plt
	; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 16			; RV32I-NEXT: addi sp, sp, 16
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	Show All 17 Lines
	; RV32IF-NEXT: fsqrt.s fa0, fa0			; RV32IF-NEXT: fsqrt.s fa0, fa0
	; RV32IF-NEXT: ret			; RV32IF-NEXT: ret
	;			;
	; RV64IF-LABEL: fsqrt_s:			; RV64IF-LABEL: fsqrt_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fsqrt.s fa0, fa0			; RV64IF-NEXT: fsqrt.s fa0, fa0
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fsqrt_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fsqrt.s a0, a0
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fsqrt_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fsqrt.s a0, a0
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fsqrt_s:			; RV32I-LABEL: fsqrt_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: call sqrtf@plt			; RV32I-NEXT: call sqrtf@plt
	; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 16			; RV32I-NEXT: addi sp, sp, 16
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	Show All 25 Lines
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: addi sp, sp, -16			; RV64IF-NEXT: addi sp, sp, -16
	; RV64IF-NEXT: sd ra, 8(sp) # 8-byte Folded Spill			; RV64IF-NEXT: sd ra, 8(sp) # 8-byte Folded Spill
	; RV64IF-NEXT: call fminf@plt			; RV64IF-NEXT: call fminf@plt
	; RV64IF-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64IF-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64IF-NEXT: addi sp, sp, 16			; RV64IF-NEXT: addi sp, sp, 16
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fmin_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: addi sp, sp, -16
				; RV32IZFINX-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
				; RV32IZFINX-NEXT: call fminf@plt
				; RV32IZFINX-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
				; RV32IZFINX-NEXT: addi sp, sp, 16
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fmin_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: addi sp, sp, -16
				; RV64IZFINX-NEXT: sd ra, 8(sp) # 8-byte Folded Spill
				; RV64IZFINX-NEXT: call fminf@plt
				; RV64IZFINX-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
				; RV64IZFINX-NEXT: addi sp, sp, 16
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fmin_s:			; RV32I-LABEL: fmin_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: call fminf@plt			; RV32I-NEXT: call fminf@plt
	; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 16			; RV32I-NEXT: addi sp, sp, 16
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	Show All 25 Lines
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: addi sp, sp, -16			; RV64IF-NEXT: addi sp, sp, -16
	; RV64IF-NEXT: sd ra, 8(sp) # 8-byte Folded Spill			; RV64IF-NEXT: sd ra, 8(sp) # 8-byte Folded Spill
	; RV64IF-NEXT: call fmaxf@plt			; RV64IF-NEXT: call fmaxf@plt
	; RV64IF-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64IF-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64IF-NEXT: addi sp, sp, 16			; RV64IF-NEXT: addi sp, sp, 16
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fmax_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: addi sp, sp, -16
				; RV32IZFINX-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
				; RV32IZFINX-NEXT: call fmaxf@plt
				; RV32IZFINX-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
				; RV32IZFINX-NEXT: addi sp, sp, 16
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fmax_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: addi sp, sp, -16
				; RV64IZFINX-NEXT: sd ra, 8(sp) # 8-byte Folded Spill
				; RV64IZFINX-NEXT: call fmaxf@plt
				; RV64IZFINX-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
				; RV64IZFINX-NEXT: addi sp, sp, 16
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fmax_s:			; RV32I-LABEL: fmax_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: call fmaxf@plt			; RV32I-NEXT: call fmaxf@plt
	; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 16			; RV32I-NEXT: addi sp, sp, 16
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	Show All 17 Lines
	; RV32IF-NEXT: fmadd.s fa0, fa0, fa1, fa2			; RV32IF-NEXT: fmadd.s fa0, fa0, fa1, fa2
	; RV32IF-NEXT: ret			; RV32IF-NEXT: ret
	;			;
	; RV64IF-LABEL: fmadd_s:			; RV64IF-LABEL: fmadd_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fmadd.s fa0, fa0, fa1, fa2			; RV64IF-NEXT: fmadd.s fa0, fa0, fa1, fa2
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fmadd_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fmadd.s a0, a0, a1, a2
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fmadd_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fmadd.s a0, a0, a1, a2
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fmadd_s:			; RV32I-LABEL: fmadd_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: call fmaf@plt			; RV32I-NEXT: call fmaf@plt
	; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 16			; RV32I-NEXT: addi sp, sp, 16
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	Show All 21 Lines
	;			;
	; RV64IF-LABEL: fmsub_s:			; RV64IF-LABEL: fmsub_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fmv.w.x ft0, zero			; RV64IF-NEXT: fmv.w.x ft0, zero
	; RV64IF-NEXT: fadd.s ft0, fa2, ft0			; RV64IF-NEXT: fadd.s ft0, fa2, ft0
	; RV64IF-NEXT: fmsub.s fa0, fa0, fa1, ft0			; RV64IF-NEXT: fmsub.s fa0, fa0, fa1, ft0
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fmsub_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fadd.s a2, a2, zero
				; RV32IZFINX-NEXT: fmsub.s a0, a0, a1, a2
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fmsub_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fadd.s a2, a2, zero
				; RV64IZFINX-NEXT: fmsub.s a0, a0, a1, a2
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fmsub_s:			; RV32I-LABEL: fmsub_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill
	; RV32I-NEXT: mv s0, a1			; RV32I-NEXT: mv s0, a1
	; RV32I-NEXT: mv s1, a0			; RV32I-NEXT: mv s1, a0
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	; RV64IF-LABEL: fnmadd_s:			; RV64IF-LABEL: fnmadd_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fmv.w.x ft0, zero			; RV64IF-NEXT: fmv.w.x ft0, zero
	; RV64IF-NEXT: fadd.s ft1, fa0, ft0			; RV64IF-NEXT: fadd.s ft1, fa0, ft0
	; RV64IF-NEXT: fadd.s ft0, fa2, ft0			; RV64IF-NEXT: fadd.s ft0, fa2, ft0
	; RV64IF-NEXT: fnmadd.s fa0, ft1, fa1, ft0			; RV64IF-NEXT: fnmadd.s fa0, ft1, fa1, ft0
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fnmadd_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fadd.s a0, a0, zero
				; RV32IZFINX-NEXT: fadd.s a2, a2, zero
				; RV32IZFINX-NEXT: fnmadd.s a0, a0, a1, a2
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fnmadd_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fadd.s a0, a0, zero
				; RV64IZFINX-NEXT: fadd.s a2, a2, zero
				; RV64IZFINX-NEXT: fnmadd.s a0, a0, a1, a2
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fnmadd_s:			; RV32I-LABEL: fnmadd_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s2, 0(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s2, 0(sp) # 4-byte Folded Spill
	; RV32I-NEXT: mv s0, a2			; RV32I-NEXT: mv s0, a2
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; RV64IF-LABEL: fnmadd_s_2:			; RV64IF-LABEL: fnmadd_s_2:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fmv.w.x ft0, zero			; RV64IF-NEXT: fmv.w.x ft0, zero
	; RV64IF-NEXT: fadd.s ft1, fa1, ft0			; RV64IF-NEXT: fadd.s ft1, fa1, ft0
	; RV64IF-NEXT: fadd.s ft0, fa2, ft0			; RV64IF-NEXT: fadd.s ft0, fa2, ft0
	; RV64IF-NEXT: fnmadd.s fa0, ft1, fa0, ft0			; RV64IF-NEXT: fnmadd.s fa0, ft1, fa0, ft0
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fnmadd_s_2:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fadd.s a1, a1, zero
				; RV32IZFINX-NEXT: fadd.s a2, a2, zero
				; RV32IZFINX-NEXT: fnmadd.s a0, a1, a0, a2
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fnmadd_s_2:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fadd.s a1, a1, zero
				; RV64IZFINX-NEXT: fadd.s a2, a2, zero
				; RV64IZFINX-NEXT: fnmadd.s a0, a1, a0, a2
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fnmadd_s_2:			; RV32I-LABEL: fnmadd_s_2:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s2, 0(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s2, 0(sp) # 4-byte Folded Spill
	; RV32I-NEXT: mv s0, a2			; RV32I-NEXT: mv s0, a2
	▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
	;			;
	; RV64IF-LABEL: fnmsub_s:			; RV64IF-LABEL: fnmsub_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fmv.w.x ft0, zero			; RV64IF-NEXT: fmv.w.x ft0, zero
	; RV64IF-NEXT: fadd.s ft0, fa0, ft0			; RV64IF-NEXT: fadd.s ft0, fa0, ft0
	; RV64IF-NEXT: fnmsub.s fa0, ft0, fa1, fa2			; RV64IF-NEXT: fnmsub.s fa0, ft0, fa1, fa2
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fnmsub_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fadd.s a0, a0, zero
				; RV32IZFINX-NEXT: fnmsub.s a0, a0, a1, a2
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fnmsub_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fadd.s a0, a0, zero
				; RV64IZFINX-NEXT: fnmsub.s a0, a0, a1, a2
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fnmsub_s:			; RV32I-LABEL: fnmsub_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill
	; RV32I-NEXT: mv s0, a2			; RV32I-NEXT: mv s0, a2
	; RV32I-NEXT: mv s1, a1			; RV32I-NEXT: mv s1, a1
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	;			;
	; RV64IF-LABEL: fnmsub_s_2:			; RV64IF-LABEL: fnmsub_s_2:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fmv.w.x ft0, zero			; RV64IF-NEXT: fmv.w.x ft0, zero
	; RV64IF-NEXT: fadd.s ft0, fa1, ft0			; RV64IF-NEXT: fadd.s ft0, fa1, ft0
	; RV64IF-NEXT: fnmsub.s fa0, ft0, fa0, fa2			; RV64IF-NEXT: fnmsub.s fa0, ft0, fa0, fa2
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fnmsub_s_2:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fadd.s a1, a1, zero
				; RV32IZFINX-NEXT: fnmsub.s a0, a1, a0, a2
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fnmsub_s_2:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fadd.s a1, a1, zero
				; RV64IZFINX-NEXT: fnmsub.s a0, a1, a0, a2
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fnmsub_s_2:			; RV32I-LABEL: fnmsub_s_2:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill
	; RV32I-NEXT: mv s0, a2			; RV32I-NEXT: mv s0, a2
	; RV32I-NEXT: mv s1, a0			; RV32I-NEXT: mv s1, a0
	Show All 40 Lines

llvm/test/CodeGen/RISCV/float-arith.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=riscv32 -mattr=+f -verify-machineinstrs < %s \			; RUN: llc -mtriple=riscv32 -mattr=+f -verify-machineinstrs < %s \
	; RUN: -target-abi=ilp32f \| FileCheck -check-prefix=RV32IF %s			; RUN: -target-abi=ilp32f \| FileCheck -check-prefix=RV32IF %s
	; RUN: llc -mtriple=riscv64 -mattr=+f -verify-machineinstrs < %s \			; RUN: llc -mtriple=riscv64 -mattr=+f -verify-machineinstrs < %s \
	; RUN: -target-abi=lp64f \| FileCheck -check-prefix=RV64IF %s			; RUN: -target-abi=lp64f \| FileCheck -check-prefix=RV64IF %s
				; RUN: llc -mtriple=riscv32 -mattr=+zfinx -verify-machineinstrs < %s \
				; RUN: \| FileCheck -check-prefix=RV32IZFINX %s
				; RUN: llc -mtriple=riscv64 -mattr=+zfinx -verify-machineinstrs < %s \
				; RUN: \| FileCheck -check-prefix=RV64IZFINX %s
	; RUN: llc -mtriple=riscv32 -verify-machineinstrs < %s \			; RUN: llc -mtriple=riscv32 -verify-machineinstrs < %s \
	; RUN: \| FileCheck -check-prefix=RV32I %s			; RUN: \| FileCheck -check-prefix=RV32I %s
	; RUN: llc -mtriple=riscv64 -verify-machineinstrs < %s \			; RUN: llc -mtriple=riscv64 -verify-machineinstrs < %s \
	; RUN: \| FileCheck -check-prefix=RV64I %s			; RUN: \| FileCheck -check-prefix=RV64I %s

	; These tests are each targeted at a particular RISC-V FPU instruction.			; These tests are each targeted at a particular RISC-V FPU instruction.
	; Compares and conversions can be found in float-fcmp.ll and float-convert.ll			; Compares and conversions can be found in float-fcmp.ll and float-convert.ll
	; respectively. Some other float-*.ll files in this folder exercise LLVM IR			; respectively. Some other float-*.ll files in this folder exercise LLVM IR
	; instructions that don't directly match a RISC-V instruction.			; instructions that don't directly match a RISC-V instruction.

	define float @fadd_s(float %a, float %b) nounwind {			define float @fadd_s(float %a, float %b) nounwind {
	; RV32IF-LABEL: fadd_s:			; RV32IF-LABEL: fadd_s:
	; RV32IF: # %bb.0:			; RV32IF: # %bb.0:
	; RV32IF-NEXT: fadd.s fa0, fa0, fa1			; RV32IF-NEXT: fadd.s fa0, fa0, fa1
	; RV32IF-NEXT: ret			; RV32IF-NEXT: ret
	;			;
	; RV64IF-LABEL: fadd_s:			; RV64IF-LABEL: fadd_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fadd.s fa0, fa0, fa1			; RV64IF-NEXT: fadd.s fa0, fa0, fa1
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fadd_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fadd.s a0, a0, a1
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fadd_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fadd.s a0, a0, a1
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fadd_s:			; RV32I-LABEL: fadd_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: call __addsf3@plt			; RV32I-NEXT: call __addsf3@plt
	; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 16			; RV32I-NEXT: addi sp, sp, 16
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	Show All 16 Lines
	; RV32IF-NEXT: fsub.s fa0, fa0, fa1			; RV32IF-NEXT: fsub.s fa0, fa0, fa1
	; RV32IF-NEXT: ret			; RV32IF-NEXT: ret
	;			;
	; RV64IF-LABEL: fsub_s:			; RV64IF-LABEL: fsub_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fsub.s fa0, fa0, fa1			; RV64IF-NEXT: fsub.s fa0, fa0, fa1
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fsub_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fsub.s a0, a0, a1
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fsub_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fsub.s a0, a0, a1
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fsub_s:			; RV32I-LABEL: fsub_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: call __subsf3@plt			; RV32I-NEXT: call __subsf3@plt
	; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 16			; RV32I-NEXT: addi sp, sp, 16
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	Show All 16 Lines
	; RV32IF-NEXT: fmul.s fa0, fa0, fa1			; RV32IF-NEXT: fmul.s fa0, fa0, fa1
	; RV32IF-NEXT: ret			; RV32IF-NEXT: ret
	;			;
	; RV64IF-LABEL: fmul_s:			; RV64IF-LABEL: fmul_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fmul.s fa0, fa0, fa1			; RV64IF-NEXT: fmul.s fa0, fa0, fa1
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fmul_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fmul.s a0, a0, a1
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fmul_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fmul.s a0, a0, a1
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fmul_s:			; RV32I-LABEL: fmul_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: call __mulsf3@plt			; RV32I-NEXT: call __mulsf3@plt
	; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 16			; RV32I-NEXT: addi sp, sp, 16
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	Show All 16 Lines
	; RV32IF-NEXT: fdiv.s fa0, fa0, fa1			; RV32IF-NEXT: fdiv.s fa0, fa0, fa1
	; RV32IF-NEXT: ret			; RV32IF-NEXT: ret
	;			;
	; RV64IF-LABEL: fdiv_s:			; RV64IF-LABEL: fdiv_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fdiv.s fa0, fa0, fa1			; RV64IF-NEXT: fdiv.s fa0, fa0, fa1
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fdiv_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fdiv.s a0, a0, a1
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fdiv_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fdiv.s a0, a0, a1
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fdiv_s:			; RV32I-LABEL: fdiv_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: call __divsf3@plt			; RV32I-NEXT: call __divsf3@plt
	; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 16			; RV32I-NEXT: addi sp, sp, 16
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	Show All 18 Lines
	; RV32IF-NEXT: fsqrt.s fa0, fa0			; RV32IF-NEXT: fsqrt.s fa0, fa0
	; RV32IF-NEXT: ret			; RV32IF-NEXT: ret
	;			;
	; RV64IF-LABEL: fsqrt_s:			; RV64IF-LABEL: fsqrt_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fsqrt.s fa0, fa0			; RV64IF-NEXT: fsqrt.s fa0, fa0
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fsqrt_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fsqrt.s a0, a0
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fsqrt_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fsqrt.s a0, a0
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fsqrt_s:			; RV32I-LABEL: fsqrt_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: call sqrtf@plt			; RV32I-NEXT: call sqrtf@plt
	; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 16			; RV32I-NEXT: addi sp, sp, 16
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	Show All 18 Lines
	; RV32IF-NEXT: fsgnj.s fa0, fa0, fa1			; RV32IF-NEXT: fsgnj.s fa0, fa0, fa1
	; RV32IF-NEXT: ret			; RV32IF-NEXT: ret
	;			;
	; RV64IF-LABEL: fsgnj_s:			; RV64IF-LABEL: fsgnj_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fsgnj.s fa0, fa0, fa1			; RV64IF-NEXT: fsgnj.s fa0, fa0, fa1
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fsgnj_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fsgnj.s a0, a0, a1
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fsgnj_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fsgnj.s a0, a0, a1
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fsgnj_s:			; RV32I-LABEL: fsgnj_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: lui a2, 524288			; RV32I-NEXT: lui a2, 524288
	; RV32I-NEXT: and a1, a1, a2			; RV32I-NEXT: and a1, a1, a2
	; RV32I-NEXT: slli a0, a0, 1			; RV32I-NEXT: slli a0, a0, 1
	; RV32I-NEXT: srli a0, a0, 1			; RV32I-NEXT: srli a0, a0, 1
	; RV32I-NEXT: or a0, a0, a1			; RV32I-NEXT: or a0, a0, a1
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	Show All 22 Lines
	;			;
	; RV64IF-LABEL: fneg_s:			; RV64IF-LABEL: fneg_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fadd.s ft0, fa0, fa0			; RV64IF-NEXT: fadd.s ft0, fa0, fa0
	; RV64IF-NEXT: fneg.s ft1, ft0			; RV64IF-NEXT: fneg.s ft1, ft0
	; RV64IF-NEXT: feq.s a0, ft0, ft1			; RV64IF-NEXT: feq.s a0, ft0, ft1
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fneg_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fadd.s a0, a0, a0
				; RV32IZFINX-NEXT: fneg.s a1, a0
				; RV32IZFINX-NEXT: feq.s a0, a0, a1
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fneg_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fadd.s a0, a0, a0
				; RV64IZFINX-NEXT: fneg.s a1, a0
				; RV64IZFINX-NEXT: feq.s a0, a0, a1
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fneg_s:			; RV32I-LABEL: fneg_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: mv a1, a0			; RV32I-NEXT: mv a1, a0
	; RV32I-NEXT: call __addsf3@plt			; RV32I-NEXT: call __addsf3@plt
	; RV32I-NEXT: lui a1, 524288			; RV32I-NEXT: lui a1, 524288
	; RV32I-NEXT: xor a1, a0, a1			; RV32I-NEXT: xor a1, a0, a1
	Show All 33 Lines
	; RV32IF-NEXT: ret			; RV32IF-NEXT: ret
	;			;
	; RV64IF-LABEL: fsgnjn_s:			; RV64IF-LABEL: fsgnjn_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fadd.s ft0, fa0, fa1			; RV64IF-NEXT: fadd.s ft0, fa0, fa1
	; RV64IF-NEXT: fsgnjn.s fa0, fa0, ft0			; RV64IF-NEXT: fsgnjn.s fa0, fa0, ft0
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fsgnjn_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fadd.s a1, a0, a1
				; RV32IZFINX-NEXT: fsgnjn.s a0, a0, a1
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fsgnjn_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fadd.s a1, a0, a1
				; RV64IZFINX-NEXT: fsgnjn.s a0, a0, a1
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fsgnjn_s:			; RV32I-LABEL: fsgnjn_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill
	; RV32I-NEXT: mv s0, a0			; RV32I-NEXT: mv s0, a0
	; RV32I-NEXT: call __addsf3@plt			; RV32I-NEXT: call __addsf3@plt
	; RV32I-NEXT: not a0, a0			; RV32I-NEXT: not a0, a0
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	;			;
	; RV64IF-LABEL: fabs_s:			; RV64IF-LABEL: fabs_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fadd.s ft0, fa0, fa1			; RV64IF-NEXT: fadd.s ft0, fa0, fa1
	; RV64IF-NEXT: fabs.s ft1, ft0			; RV64IF-NEXT: fabs.s ft1, ft0
	; RV64IF-NEXT: fadd.s fa0, ft1, ft0			; RV64IF-NEXT: fadd.s fa0, ft1, ft0
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fabs_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fadd.s a0, a0, a1
				; RV32IZFINX-NEXT: fabs.s a1, a0
				; RV32IZFINX-NEXT: fadd.s a0, a1, a0
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fabs_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fadd.s a0, a0, a1
				; RV64IZFINX-NEXT: fabs.s a1, a0
				; RV64IZFINX-NEXT: fadd.s a0, a1, a0
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fabs_s:			; RV32I-LABEL: fabs_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: call __addsf3@plt			; RV32I-NEXT: call __addsf3@plt
	; RV32I-NEXT: mv a1, a0			; RV32I-NEXT: mv a1, a0
	; RV32I-NEXT: slli a0, a0, 1			; RV32I-NEXT: slli a0, a0, 1
	; RV32I-NEXT: srli a0, a0, 1			; RV32I-NEXT: srli a0, a0, 1
	Show All 28 Lines
	; RV32IF-NEXT: fmin.s fa0, fa0, fa1			; RV32IF-NEXT: fmin.s fa0, fa0, fa1
	; RV32IF-NEXT: ret			; RV32IF-NEXT: ret
	;			;
	; RV64IF-LABEL: fmin_s:			; RV64IF-LABEL: fmin_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fmin.s fa0, fa0, fa1			; RV64IF-NEXT: fmin.s fa0, fa0, fa1
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fmin_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fmin.s a0, a0, a1
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fmin_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fmin.s a0, a0, a1
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fmin_s:			; RV32I-LABEL: fmin_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: call fminf@plt			; RV32I-NEXT: call fminf@plt
	; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 16			; RV32I-NEXT: addi sp, sp, 16
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	Show All 18 Lines
	; RV32IF-NEXT: fmax.s fa0, fa0, fa1			; RV32IF-NEXT: fmax.s fa0, fa0, fa1
	; RV32IF-NEXT: ret			; RV32IF-NEXT: ret
	;			;
	; RV64IF-LABEL: fmax_s:			; RV64IF-LABEL: fmax_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fmax.s fa0, fa0, fa1			; RV64IF-NEXT: fmax.s fa0, fa0, fa1
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fmax_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fmax.s a0, a0, a1
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fmax_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fmax.s a0, a0, a1
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fmax_s:			; RV32I-LABEL: fmax_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: call fmaxf@plt			; RV32I-NEXT: call fmaxf@plt
	; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 16			; RV32I-NEXT: addi sp, sp, 16
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	Show All 18 Lines
	; RV32IF-NEXT: fmadd.s fa0, fa0, fa1, fa2			; RV32IF-NEXT: fmadd.s fa0, fa0, fa1, fa2
	; RV32IF-NEXT: ret			; RV32IF-NEXT: ret
	;			;
	; RV64IF-LABEL: fmadd_s:			; RV64IF-LABEL: fmadd_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fmadd.s fa0, fa0, fa1, fa2			; RV64IF-NEXT: fmadd.s fa0, fa0, fa1, fa2
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fmadd_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fmadd.s a0, a0, a1, a2
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fmadd_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fmadd.s a0, a0, a1, a2
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fmadd_s:			; RV32I-LABEL: fmadd_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: call fmaf@plt			; RV32I-NEXT: call fmaf@plt
	; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 16			; RV32I-NEXT: addi sp, sp, 16
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	Show All 20 Lines
	;			;
	; RV64IF-LABEL: fmsub_s:			; RV64IF-LABEL: fmsub_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fmv.w.x ft0, zero			; RV64IF-NEXT: fmv.w.x ft0, zero
	; RV64IF-NEXT: fadd.s ft0, fa2, ft0			; RV64IF-NEXT: fadd.s ft0, fa2, ft0
	; RV64IF-NEXT: fmsub.s fa0, fa0, fa1, ft0			; RV64IF-NEXT: fmsub.s fa0, fa0, fa1, ft0
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fmsub_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fadd.s a2, a2, zero
				; RV32IZFINX-NEXT: fmsub.s a0, a0, a1, a2
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fmsub_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fadd.s a2, a2, zero
				; RV64IZFINX-NEXT: fmsub.s a0, a0, a1, a2
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fmsub_s:			; RV32I-LABEL: fmsub_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill
	; RV32I-NEXT: mv s0, a1			; RV32I-NEXT: mv s0, a1
	; RV32I-NEXT: mv s1, a0			; RV32I-NEXT: mv s1, a0
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	; RV64IF-LABEL: fnmadd_s:			; RV64IF-LABEL: fnmadd_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fmv.w.x ft0, zero			; RV64IF-NEXT: fmv.w.x ft0, zero
	; RV64IF-NEXT: fadd.s ft1, fa0, ft0			; RV64IF-NEXT: fadd.s ft1, fa0, ft0
	; RV64IF-NEXT: fadd.s ft0, fa2, ft0			; RV64IF-NEXT: fadd.s ft0, fa2, ft0
	; RV64IF-NEXT: fnmadd.s fa0, ft1, fa1, ft0			; RV64IF-NEXT: fnmadd.s fa0, ft1, fa1, ft0
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fnmadd_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fadd.s a0, a0, zero
				; RV32IZFINX-NEXT: fadd.s a2, a2, zero
				; RV32IZFINX-NEXT: fnmadd.s a0, a0, a1, a2
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fnmadd_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fadd.s a0, a0, zero
				; RV64IZFINX-NEXT: fadd.s a2, a2, zero
				; RV64IZFINX-NEXT: fnmadd.s a0, a0, a1, a2
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fnmadd_s:			; RV32I-LABEL: fnmadd_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s2, 0(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s2, 0(sp) # 4-byte Folded Spill
	; RV32I-NEXT: mv s0, a2			; RV32I-NEXT: mv s0, a2
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; RV64IF-LABEL: fnmadd_s_2:			; RV64IF-LABEL: fnmadd_s_2:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fmv.w.x ft0, zero			; RV64IF-NEXT: fmv.w.x ft0, zero
	; RV64IF-NEXT: fadd.s ft1, fa1, ft0			; RV64IF-NEXT: fadd.s ft1, fa1, ft0
	; RV64IF-NEXT: fadd.s ft0, fa2, ft0			; RV64IF-NEXT: fadd.s ft0, fa2, ft0
	; RV64IF-NEXT: fnmadd.s fa0, ft1, fa0, ft0			; RV64IF-NEXT: fnmadd.s fa0, ft1, fa0, ft0
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fnmadd_s_2:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fadd.s a1, a1, zero
				; RV32IZFINX-NEXT: fadd.s a2, a2, zero
				; RV32IZFINX-NEXT: fnmadd.s a0, a1, a0, a2
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fnmadd_s_2:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fadd.s a1, a1, zero
				; RV64IZFINX-NEXT: fadd.s a2, a2, zero
				; RV64IZFINX-NEXT: fnmadd.s a0, a1, a0, a2
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fnmadd_s_2:			; RV32I-LABEL: fnmadd_s_2:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s2, 0(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s2, 0(sp) # 4-byte Folded Spill
	; RV32I-NEXT: mv s0, a2			; RV32I-NEXT: mv s0, a2
	▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
	;			;
	; RV64IF-LABEL: fnmsub_s:			; RV64IF-LABEL: fnmsub_s:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fmv.w.x ft0, zero			; RV64IF-NEXT: fmv.w.x ft0, zero
	; RV64IF-NEXT: fadd.s ft0, fa0, ft0			; RV64IF-NEXT: fadd.s ft0, fa0, ft0
	; RV64IF-NEXT: fnmsub.s fa0, ft0, fa1, fa2			; RV64IF-NEXT: fnmsub.s fa0, ft0, fa1, fa2
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fnmsub_s:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fadd.s a0, a0, zero
				; RV32IZFINX-NEXT: fnmsub.s a0, a0, a1, a2
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fnmsub_s:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fadd.s a0, a0, zero
				; RV64IZFINX-NEXT: fnmsub.s a0, a0, a1, a2
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fnmsub_s:			; RV32I-LABEL: fnmsub_s:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill
	; RV32I-NEXT: mv s0, a2			; RV32I-NEXT: mv s0, a2
	; RV32I-NEXT: mv s1, a1			; RV32I-NEXT: mv s1, a1
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	;			;
	; RV64IF-LABEL: fnmsub_s_2:			; RV64IF-LABEL: fnmsub_s_2:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fmv.w.x ft0, zero			; RV64IF-NEXT: fmv.w.x ft0, zero
	; RV64IF-NEXT: fadd.s ft0, fa1, ft0			; RV64IF-NEXT: fadd.s ft0, fa1, ft0
	; RV64IF-NEXT: fnmsub.s fa0, ft0, fa0, fa2			; RV64IF-NEXT: fnmsub.s fa0, ft0, fa0, fa2
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fnmsub_s_2:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fadd.s a1, a1, zero
				; RV32IZFINX-NEXT: fnmsub.s a0, a1, a0, a2
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fnmsub_s_2:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fadd.s a1, a1, zero
				; RV64IZFINX-NEXT: fnmsub.s a0, a1, a0, a2
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fnmsub_s_2:			; RV32I-LABEL: fnmsub_s_2:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill
	; RV32I-NEXT: mv s0, a2			; RV32I-NEXT: mv s0, a2
	; RV32I-NEXT: mv s1, a0			; RV32I-NEXT: mv s1, a0
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; RV32IF-NEXT: fmadd.s fa0, fa0, fa1, fa2			; RV32IF-NEXT: fmadd.s fa0, fa0, fa1, fa2
	; RV32IF-NEXT: ret			; RV32IF-NEXT: ret
	;			;
	; RV64IF-LABEL: fmadd_s_contract:			; RV64IF-LABEL: fmadd_s_contract:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fmadd.s fa0, fa0, fa1, fa2			; RV64IF-NEXT: fmadd.s fa0, fa0, fa1, fa2
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fmadd_s_contract:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fmadd.s a0, a0, a1, a2
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fmadd_s_contract:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fmadd.s a0, a0, a1, a2
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fmadd_s_contract:			; RV32I-LABEL: fmadd_s_contract:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill
	; RV32I-NEXT: mv s0, a2			; RV32I-NEXT: mv s0, a2
	; RV32I-NEXT: call __mulsf3@plt			; RV32I-NEXT: call __mulsf3@plt
	; RV32I-NEXT: mv a1, s0			; RV32I-NEXT: mv a1, s0
	Show All 31 Lines
	;			;
	; RV64IF-LABEL: fmsub_s_contract:			; RV64IF-LABEL: fmsub_s_contract:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fmv.w.x ft0, zero			; RV64IF-NEXT: fmv.w.x ft0, zero
	; RV64IF-NEXT: fadd.s ft0, fa2, ft0			; RV64IF-NEXT: fadd.s ft0, fa2, ft0
	; RV64IF-NEXT: fmsub.s fa0, fa0, fa1, ft0			; RV64IF-NEXT: fmsub.s fa0, fa0, fa1, ft0
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fmsub_s_contract:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fadd.s a2, a2, zero
				; RV32IZFINX-NEXT: fmsub.s a0, a0, a1, a2
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fmsub_s_contract:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fadd.s a2, a2, zero
				; RV64IZFINX-NEXT: fmsub.s a0, a0, a1, a2
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fmsub_s_contract:			; RV32I-LABEL: fmsub_s_contract:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s2, 0(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s2, 0(sp) # 4-byte Folded Spill
	; RV32I-NEXT: mv s0, a1			; RV32I-NEXT: mv s0, a1
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fmv.w.x ft0, zero			; RV64IF-NEXT: fmv.w.x ft0, zero
	; RV64IF-NEXT: fadd.s ft1, fa0, ft0			; RV64IF-NEXT: fadd.s ft1, fa0, ft0
	; RV64IF-NEXT: fadd.s ft2, fa1, ft0			; RV64IF-NEXT: fadd.s ft2, fa1, ft0
	; RV64IF-NEXT: fadd.s ft0, fa2, ft0			; RV64IF-NEXT: fadd.s ft0, fa2, ft0
	; RV64IF-NEXT: fnmadd.s fa0, ft1, ft2, ft0			; RV64IF-NEXT: fnmadd.s fa0, ft1, ft2, ft0
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fnmadd_s_contract:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fadd.s a0, a0, zero
				; RV32IZFINX-NEXT: fadd.s a1, a1, zero
				; RV32IZFINX-NEXT: fadd.s a2, a2, zero
				; RV32IZFINX-NEXT: fnmadd.s a0, a0, a1, a2
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fnmadd_s_contract:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fadd.s a0, a0, zero
				; RV64IZFINX-NEXT: fadd.s a1, a1, zero
				; RV64IZFINX-NEXT: fadd.s a2, a2, zero
				; RV64IZFINX-NEXT: fnmadd.s a0, a0, a1, a2
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fnmadd_s_contract:			; RV32I-LABEL: fnmadd_s_contract:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s2, 0(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s2, 0(sp) # 4-byte Folded Spill
	; RV32I-NEXT: mv s0, a2			; RV32I-NEXT: mv s0, a2
	▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
	; RV64IF-LABEL: fnmsub_s_contract:			; RV64IF-LABEL: fnmsub_s_contract:
	; RV64IF: # %bb.0:			; RV64IF: # %bb.0:
	; RV64IF-NEXT: fmv.w.x ft0, zero			; RV64IF-NEXT: fmv.w.x ft0, zero
	; RV64IF-NEXT: fadd.s ft1, fa0, ft0			; RV64IF-NEXT: fadd.s ft1, fa0, ft0
	; RV64IF-NEXT: fadd.s ft0, fa1, ft0			; RV64IF-NEXT: fadd.s ft0, fa1, ft0
	; RV64IF-NEXT: fnmsub.s fa0, ft1, ft0, fa2			; RV64IF-NEXT: fnmsub.s fa0, ft1, ft0, fa2
	; RV64IF-NEXT: ret			; RV64IF-NEXT: ret
	;			;
				; RV32IZFINX-LABEL: fnmsub_s_contract:
				; RV32IZFINX: # %bb.0:
				; RV32IZFINX-NEXT: fadd.s a0, a0, zero
				; RV32IZFINX-NEXT: fadd.s a1, a1, zero
				; RV32IZFINX-NEXT: fnmsub.s a0, a0, a1, a2
				; RV32IZFINX-NEXT: ret
				;
				; RV64IZFINX-LABEL: fnmsub_s_contract:
				; RV64IZFINX: # %bb.0:
				; RV64IZFINX-NEXT: fadd.s a0, a0, zero
				; RV64IZFINX-NEXT: fadd.s a1, a1, zero
				; RV64IZFINX-NEXT: fnmsub.s a0, a0, a1, a2
				; RV64IZFINX-NEXT: ret
				;
	; RV32I-LABEL: fnmsub_s_contract:			; RV32I-LABEL: fnmsub_s_contract:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -16			; RV32I-NEXT: addi sp, sp, -16
	; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s0, 8(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s1, 4(sp) # 4-byte Folded Spill
	; RV32I-NEXT: sw s2, 0(sp) # 4-byte Folded Spill			; RV32I-NEXT: sw s2, 0(sp) # 4-byte Folded Spill
	; RV32I-NEXT: mv s0, a2			; RV32I-NEXT: mv s0, a2
	▲ Show 20 Lines • Show All 53 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV][CodeGen] Support Zfinx,Zdinx,Zhinx,Zhinxmin codegenAbandonedPublic

Details

Diff Detail

Unit TestsFailed

Event Timeline

Revision Contents

Diff 420063

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

llvm/lib/Target/RISCV/RISCVInstrInfoF.td

llvm/test/CodeGen/RISCV/float-arith-strict.ll

llvm/test/CodeGen/RISCV/float-arith.ll

[RISCV][CodeGen] Support Zfinx,Zdinx,Zhinx,Zhinxmin codegen
AbandonedPublic