Index: llvm/lib/Target/RISCV/RISCVISelLowering.h
===================================================================
--- llvm/lib/Target/RISCV/RISCVISelLowering.h
+++ llvm/lib/Target/RISCV/RISCVISelLowering.h
@@ -111,6 +111,18 @@
   // is passed as a TargetConstant operand using the RISCVFPRndMode enum.
   FCVT_W_RV64,
   FCVT_WU_RV64,
+  // FP to XLen int conversions. Corresponds to fcvt.l(u).s/d/h on RV64 and
+  // fcvt.w(u).s/d/h on RV32. Unlike FP_TO_S/UINT these saturate out of
+  // range inputs. These are used for FP_TO_S/UINT_SAT lowering. Rounding mode
+  // is passed as a TargetConstant operand using the RISCVFPRndMode enum.
+  FCVTMOD_X,
+  FCVTMOD_XU,
+  // FP to 32 bit int conversions for RV64. These are used to keep track of the
+  // result being sign extended to 64 bit. These saturate out of range inputs.
+  // Used for FP_TO_S/UINT and FP_TO_S/UINT_SAT lowering. Rounding mode
+  // is passed as a TargetConstant operand using the RISCVFPRndMode enum.
+  FCVTMOD_W_RV64,
+  FCVTMOD_WU_RV64,
 
   // Rounds an FP value to its corresponding integer in the same FP format.
   // First operand is the value to round, the second operand is the largest
Index: llvm/lib/Target/RISCV/RISCVISelLowering.cpp
===================================================================
--- llvm/lib/Target/RISCV/RISCVISelLowering.cpp
+++ llvm/lib/Target/RISCV/RISCVISelLowering.cpp
@@ -336,7 +336,8 @@
   if (Subtarget.hasStdExtZfhOrZfhmin()) {
     if (Subtarget.hasStdExtZfh()) {
       setOperationAction(FPLegalNodeTypes, MVT::f16, Legal);
-      setOperationAction(FPRndMode, MVT::f16, Custom);
+      setOperationAction(FPRndMode, MVT::f16, 
+                         Subtarget.hasStdExtZfa() ? Legal : Custom);
       setOperationAction(ISD::SELECT, MVT::f16, Custom);
     } else {
       static const unsigned ZfhminPromoteOps[] = {
@@ -365,7 +366,9 @@
     setOperationAction(ISD::SELECT_CC, MVT::f16, Expand);
     setOperationAction(ISD::BR_CC, MVT::f16, Expand);
 
-    setOperationAction({ISD::FREM, ISD::FNEARBYINT, ISD::FPOW, ISD::FPOWI,
+    setOperationAction(ISD::FNEARBYINT, MVT::f16, 
+                       Subtarget.hasStdExtZfa() ? Legal : Promote);
+    setOperationAction({ISD::FREM, ISD::FPOW, ISD::FPOWI,
                         ISD::FCOS, ISD::FSIN, ISD::FSINCOS, ISD::FEXP,
                         ISD::FEXP2, ISD::FLOG, ISD::FLOG2, ISD::FLOG10},
                        MVT::f16, Promote);
@@ -385,7 +388,8 @@
 
   if (Subtarget.hasStdExtF()) {
     setOperationAction(FPLegalNodeTypes, MVT::f32, Legal);
-    setOperationAction(FPRndMode, MVT::f32, Custom);
+    setOperationAction(FPRndMode, MVT::f32, 
+                       Subtarget.hasStdExtZfa() ? Legal : Custom);
     setCondCodeAction(FPCCToExpand, MVT::f32, Expand);
     setOperationAction(ISD::SELECT_CC, MVT::f32, Expand);
     setOperationAction(ISD::SELECT, MVT::f32, Custom);
@@ -393,6 +397,9 @@
     setOperationAction(FPOpToExpand, MVT::f32, Expand);
     setLoadExtAction(ISD::EXTLOAD, MVT::f32, MVT::f16, Expand);
     setTruncStoreAction(MVT::f32, MVT::f16, Expand);
+
+    if (Subtarget.hasStdExtZfa())
+      setOperationAction(ISD::FNEARBYINT, MVT::f32, Legal);
   }
 
   if (Subtarget.hasStdExtF() && Subtarget.is64Bit())
@@ -400,9 +407,18 @@
 
   if (Subtarget.hasStdExtD()) {
     setOperationAction(FPLegalNodeTypes, MVT::f64, Legal);
-    if (Subtarget.is64Bit()) {
-      setOperationAction(FPRndMode, MVT::f64, Custom);
+
+    if (Subtarget.hasStdExtZfa()) {
+      setOperationAction(FPRndMode, MVT::f64, Legal);
+      setOperationAction(ISD::FNEARBYINT, MVT::f64, Legal);
+      setOperationAction(ISD::BITCAST, MVT::i64, Custom);
+      setOperationAction(ISD::BITCAST, MVT::f64, Custom);
     }
+
+    if (Subtarget.is64Bit())
+      setOperationAction(FPRndMode, MVT::f64, 
+                         Subtarget.hasStdExtZfa() ? Legal : Custom);
+
     setOperationAction(ISD::STRICT_FP_ROUND, MVT::f32, Legal);
     setOperationAction(ISD::STRICT_FP_EXTEND, MVT::f64, Legal);
     setCondCodeAction(FPCCToExpand, MVT::f64, Expand);
@@ -1456,6 +1472,18 @@
     return false;
   if (VT == MVT::f64 && !Subtarget.hasStdExtD())
     return false;
+
+  if (Subtarget.hasStdExtZfa()) {
+    if (VT == MVT::f32 && RISCVLoadFPImm::getLoadFP32Imm(Imm) == -1)
+      return false;
+    if (VT == MVT::f64 && RISCVLoadFPImm::getLoadFP64Imm(Imm) == -1)
+      return false;
+    if (VT == MVT::f16 && RISCVLoadFPImm::getLoadFP16Imm(Imm) == -1)
+      return false;
+    
+    return true;
+  }
+
   return Imm.isZero();
 }
 
@@ -1970,6 +1998,18 @@
     }
 
     unsigned Opc;
+    SDLoc DL(Op);
+    if (Subtarget.hasStdExtZfa()) {
+      if (SatVT == DstVT)
+        Opc = IsSigned ? RISCVISD::FCVTMOD_X : RISCVISD::FCVTMOD_XU;
+      else if (DstVT == MVT::i64 && SatVT == MVT::i32)
+        Opc = IsSigned ? RISCVISD::FCVTMOD_W_RV64 : RISCVISD::FCVTMOD_WU_RV64;
+      else
+        return SDValue();
+
+      return DAG.getNode(Opc, DL, DstVT, Src);
+    }
+
     if (SatVT == DstVT)
       Opc = IsSigned ? RISCVISD::FCVT_X : RISCVISD::FCVT_XU;
     else if (DstVT == MVT::i64 && SatVT == MVT::i32)
@@ -1978,7 +2018,6 @@
       return SDValue();
     // FIXME: Support other SatVTs by clamping before or after the conversion.
 
-    SDLoc DL(Op);
     SDValue FpToInt = DAG.getNode(
         Opc, DL, DstVT, Src,
         DAG.getTargetConstant(RISCVFPRndMode::RTZ, DL, Subtarget.getXLenVT()));
@@ -3771,6 +3810,15 @@
           DAG.getNode(RISCVISD::FMV_W_X_RV64, DL, MVT::f32, NewOp0);
       return FPConv;
     }
+    if (VT == MVT::f64 && Op0VT == MVT::i64 && XLenVT == MVT::i32) {
+      SDValue Lo = DAG.getNode(ISD::EXTRACT_ELEMENT, DL, MVT::i32, Op0,
+                               DAG.getConstant(0, DL, MVT::i32));
+      SDValue Hi = DAG.getNode(ISD::EXTRACT_ELEMENT, DL, MVT::i32, Op0,
+                               DAG.getConstant(1, DL, MVT::i32));
+      SDValue RetReg =
+          DAG.getNode(RISCVISD::BuildPairF64, DL, MVT::f64, Lo, Hi);
+      return RetReg;
+    }
 
     // Consider other scalar<->scalar casts as legal if the types are legal.
     // Otherwise expand them.
@@ -7979,6 +8027,13 @@
       SDValue FPConv =
           DAG.getNode(RISCVISD::FMV_X_ANYEXTW_RV64, DL, MVT::i64, Op0);
       Results.push_back(DAG.getNode(ISD::TRUNCATE, DL, MVT::i32, FPConv));
+    } else if (VT == MVT::i64 && Op0VT == MVT::f64 && XLenVT == MVT::i32) {
+        SDValue NewReg = DAG.getNode(RISCVISD::SplitF64, DL,
+                                     DAG.getVTList(MVT::i32, MVT::i32), Op0);
+        SDValue Lo = NewReg.getValue(0);
+        SDValue Hi = NewReg.getValue(1);
+        SDValue RetReg = DAG.getNode(ISD::BUILD_PAIR, DL, MVT::i64, Lo, Hi);
+        Results.push_back(RetReg);
     } else if (!VT.isVector() && Op0VT.isFixedLengthVector() &&
                isTypeLegal(Op0VT)) {
       // Custom-legalize bitcasts from fixed-length vector types to illegal
@@ -11085,7 +11140,8 @@
 }
 
 static MachineBasicBlock *emitSplitF64Pseudo(MachineInstr &MI,
-                                             MachineBasicBlock *BB) {
+                                             MachineBasicBlock *BB,
+                                             const RISCVSubtarget &Subtarget) {
   assert(MI.getOpcode() == RISCV::SplitF64Pseudo && "Unexpected instruction");
 
   MachineFunction &MF = *BB->getParent();
@@ -11095,6 +11151,13 @@
   Register LoReg = MI.getOperand(0).getReg();
   Register HiReg = MI.getOperand(1).getReg();
   Register SrcReg = MI.getOperand(2).getReg();
+  if (Subtarget.hasStdExtD() && Subtarget.hasStdExtZfa() && !Subtarget.is64Bit()) {
+    BuildMI(*BB, MI, DL, TII.get(RISCV::FMVH_X_W), LoReg).addReg(SrcReg);
+    BuildMI(*BB, MI, DL, TII.get(RISCV::FMVH_X_D), HiReg).addReg(SrcReg);
+    MI.eraseFromParent(); // The pseudo instruction is gone now.
+    return BB;
+  }
+
   const TargetRegisterClass *SrcRC = &RISCV::FPR64RegClass;
   int FI = MF.getInfo<RISCVMachineFunctionInfo>()->getMoveF64FrameIndex(MF);
 
@@ -11118,7 +11181,8 @@
 }
 
 static MachineBasicBlock *emitBuildPairF64Pseudo(MachineInstr &MI,
-                                                 MachineBasicBlock *BB) {
+                                                 MachineBasicBlock *BB,
+                                                 const RISCVSubtarget &Subtarget) {
   assert(MI.getOpcode() == RISCV::BuildPairF64Pseudo &&
          "Unexpected instruction");
 
@@ -11129,6 +11193,14 @@
   Register DstReg = MI.getOperand(0).getReg();
   Register LoReg = MI.getOperand(1).getReg();
   Register HiReg = MI.getOperand(2).getReg();
+  if (Subtarget.hasStdExtD() && Subtarget.hasStdExtZfa() && !Subtarget.is64Bit()) {
+    BuildMI(*BB, MI, DL, TII.get(RISCV::FMVP_D_X), DstReg)
+        .addReg(LoReg)
+        .addReg(HiReg);
+    MI.eraseFromParent();
+    return BB;
+  }
+
   const TargetRegisterClass *DstRC = &RISCV::FPR64RegClass;
   int FI = MF.getInfo<RISCVMachineFunctionInfo>()->getMoveF64FrameIndex(MF);
 
@@ -11644,9 +11716,9 @@
   case RISCV::Select_FPR64_Using_CC_GPR:
     return emitSelectPseudo(MI, BB, Subtarget);
   case RISCV::BuildPairF64Pseudo:
-    return emitBuildPairF64Pseudo(MI, BB);
+    return emitBuildPairF64Pseudo(MI, BB,Subtarget);
   case RISCV::SplitF64Pseudo:
-    return emitSplitF64Pseudo(MI, BB);
+    return emitSplitF64Pseudo(MI, BB, Subtarget);
   case RISCV::PseudoQuietFLE_H:
     return emitQuietFCMP(MI, BB, RISCV::FLE_H, RISCV::FEQ_H, Subtarget);
   case RISCV::PseudoQuietFLT_H:
@@ -13338,6 +13410,10 @@
   NODE_NAME_CASE(FCVT_XU)
   NODE_NAME_CASE(FCVT_W_RV64)
   NODE_NAME_CASE(FCVT_WU_RV64)
+  NODE_NAME_CASE(FCVTMOD_X)
+  NODE_NAME_CASE(FCVTMOD_XU)
+  NODE_NAME_CASE(FCVTMOD_W_RV64)
+  NODE_NAME_CASE(FCVTMOD_WU_RV64)
   NODE_NAME_CASE(STRICT_FCVT_W_RV64)
   NODE_NAME_CASE(STRICT_FCVT_WU_RV64)
   NODE_NAME_CASE(FROUND)
Index: llvm/lib/Target/RISCV/RISCVInstrInfoZfa.td
===================================================================
--- llvm/lib/Target/RISCV/RISCVInstrInfoZfa.td
+++ llvm/lib/Target/RISCV/RISCVInstrInfoZfa.td
@@ -13,6 +13,24 @@
 //
 //===----------------------------------------------------------------------===//
 
+//===----------------------------------------------------------------------===//
+// RISC-V specific DAG Nodes.
+//===----------------------------------------------------------------------===//
+
+def SDT_RISCVFCVTMOD_W_RV64
+    : SDTypeProfile<1, 1, [SDTCisVT<0, i64>, SDTCisFP<1>]>;
+def SDT_RISCVFCVTMOD_X
+    : SDTypeProfile<1, 1, [SDTCisVT<0, XLenVT>, SDTCisFP<1>]>;
+
+def riscv_fcvtmod_x
+    : SDNode<"RISCVISD::FCVTMOD_X", SDT_RISCVFCVTMOD_X>;
+def riscv_fcvtmod_xu
+    : SDNode<"RISCVISD::FCVTMOD_XU", SDT_RISCVFCVTMOD_X>;
+def riscv_fcvtmod_w_rv64
+    : SDNode<"RISCVISD::FCVTMOD_W_RV64", SDT_RISCVFCVTMOD_W_RV64>;
+def riscv_fcvtmod_wu_rv64
+    : SDNode<"RISCVISD::FCVTMOD_WU_RV64", SDT_RISCVFCVTMOD_W_RV64>;
+
 //===----------------------------------------------------------------------===//
 // Operand and SDNode transformation definitions.
 //===----------------------------------------------------------------------===//
@@ -126,10 +144,14 @@
 } // Predicates = [HasStdExtZfa, HasStdExtD]
 
 let Predicates = [HasStdExtZfa, HasStdExtD, IsRV32] in {
-def FMVH_X_D : FPUnaryOp_r<0b1110001, 0b00001, 0b000, GPR, FPR64, "fmvh.x.d">,
-               Sched<[WriteFMovF32ToI32, ReadFMovF32ToI32]>;
-def FMVP_D_X : FPBinaryOp_rr<0b1011001, 0b000, FPR64, GPR, "fmvp.d.x">,
-               Sched<[WriteFMovI32ToF32, ReadFMovI32ToF32]>;
+  def FMVH_X_D : FPUnaryOp_r<0b1110001, 0b00001, 0b000, GPR, FPR64, "fmvh.x.d">,
+                 Sched<[WriteFMovF32ToI32, ReadFMovF32ToI32]>;
+  def FMVP_D_X : FPBinaryOp_rr<0b1011001, 0b000, FPR64, GPR, "fmvp.d.x">,
+                 Sched<[WriteFMovI32ToF32, ReadFMovI32ToF32]>;
+  let isCodeGenOnly = 1, mayRaiseFPException = 0 in {
+    def FMVH_X_W : FPUnaryOp_r<0b1110000, 0b00000, 0b000, GPR, FPR64, "fmv.x.w">,
+            Sched<[WriteFMovF32ToI32, ReadFMovF32ToI32]>;
+  }
 } // Predicates = [HasStdExtZfa, HasStdExtD, IsRV32]
 
 let Predicates = [HasStdExtZfa, HasStdExtZfh] in {
@@ -146,3 +168,110 @@
 def FLTQ_H : FPCmp_rr<0b1010010, 0b101, "fltq.h", FPR16, /*Commutable*/ 1>;
 def FLEQ_H : FPCmp_rr<0b1010010, 0b100, "fleq.h", FPR16, /*Commutable*/ 1>;
 } // Predicates = [HasStdExtZfa, HasStdExtZfh]
+
+
+//===----------------------------------------------------------------------===//
+// Codegen patterns
+//===----------------------------------------------------------------------===//
+
+def bitcast_fp32imm_to_loadfpimm : SDNodeXForm<fpimm, [{
+  return CurDAG->getTargetConstant(RISCVLoadFPImm::getLoadFP32Imm(N->getValueAPF()), 
+                                   SDLoc(N), Subtarget->getXLenVT());}]>;
+
+def bitcast_fp64imm_to_loadfpimm : SDNodeXForm<fpimm, [{
+  return CurDAG->getTargetConstant(RISCVLoadFPImm::getLoadFP64Imm(N->getValueAPF()), 
+                                   SDLoc(N), Subtarget->getXLenVT());}]>;
+
+def bitcast_fp16imm_to_loadfpimm : SDNodeXForm<fpimm, [{
+  return CurDAG->getTargetConstant(RISCVLoadFPImm::getLoadFP16Imm(N->getValueAPF()), 
+                                   SDLoc(N), Subtarget->getXLenVT());}]>;
+
+let Predicates = [HasStdExtZfa] in {
+def : Pat<(f32 fpimm:$imm),
+  (COPY_TO_REGCLASS (FLI_S (bitcast_fp32imm_to_loadfpimm fpimm:$imm)), FPR32)>;
+
+def: PatFprFpr<fminimum, FMINM_S, FPR32>;
+def: PatFprFpr<fmaximum, FMAXM_S, FPR32>;
+
+// frint rounds according to the current rounding mode and detects
+// inexact conditions.
+def: Pat<(any_frint FPR32 : $rs1), (FROUNDNX_S FPR32 : $rs1, 0b111)>;
+
+// fnearbyint is like frint but does not detect inexact conditions.
+def: Pat<(any_fnearbyint FPR32 : $rs1), (FROUND_S FPR32 : $rs1, 0b111)>;
+
+def: Pat<(any_fround FPR32 : $rs1), (FROUND_S FPR32 : $rs1, 0b100)>;
+def: Pat<(any_ffloor FPR32 : $rs1), (FROUND_S FPR32 : $rs1, 0b011)>;
+def: Pat<(any_fceil FPR32 : $rs1), (FROUND_S FPR32 : $rs1, 0b010)>;
+def: Pat<(any_ftrunc FPR32 : $rs1), (FROUND_S FPR32 : $rs1, 0b001)>;
+
+def: PatSetCC<FPR32, strict_fsetcc, SETLT, FLTQ_S>;
+def: PatSetCC<FPR32, strict_fsetcc, SETOLT, FLTQ_S>;
+def: PatSetCC<FPR32, strict_fsetcc, SETLE, FLEQ_S>;
+def: PatSetCC<FPR32, strict_fsetcc, SETOLE, FLEQ_S>;
+} // Predicates = [HasStdExtZfa]
+
+let Predicates = [HasStdExtZfa, HasStdExtD] in {
+def : Pat<(f64 fpimm:$imm),
+  (COPY_TO_REGCLASS (FLI_D (bitcast_fp64imm_to_loadfpimm fpimm:$imm)), FPR64)>;
+
+def: PatFprFpr<fminimum, FMINM_D, FPR64>;
+def: PatFprFpr<fmaximum, FMAXM_D, FPR64>;
+
+// frint rounds according to the current rounding mode and detects
+// inexact conditions.
+def: Pat<(any_frint FPR64 : $rs1), (FROUNDNX_D FPR64 : $rs1, 0b111)>;
+
+// fnearbyint is like frint but does not detect inexact conditions.
+def: Pat<(any_fnearbyint FPR64 : $rs1), (FROUND_D FPR64 : $rs1, 0b111)>;
+
+def: Pat<(any_fround FPR64 : $rs1), (FROUND_D FPR64 : $rs1, 0b100)>;
+def: Pat<(any_froundeven FPR64 : $rs1), (FROUND_D FPR64 : $rs1, 0b000)>;
+def: Pat<(any_ffloor FPR64 : $rs1), (FROUND_D FPR64 : $rs1, 0b011)>;
+def: Pat<(any_fceil FPR64 : $rs1), (FROUND_D FPR64 : $rs1, 0b010)>;
+def: Pat<(any_ftrunc FPR64 : $rs1), (FROUND_D FPR64 : $rs1, 0b001)>;
+
+def: PatSetCC<FPR64, strict_fsetcc, SETLT, FLTQ_D>;
+def: PatSetCC<FPR64, strict_fsetcc, SETOLT, FLTQ_D>;
+def: PatSetCC<FPR64, strict_fsetcc, SETLE, FLEQ_D>;
+def: PatSetCC<FPR64, strict_fsetcc, SETOLE, FLEQ_D>;
+} // Predicates = [HasStdExtZfa, HasStdExtD]
+
+let Predicates = [HasStdExtZfa, HasStdExtD, IsRV32] in {
+def: Pat<(i32 (riscv_fcvtmod_x FPR64: $rs1)), (FCVTMOD_W_D $rs1, 0b001)>;
+def: Pat<(i32 (riscv_fcvtmod_xu FPR64: $rs1)), (FCVTMOD_W_D $rs1, 0b001)>;
+} // Predicates = [HasStdExtZfa, HasStdExtD, IsRV32]
+
+let Predicates = [HasStdExtZfa, HasStdExtD, IsRV64] in {
+def: Pat<(riscv_fcvtmod_w_rv64 FPR64: $rs1), (FCVTMOD_W_D $rs1, 0b001)>;
+def: Pat<(riscv_fcvtmod_wu_rv64 FPR64: $rs1), (FCVTMOD_W_D $rs1, 0b001)>;
+
+def: Pat<(i64(riscv_fcvtmod_x FPR64: $rs1)), (FCVTMOD_W_D $rs1, 0b001)>;
+def: Pat<(i64(riscv_fcvtmod_xu FPR64: $rs1)), (FCVTMOD_W_D $rs1, 0b001)>;
+} // Predicates = [HasStdExtZfa, HasStdExtD, IsRV64]
+
+let Predicates = [HasStdExtZfa, HasStdExtZfh] in {
+def : Pat<(f16 fpimm:$imm),
+  (COPY_TO_REGCLASS (FLI_H (bitcast_fp16imm_to_loadfpimm fpimm:$imm)), FPR16)>;
+
+def: PatFprFpr<fminimum, FMINM_H, FPR16>;
+def: PatFprFpr<fmaximum, FMAXM_H, FPR16>;
+
+// frint rounds according to the current rounding mode and detects
+// inexact conditions.
+def: Pat<(any_frint FPR16 : $rs1), (FROUNDNX_H FPR16 : $rs1, 0b111)>;
+
+// fnearbyint is like frint but does not detect inexact conditions.
+def: Pat<(any_fnearbyint FPR16 : $rs1), (FROUND_H FPR16 : $rs1, 0b111)>;
+
+def: Pat<(any_fround FPR16 : $rs1), (FROUND_H FPR16 : $rs1, 0b100)>;
+def: Pat<(any_froundeven FPR16 : $rs1), (FROUND_H FPR16 : $rs1, 0b000)>;
+def: Pat<(any_ffloor FPR16 : $rs1), (FROUND_H FPR16 : $rs1, 0b011)>;
+def: Pat<(any_fceil FPR16 : $rs1), (FROUND_H FPR16 : $rs1, 0b010)>;
+def: Pat<(any_ftrunc FPR16 : $rs1), (FROUND_H FPR16 : $rs1, 0b001)>;
+
+def: PatSetCC<FPR16, strict_fsetcc, SETLT, FLTQ_H>;
+def: PatSetCC<FPR16, strict_fsetcc, SETOLT, FLTQ_H>;
+def: PatSetCC<FPR16, strict_fsetcc, SETLE, FLEQ_H>;
+def: PatSetCC<FPR16, strict_fsetcc, SETOLE, FLEQ_H>;
+} // Predicates = [HasStdExtZfa, HasStdExtZfh]
Index: llvm/test/CodeGen/RISCV/double-zfa.ll
===================================================================
--- /dev/null
+++ llvm/test/CodeGen/RISCV/double-zfa.ll
@@ -0,0 +1,385 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
+; RUN: llc -mtriple=riscv32 -target-abi ilp32d -mattr=+experimental-zfa,+d < %s \
+; RUN:     | FileCheck --check-prefix=RV32IDZFA %s
+; RUN: llc -mtriple=riscv64 -target-abi lp64d -mattr=+experimental-zfa,+d < %s \
+; RUN:     | FileCheck --check-prefix=RV64DZFA %s
+
+define double @loadfpimm1() {
+; RV32IDZFA-LABEL: loadfpimm1:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    fli.d fa0, 6.250000e-02
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: loadfpimm1:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    fli.d fa0, 6.250000e-02
+; RV64DZFA-NEXT:    ret
+  ret double 0.0625
+}
+
+define double @loadfpimm2() {
+; RV32IDZFA-LABEL: loadfpimm2:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    fli.d fa0, 7.500000e-01
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: loadfpimm2:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    fli.d fa0, 7.500000e-01
+; RV64DZFA-NEXT:    ret
+  ret double 0.75
+}
+
+define double @loadfpimm3() {
+; RV32IDZFA-LABEL: loadfpimm3:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    fli.d fa0, 1.250000e+00
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: loadfpimm3:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    fli.d fa0, 1.250000e+00
+; RV64DZFA-NEXT:    ret
+  ret double 1.25
+}
+
+define double @loadfpimm4() {
+; RV32IDZFA-LABEL: loadfpimm4:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    fli.d fa0, 3.000000e+00
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: loadfpimm4:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    fli.d fa0, 3.000000e+00
+; RV64DZFA-NEXT:    ret
+  ret double 3.0
+}
+
+define double @loadfpimm5() {
+; RV32IDZFA-LABEL: loadfpimm5:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    fli.d fa0, 2.560000e+02
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: loadfpimm5:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    fli.d fa0, 2.560000e+02
+; RV64DZFA-NEXT:    ret
+  ret double 256.0
+}
+
+define double @loadfpimm6() {
+; RV32IDZFA-LABEL: loadfpimm6:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    fli.d fa0, INF
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: loadfpimm6:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    fli.d fa0, INF
+; RV64DZFA-NEXT:    ret
+  ret double 0x7FF0000000000000
+}
+
+define double @loadfpimm7() {
+; RV32IDZFA-LABEL: loadfpimm7:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    fli.d fa0, nan
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: loadfpimm7:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    fli.d fa0, nan
+; RV64DZFA-NEXT:    ret
+  ret double 0x7FF8000000000000
+}
+
+define double @loadfpimm8() {
+; RV32IDZFA-LABEL: loadfpimm8:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    fli.d fa0, min
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: loadfpimm8:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    fli.d fa0, min
+; RV64DZFA-NEXT:    ret
+  ret double 0x102F3E9DF9CF94
+}
+
+define double @loadfpimm9() {
+; RV32IDZFA-LABEL: loadfpimm9:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    lui a0, %hi(.LCPI8_0)
+; RV32IDZFA-NEXT:    fld fa0, %lo(.LCPI8_0)(a0)
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: loadfpimm9:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    lui a0, %hi(.LCPI8_0)
+; RV64DZFA-NEXT:    fld fa0, %lo(.LCPI8_0)(a0)
+; RV64DZFA-NEXT:    ret
+  ret double 255.0
+}
+
+declare double @llvm.minimum.f64(double, double)
+
+define double @fminm_d(double %a, double %b) nounwind {
+; RV32IDZFA-LABEL: fminm_d:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    fminm.d fa0, fa0, fa1
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: fminm_d:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    fminm.d fa0, fa0, fa1
+; RV64DZFA-NEXT:    ret
+  %1 = call double @llvm.minimum.f64(double %a, double %b)
+  ret double %1
+}
+
+declare double @llvm.maximum.f64(double, double)
+
+define double @fmaxm_d(double %a, double %b) nounwind {
+; RV32IDZFA-LABEL: fmaxm_d:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    fmaxm.d fa0, fa0, fa1
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: fmaxm_d:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    fmaxm.d fa0, fa0, fa1
+; RV64DZFA-NEXT:    ret
+  %1 = call double @llvm.maximum.f64(double %a, double %b)
+  ret double %1
+}
+
+define double @fround_s_1(double %a) nounwind {
+; RV32IDZFA-LABEL: fround_s_1:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    fround.d fa0, fa0, rmm
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: fround_s_1:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    fround.d fa0, fa0, rmm
+; RV64DZFA-NEXT:    ret
+  %call = tail call double @round(double %a) nounwind readnone
+  ret double %call
+}
+
+declare double @round(double) nounwind readnone
+
+
+define double @fround_s_2(double %a) nounwind {
+; RV32IDZFA-LABEL: fround_s_2:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    fround.d fa0, fa0, rup
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: fround_s_2:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    fround.d fa0, fa0, rup
+; RV64DZFA-NEXT:    ret
+  %call = tail call double @floor(double %a) nounwind readnone
+  ret double %call
+}
+
+declare double @floor(double) nounwind readnone
+
+
+define double @fround_s_3(double %a) nounwind {
+; RV32IDZFA-LABEL: fround_s_3:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    fround.d fa0, fa0, rdn
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: fround_s_3:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    fround.d fa0, fa0, rdn
+; RV64DZFA-NEXT:    ret
+  %call = tail call double @ceil(double %a) nounwind readnone
+  ret double %call
+}
+
+declare double @ceil(double) nounwind readnone
+
+
+define double @fround_s_4(double %a) nounwind {
+; RV32IDZFA-LABEL: fround_s_4:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    fround.d fa0, fa0, rtz
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: fround_s_4:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    fround.d fa0, fa0, rtz
+; RV64DZFA-NEXT:    ret
+  %call = tail call double @trunc(double %a) nounwind readnone
+  ret double %call
+}
+
+declare double @trunc(double) nounwind readnone
+
+
+define double @fround_s_5(double %a) nounwind {
+; RV32IDZFA-LABEL: fround_s_5:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    fround.d fa0, fa0, dyn
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: fround_s_5:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    fround.d fa0, fa0, dyn
+; RV64DZFA-NEXT:    ret
+  %call = tail call double @nearbyint(double %a) nounwind readnone
+  ret double %call
+}
+
+declare double @nearbyint(double) nounwind readnone
+
+
+define double @froundnx_s(double %a) nounwind {
+; RV32IDZFA-LABEL: froundnx_s:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    froundnx.d fa0, fa0, dyn
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: froundnx_s:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    froundnx.d fa0, fa0, dyn
+; RV64DZFA-NEXT:    ret
+  %call = tail call double @rint(double %a) nounwind readnone
+  ret double %call
+}
+
+declare double @rint(double) nounwind readnone
+
+declare i1 @llvm.experimental.constrained.fcmp.f64(double, double, metadata, metadata)
+
+define i32 @fcmp_olt_q(double %a, double %b) nounwind strictfp {
+; RV32IDZFA-LABEL: fcmp_olt_q:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    fltq.d a0, fa0, fa1
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: fcmp_olt_q:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    fltq.d a0, fa0, fa1
+; RV64DZFA-NEXT:    ret
+  %1 = call i1 @llvm.experimental.constrained.fcmp.f64(double %a, double %b, metadata !"olt", metadata !"fpexcept.strict") strictfp
+  %2 = zext i1 %1 to i32
+  ret i32 %2
+}
+
+define i32 @fcmp_ole_q(double %a, double %b) nounwind strictfp {
+; RV32IDZFA-LABEL: fcmp_ole_q:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    fleq.d a0, fa0, fa1
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: fcmp_ole_q:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    fleq.d a0, fa0, fa1
+; RV64DZFA-NEXT:    ret
+  %1 = call i1 @llvm.experimental.constrained.fcmp.f64(double %a, double %b, metadata !"ole", metadata !"fpexcept.strict") strictfp
+  %2 = zext i1 %1 to i32
+  ret i32 %2
+}
+
+define i32 @fcvtmod_1(double %a) nounwind {
+; RV32IDZFA-LABEL: fcvtmod_1:
+; RV32IDZFA:       # %bb.0: # %entry
+; RV32IDZFA-NEXT:    fcvtmod.w.d a0, fa0, rtz
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: fcvtmod_1:
+; RV64DZFA:       # %bb.0: # %entry
+; RV64DZFA-NEXT:    fcvtmod.w.d a0, fa0, rtz
+; RV64DZFA-NEXT:    ret
+entry:
+  %0 = tail call i32 @llvm.fptosi.sat.i32.f64(double %a)
+  ret i32 %0
+}
+
+declare i32 @llvm.fptosi.sat.i32.f64(double)
+
+define i64 @fcvtmod_2(double %a) nounwind {
+; RV32IDZFA-LABEL: fcvtmod_2:
+; RV32IDZFA:       # %bb.0: # %entry
+; RV32IDZFA-NEXT:    addi sp, sp, -16
+; RV32IDZFA-NEXT:    sw ra, 12(sp) # 4-byte Folded Spill
+; RV32IDZFA-NEXT:    sw s0, 8(sp) # 4-byte Folded Spill
+; RV32IDZFA-NEXT:    fsd fs0, 0(sp) # 8-byte Folded Spill
+; RV32IDZFA-NEXT:    lui a0, %hi(.LCPI20_0)
+; RV32IDZFA-NEXT:    fld ft0, %lo(.LCPI20_0)(a0)
+; RV32IDZFA-NEXT:    fmv.d fs0, fa0
+; RV32IDZFA-NEXT:    fle.d s0, ft0, fa0
+; RV32IDZFA-NEXT:    call __fixdfdi@plt
+; RV32IDZFA-NEXT:    lui a3, 524288
+; RV32IDZFA-NEXT:    bnez s0, .LBB20_2
+; RV32IDZFA-NEXT:  # %bb.1: # %entry
+; RV32IDZFA-NEXT:    lui a1, 524288
+; RV32IDZFA-NEXT:  .LBB20_2: # %entry
+; RV32IDZFA-NEXT:    lui a2, %hi(.LCPI20_1)
+; RV32IDZFA-NEXT:    fld ft0, %lo(.LCPI20_1)(a2)
+; RV32IDZFA-NEXT:    flt.d a2, ft0, fs0
+; RV32IDZFA-NEXT:    beqz a2, .LBB20_4
+; RV32IDZFA-NEXT:  # %bb.3:
+; RV32IDZFA-NEXT:    addi a1, a3, -1
+; RV32IDZFA-NEXT:  .LBB20_4: # %entry
+; RV32IDZFA-NEXT:    feq.d a3, fs0, fs0
+; RV32IDZFA-NEXT:    seqz a3, a3
+; RV32IDZFA-NEXT:    addi a3, a3, -1
+; RV32IDZFA-NEXT:    and a1, a3, a1
+; RV32IDZFA-NEXT:    neg a2, a2
+; RV32IDZFA-NEXT:    neg a4, s0
+; RV32IDZFA-NEXT:    and a0, a4, a0
+; RV32IDZFA-NEXT:    or a0, a2, a0
+; RV32IDZFA-NEXT:    and a0, a3, a0
+; RV32IDZFA-NEXT:    lw ra, 12(sp) # 4-byte Folded Reload
+; RV32IDZFA-NEXT:    lw s0, 8(sp) # 4-byte Folded Reload
+; RV32IDZFA-NEXT:    fld fs0, 0(sp) # 8-byte Folded Reload
+; RV32IDZFA-NEXT:    addi sp, sp, 16
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: fcvtmod_2:
+; RV64DZFA:       # %bb.0: # %entry
+; RV64DZFA-NEXT:    fcvtmod.w.d a0, fa0, rtz
+; RV64DZFA-NEXT:    ret
+entry:
+  %0 = tail call i64 @llvm.fptosi.sat.i64.f64(double %a)
+  ret i64 %0
+}
+
+declare i64 @llvm.fptosi.sat.i64.f64(double)
+
+define i64 @fmvh_x_d(double %fa) {
+; RV32IDZFA-LABEL: fmvh_x_d:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    fmv.x.w a0, fa0
+; RV32IDZFA-NEXT:    fmvh.x.d a1, fa0
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: fmvh_x_d:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    fmv.x.d a0, fa0
+; RV64DZFA-NEXT:    ret
+  %i = bitcast double %fa to i64
+  ret i64 %i
+}
+
+define double @fmvp_d_x(i64 %a) {
+; RV32IDZFA-LABEL: fmvp_d_x:
+; RV32IDZFA:       # %bb.0:
+; RV32IDZFA-NEXT:    fmvp.d.x fa0, a0, a1
+; RV32IDZFA-NEXT:    ret
+;
+; RV64DZFA-LABEL: fmvp_d_x:
+; RV64DZFA:       # %bb.0:
+; RV64DZFA-NEXT:    fmv.d.x fa0, a0
+; RV64DZFA-NEXT:    ret
+  %or = bitcast i64 %a to double
+  ret double %or
+}
Index: llvm/test/CodeGen/RISCV/float-zfa.ll
===================================================================
--- /dev/null
+++ llvm/test/CodeGen/RISCV/float-zfa.ll
@@ -0,0 +1,290 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
+; RUN: llc -mtriple=riscv32 -target-abi ilp32f -mattr=+experimental-zfa < %s \
+; RUN:     | FileCheck --check-prefix=RV32IZFA %s
+; RUN: llc -mtriple=riscv64 -target-abi lp64f -mattr=+experimental-zfa < %s \
+; RUN:     | FileCheck --check-prefix=RV64IZFA %s
+
+define float @loadfpimm1() {
+; RV32IZFA-LABEL: loadfpimm1:
+; RV32IZFA:       # %bb.0:
+; RV32IZFA-NEXT:    fli.s fa0, 6.250000e-02
+; RV32IZFA-NEXT:    ret
+;
+; RV64IZFA-LABEL: loadfpimm1:
+; RV64IZFA:       # %bb.0:
+; RV64IZFA-NEXT:    fli.s fa0, 6.250000e-02
+; RV64IZFA-NEXT:    ret
+  ret float 0.0625
+}
+
+define float @loadfpimm2() {
+; RV32IZFA-LABEL: loadfpimm2:
+; RV32IZFA:       # %bb.0:
+; RV32IZFA-NEXT:    fli.s fa0, 7.500000e-01
+; RV32IZFA-NEXT:    ret
+;
+; RV64IZFA-LABEL: loadfpimm2:
+; RV64IZFA:       # %bb.0:
+; RV64IZFA-NEXT:    fli.s fa0, 7.500000e-01
+; RV64IZFA-NEXT:    ret
+  ret float 0.75
+}
+
+define float @loadfpimm3() {
+; RV32IZFA-LABEL: loadfpimm3:
+; RV32IZFA:       # %bb.0:
+; RV32IZFA-NEXT:    fli.s fa0, 1.250000e+00
+; RV32IZFA-NEXT:    ret
+;
+; RV64IZFA-LABEL: loadfpimm3:
+; RV64IZFA:       # %bb.0:
+; RV64IZFA-NEXT:    fli.s fa0, 1.250000e+00
+; RV64IZFA-NEXT:    ret
+  ret float 1.25
+}
+
+define float @loadfpimm4() {
+; RV32IZFA-LABEL: loadfpimm4:
+; RV32IZFA:       # %bb.0:
+; RV32IZFA-NEXT:    fli.s fa0, 3.000000e+00
+; RV32IZFA-NEXT:    ret
+;
+; RV64IZFA-LABEL: loadfpimm4:
+; RV64IZFA:       # %bb.0:
+; RV64IZFA-NEXT:    fli.s fa0, 3.000000e+00
+; RV64IZFA-NEXT:    ret
+  ret float 3.0
+}
+
+define float @loadfpimm5() {
+; RV32IZFA-LABEL: loadfpimm5:
+; RV32IZFA:       # %bb.0:
+; RV32IZFA-NEXT:    fli.s fa0, 2.560000e+02
+; RV32IZFA-NEXT:    ret
+;
+; RV64IZFA-LABEL: loadfpimm5:
+; RV64IZFA:       # %bb.0:
+; RV64IZFA-NEXT:    fli.s fa0, 2.560000e+02
+; RV64IZFA-NEXT:    ret
+  ret float 256.0
+}
+
+define float @loadfpimm6() {
+; RV32IZFA-LABEL: loadfpimm6:
+; RV32IZFA:       # %bb.0:
+; RV32IZFA-NEXT:    fli.s fa0, INF
+; RV32IZFA-NEXT:    ret
+;
+; RV64IZFA-LABEL: loadfpimm6:
+; RV64IZFA:       # %bb.0:
+; RV64IZFA-NEXT:    fli.s fa0, INF
+; RV64IZFA-NEXT:    ret
+  ret float 0x7FF0000000000000
+}
+
+define float @loadfpimm7() {
+; RV32IZFA-LABEL: loadfpimm7:
+; RV32IZFA:       # %bb.0:
+; RV32IZFA-NEXT:    fli.s fa0, nan
+; RV32IZFA-NEXT:    ret
+;
+; RV64IZFA-LABEL: loadfpimm7:
+; RV64IZFA:       # %bb.0:
+; RV64IZFA-NEXT:    fli.s fa0, nan
+; RV64IZFA-NEXT:    ret
+  ret float 0x7FF8000000000000
+}
+
+define float @loadfpimm8() {
+; RV32IZFA-LABEL: loadfpimm8:
+; RV32IZFA:       # %bb.0:
+; RV32IZFA-NEXT:    fli.s fa0, min
+; RV32IZFA-NEXT:    ret
+;
+; RV64IZFA-LABEL: loadfpimm8:
+; RV64IZFA:       # %bb.0:
+; RV64IZFA-NEXT:    fli.s fa0, min
+; RV64IZFA-NEXT:    ret
+  ret float 0x3810000000000000
+}
+
+define float @loadfpimm9() {
+; RV32IZFA-LABEL: loadfpimm9:
+; RV32IZFA:       # %bb.0:
+; RV32IZFA-NEXT:    lui a0, %hi(.LCPI8_0)
+; RV32IZFA-NEXT:    flw fa0, %lo(.LCPI8_0)(a0)
+; RV32IZFA-NEXT:    ret
+;
+; RV64IZFA-LABEL: loadfpimm9:
+; RV64IZFA:       # %bb.0:
+; RV64IZFA-NEXT:    lui a0, %hi(.LCPI8_0)
+; RV64IZFA-NEXT:    flw fa0, %lo(.LCPI8_0)(a0)
+; RV64IZFA-NEXT:    ret
+  ret float 255.0
+}
+
+declare float @llvm.minimum.f32(float, float)
+
+define float @fminm_s(float %a, float %b) nounwind {
+; RV32IZFA-LABEL: fminm_s:
+; RV32IZFA:       # %bb.0:
+; RV32IZFA-NEXT:    fminm.s fa0, fa0, fa1
+; RV32IZFA-NEXT:    ret
+;
+; RV64IZFA-LABEL: fminm_s:
+; RV64IZFA:       # %bb.0:
+; RV64IZFA-NEXT:    fminm.s fa0, fa0, fa1
+; RV64IZFA-NEXT:    ret
+  %1 = call float @llvm.minimum.f32(float %a, float %b)
+  ret float %1
+}
+
+declare float @llvm.maximum.f32(float, float)
+
+define float @fmaxm_s(float %a, float %b) nounwind {
+; RV32IZFA-LABEL: fmaxm_s:
+; RV32IZFA:       # %bb.0:
+; RV32IZFA-NEXT:    fmaxm.s fa0, fa0, fa1
+; RV32IZFA-NEXT:    ret
+;
+; RV64IZFA-LABEL: fmaxm_s:
+; RV64IZFA:       # %bb.0:
+; RV64IZFA-NEXT:    fmaxm.s fa0, fa0, fa1
+; RV64IZFA-NEXT:    ret
+  %1 = call float @llvm.maximum.f32(float %a, float %b)
+  ret float %1
+}
+
+
+define float @fround_s_1(float %a) nounwind {
+; RV32IZFA-LABEL: fround_s_1:
+; RV32IZFA:       # %bb.0:
+; RV32IZFA-NEXT:    fround.s fa0, fa0, rmm
+; RV32IZFA-NEXT:    ret
+;
+; RV64IZFA-LABEL: fround_s_1:
+; RV64IZFA:       # %bb.0:
+; RV64IZFA-NEXT:    fround.s fa0, fa0, rmm
+; RV64IZFA-NEXT:    ret
+  %call = tail call float @roundf(float %a) nounwind readnone
+  ret float %call
+}
+
+declare float @roundf(float) nounwind readnone
+
+
+define float @fround_s_2(float %a) nounwind {
+; RV32IZFA-LABEL: fround_s_2:
+; RV32IZFA:       # %bb.0:
+; RV32IZFA-NEXT:    fround.s fa0, fa0, rup
+; RV32IZFA-NEXT:    ret
+;
+; RV64IZFA-LABEL: fround_s_2:
+; RV64IZFA:       # %bb.0:
+; RV64IZFA-NEXT:    fround.s fa0, fa0, rup
+; RV64IZFA-NEXT:    ret
+  %call = tail call float @floorf(float %a) nounwind readnone
+  ret float %call
+}
+
+declare float @floorf(float) nounwind readnone
+
+
+define float @fround_s_3(float %a) nounwind {
+; RV32IZFA-LABEL: fround_s_3:
+; RV32IZFA:       # %bb.0:
+; RV32IZFA-NEXT:    fround.s fa0, fa0, rdn
+; RV32IZFA-NEXT:    ret
+;
+; RV64IZFA-LABEL: fround_s_3:
+; RV64IZFA:       # %bb.0:
+; RV64IZFA-NEXT:    fround.s fa0, fa0, rdn
+; RV64IZFA-NEXT:    ret
+  %call = tail call float @ceilf(float %a) nounwind readnone
+  ret float %call
+}
+
+declare float @ceilf(float) nounwind readnone
+
+
+define float @fround_s_4(float %a) nounwind {
+; RV32IZFA-LABEL: fround_s_4:
+; RV32IZFA:       # %bb.0:
+; RV32IZFA-NEXT:    fround.s fa0, fa0, rtz
+; RV32IZFA-NEXT:    ret
+;
+; RV64IZFA-LABEL: fround_s_4:
+; RV64IZFA:       # %bb.0:
+; RV64IZFA-NEXT:    fround.s fa0, fa0, rtz
+; RV64IZFA-NEXT:    ret
+  %call = tail call float @truncf(float %a) nounwind readnone
+  ret float %call
+}
+
+declare float @truncf(float) nounwind readnone
+
+
+define float @fround_s_5(float %a) nounwind {
+; RV32IZFA-LABEL: fround_s_5:
+; RV32IZFA:       # %bb.0:
+; RV32IZFA-NEXT:    fround.s fa0, fa0, dyn
+; RV32IZFA-NEXT:    ret
+;
+; RV64IZFA-LABEL: fround_s_5:
+; RV64IZFA:       # %bb.0:
+; RV64IZFA-NEXT:    fround.s fa0, fa0, dyn
+; RV64IZFA-NEXT:    ret
+  %call = tail call float @nearbyintf(float %a) nounwind readnone
+  ret float %call
+}
+
+declare float @nearbyintf(float) nounwind readnone
+
+
+define float @froundnx_s(float %a) nounwind {
+; RV32IZFA-LABEL: froundnx_s:
+; RV32IZFA:       # %bb.0:
+; RV32IZFA-NEXT:    froundnx.s fa0, fa0, dyn
+; RV32IZFA-NEXT:    ret
+;
+; RV64IZFA-LABEL: froundnx_s:
+; RV64IZFA:       # %bb.0:
+; RV64IZFA-NEXT:    froundnx.s fa0, fa0, dyn
+; RV64IZFA-NEXT:    ret
+  %call = tail call float @rintf(float %a) nounwind readnone
+  ret float %call
+}
+
+declare float @rintf(float) nounwind readnone
+
+declare i1 @llvm.experimental.constrained.fcmp.f32(float, float, metadata, metadata)
+
+define i32 @fcmp_olt_q(float %a, float %b) nounwind strictfp {
+; RV32IZFA-LABEL: fcmp_olt_q:
+; RV32IZFA:       # %bb.0:
+; RV32IZFA-NEXT:    fltq.s a0, fa0, fa1
+; RV32IZFA-NEXT:    ret
+;
+; RV64IZFA-LABEL: fcmp_olt_q:
+; RV64IZFA:       # %bb.0:
+; RV64IZFA-NEXT:    fltq.s a0, fa0, fa1
+; RV64IZFA-NEXT:    ret
+  %1 = call i1 @llvm.experimental.constrained.fcmp.f32(float %a, float %b, metadata !"olt", metadata !"fpexcept.strict") strictfp
+  %2 = zext i1 %1 to i32
+  ret i32 %2
+}
+
+define i32 @fcmp_ole_q(float %a, float %b) nounwind strictfp {
+; RV32IZFA-LABEL: fcmp_ole_q:
+; RV32IZFA:       # %bb.0:
+; RV32IZFA-NEXT:    fleq.s a0, fa0, fa1
+; RV32IZFA-NEXT:    ret
+;
+; RV64IZFA-LABEL: fcmp_ole_q:
+; RV64IZFA:       # %bb.0:
+; RV64IZFA-NEXT:    fleq.s a0, fa0, fa1
+; RV64IZFA-NEXT:    ret
+  %1 = call i1 @llvm.experimental.constrained.fcmp.f32(float %a, float %b, metadata !"ole", metadata !"fpexcept.strict") strictfp
+  %2 = zext i1 %1 to i32
+  ret i32 %2
+}
Index: llvm/test/CodeGen/RISCV/half-zfa.ll
===================================================================
--- /dev/null
+++ llvm/test/CodeGen/RISCV/half-zfa.ll
@@ -0,0 +1,289 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
+; RUN: llc -mtriple=riscv32 -target-abi ilp32f -mattr=+experimental-zfa,+zfh < %s \
+; RUN:     | FileCheck --check-prefix=RV32IHZFA %s
+; RUN: llc -mtriple=riscv64 -target-abi lp64f -mattr=+experimental-zfa,+zfh < %s \
+; RUN:     | FileCheck --check-prefix=RV64HZFA %s
+
+define half @loadfpimm1() {
+; RV32IHZFA-LABEL: loadfpimm1:
+; RV32IHZFA:       # %bb.0:
+; RV32IHZFA-NEXT:    fli.h fa0, 6.250000e-02
+; RV32IHZFA-NEXT:    ret
+;
+; RV64HZFA-LABEL: loadfpimm1:
+; RV64HZFA:       # %bb.0:
+; RV64HZFA-NEXT:    fli.h fa0, 6.250000e-02
+; RV64HZFA-NEXT:    ret
+  ret half 0.0625
+}
+
+define half @loadfpimm2() {
+; RV32IHZFA-LABEL: loadfpimm2:
+; RV32IHZFA:       # %bb.0:
+; RV32IHZFA-NEXT:    fli.h fa0, 7.500000e-01
+; RV32IHZFA-NEXT:    ret
+;
+; RV64HZFA-LABEL: loadfpimm2:
+; RV64HZFA:       # %bb.0:
+; RV64HZFA-NEXT:    fli.h fa0, 7.500000e-01
+; RV64HZFA-NEXT:    ret
+  ret half 0.75
+}
+
+define half @loadfpimm3() {
+; RV32IHZFA-LABEL: loadfpimm3:
+; RV32IHZFA:       # %bb.0:
+; RV32IHZFA-NEXT:    fli.h fa0, 1.250000e+00
+; RV32IHZFA-NEXT:    ret
+;
+; RV64HZFA-LABEL: loadfpimm3:
+; RV64HZFA:       # %bb.0:
+; RV64HZFA-NEXT:    fli.h fa0, 1.250000e+00
+; RV64HZFA-NEXT:    ret
+  ret half 1.25
+}
+
+define half @loadfpimm4() {
+; RV32IHZFA-LABEL: loadfpimm4:
+; RV32IHZFA:       # %bb.0:
+; RV32IHZFA-NEXT:    fli.h fa0, 3.000000e+00
+; RV32IHZFA-NEXT:    ret
+;
+; RV64HZFA-LABEL: loadfpimm4:
+; RV64HZFA:       # %bb.0:
+; RV64HZFA-NEXT:    fli.h fa0, 3.000000e+00
+; RV64HZFA-NEXT:    ret
+  ret half 3.0
+}
+
+define half @loadfpimm5() {
+; RV32IHZFA-LABEL: loadfpimm5:
+; RV32IHZFA:       # %bb.0:
+; RV32IHZFA-NEXT:    fli.h fa0, 2.560000e+02
+; RV32IHZFA-NEXT:    ret
+;
+; RV64HZFA-LABEL: loadfpimm5:
+; RV64HZFA:       # %bb.0:
+; RV64HZFA-NEXT:    fli.h fa0, 2.560000e+02
+; RV64HZFA-NEXT:    ret
+  ret half 256.0
+}
+
+define half @loadfpimm6() {
+; RV32IHZFA-LABEL: loadfpimm6:
+; RV32IHZFA:       # %bb.0:
+; RV32IHZFA-NEXT:    fli.h fa0, INF
+; RV32IHZFA-NEXT:    ret
+;
+; RV64HZFA-LABEL: loadfpimm6:
+; RV64HZFA:       # %bb.0:
+; RV64HZFA-NEXT:    fli.h fa0, INF
+; RV64HZFA-NEXT:    ret
+  ret half 0xH7C00
+}
+
+define half @loadfpimm7() {
+; RV32IHZFA-LABEL: loadfpimm7:
+; RV32IHZFA:       # %bb.0:
+; RV32IHZFA-NEXT:    fli.h fa0, nan
+; RV32IHZFA-NEXT:    ret
+;
+; RV64HZFA-LABEL: loadfpimm7:
+; RV64HZFA:       # %bb.0:
+; RV64HZFA-NEXT:    fli.h fa0, nan
+; RV64HZFA-NEXT:    ret
+  ret half 0xH7E00
+}
+
+define half @loadfpimm8() {
+; RV32IHZFA-LABEL: loadfpimm8:
+; RV32IHZFA:       # %bb.0:
+; RV32IHZFA-NEXT:    fli.h fa0, min
+; RV32IHZFA-NEXT:    ret
+;
+; RV64HZFA-LABEL: loadfpimm8:
+; RV64HZFA:       # %bb.0:
+; RV64HZFA-NEXT:    fli.h fa0, min
+; RV64HZFA-NEXT:    ret
+  ret half 0xH0400
+}
+
+define half @loadfpimm9() {
+; RV32IHZFA-LABEL: loadfpimm9:
+; RV32IHZFA:       # %bb.0:
+; RV32IHZFA-NEXT:    lui a0, %hi(.LCPI8_0)
+; RV32IHZFA-NEXT:    flh fa0, %lo(.LCPI8_0)(a0)
+; RV32IHZFA-NEXT:    ret
+;
+; RV64HZFA-LABEL: loadfpimm9:
+; RV64HZFA:       # %bb.0:
+; RV64HZFA-NEXT:    lui a0, %hi(.LCPI8_0)
+; RV64HZFA-NEXT:    flh fa0, %lo(.LCPI8_0)(a0)
+; RV64HZFA-NEXT:    ret
+  ret half 255.0
+}
+
+declare half @llvm.minimum.f16(half, half)
+
+define half @fminm_d(half %a, half %b) nounwind {
+; RV32IHZFA-LABEL: fminm_d:
+; RV32IHZFA:       # %bb.0:
+; RV32IHZFA-NEXT:    fminm.h fa0, fa0, fa1
+; RV32IHZFA-NEXT:    ret
+;
+; RV64HZFA-LABEL: fminm_d:
+; RV64HZFA:       # %bb.0:
+; RV64HZFA-NEXT:    fminm.h fa0, fa0, fa1
+; RV64HZFA-NEXT:    ret
+  %1 = call half @llvm.minimum.f16(half %a, half %b)
+  ret half %1
+}
+
+declare half @llvm.maximum.f16(half, half)
+
+define half @fmaxm_d(half %a, half %b) nounwind {
+; RV32IHZFA-LABEL: fmaxm_d:
+; RV32IHZFA:       # %bb.0:
+; RV32IHZFA-NEXT:    fmaxm.h fa0, fa0, fa1
+; RV32IHZFA-NEXT:    ret
+;
+; RV64HZFA-LABEL: fmaxm_d:
+; RV64HZFA:       # %bb.0:
+; RV64HZFA-NEXT:    fmaxm.h fa0, fa0, fa1
+; RV64HZFA-NEXT:    ret
+  %1 = tail call half @llvm.maximum.f16(half %a, half %b)
+  ret half %1
+}
+
+define half @fround_s_1(half %a) nounwind {
+; RV32IHZFA-LABEL: fround_s_1:
+; RV32IHZFA:       # %bb.0:
+; RV32IHZFA-NEXT:    fround.h fa0, fa0, rmm
+; RV32IHZFA-NEXT:    ret
+;
+; RV64HZFA-LABEL: fround_s_1:
+; RV64HZFA:       # %bb.0:
+; RV64HZFA-NEXT:    fround.h fa0, fa0, rmm
+; RV64HZFA-NEXT:    ret
+  %call = tail call half @llvm.round.f16(half %a) nounwind readnone
+  ret half %call
+}
+
+declare half @llvm.round.f16(half) nounwind readnone
+
+
+define half @fround_s_2(half %a) nounwind {
+; RV32IHZFA-LABEL: fround_s_2:
+; RV32IHZFA:       # %bb.0:
+; RV32IHZFA-NEXT:    fround.h fa0, fa0, rup
+; RV32IHZFA-NEXT:    ret
+;
+; RV64HZFA-LABEL: fround_s_2:
+; RV64HZFA:       # %bb.0:
+; RV64HZFA-NEXT:    fround.h fa0, fa0, rup
+; RV64HZFA-NEXT:    ret
+  %call = tail call half @llvm.floor.f16(half %a) nounwind readnone
+  ret half %call
+}
+
+declare half @llvm.floor.f16(half) nounwind readnone
+
+
+define half @fround_s_3(half %a) nounwind {
+; RV32IHZFA-LABEL: fround_s_3:
+; RV32IHZFA:       # %bb.0:
+; RV32IHZFA-NEXT:    fround.h fa0, fa0, rdn
+; RV32IHZFA-NEXT:    ret
+;
+; RV64HZFA-LABEL: fround_s_3:
+; RV64HZFA:       # %bb.0:
+; RV64HZFA-NEXT:    fround.h fa0, fa0, rdn
+; RV64HZFA-NEXT:    ret
+  %call = tail call half @llvm.ceil.f16(half %a) nounwind readnone
+  ret half %call
+}
+
+declare half @llvm.ceil.f16(half) nounwind readnone
+
+
+define half @fround_s_4(half %a) nounwind {
+; RV32IHZFA-LABEL: fround_s_4:
+; RV32IHZFA:       # %bb.0:
+; RV32IHZFA-NEXT:    fround.h fa0, fa0, rtz
+; RV32IHZFA-NEXT:    ret
+;
+; RV64HZFA-LABEL: fround_s_4:
+; RV64HZFA:       # %bb.0:
+; RV64HZFA-NEXT:    fround.h fa0, fa0, rtz
+; RV64HZFA-NEXT:    ret
+  %call = tail call half @llvm.trunc.f16(half %a) nounwind readnone
+  ret half %call
+}
+
+declare half @llvm.trunc.f16(half) nounwind readnone
+
+
+define half @fround_s_5(half %a) nounwind {
+; RV32IHZFA-LABEL: fround_s_5:
+; RV32IHZFA:       # %bb.0:
+; RV32IHZFA-NEXT:    fround.h fa0, fa0, dyn
+; RV32IHZFA-NEXT:    ret
+;
+; RV64HZFA-LABEL: fround_s_5:
+; RV64HZFA:       # %bb.0:
+; RV64HZFA-NEXT:    fround.h fa0, fa0, dyn
+; RV64HZFA-NEXT:    ret
+  %call = tail call half @llvm.nearbyint.f16(half %a) nounwind readnone
+  ret half %call
+}
+
+declare half @llvm.nearbyint.f16(half) nounwind readnone
+
+
+define half @froundnx_s(half %a) nounwind {
+; RV32IHZFA-LABEL: froundnx_s:
+; RV32IHZFA:       # %bb.0:
+; RV32IHZFA-NEXT:    froundnx.h fa0, fa0, dyn
+; RV32IHZFA-NEXT:    ret
+;
+; RV64HZFA-LABEL: froundnx_s:
+; RV64HZFA:       # %bb.0:
+; RV64HZFA-NEXT:    froundnx.h fa0, fa0, dyn
+; RV64HZFA-NEXT:    ret
+  %call = tail call half @llvm.rint.f16(half %a) nounwind readnone
+  ret half %call
+}
+
+declare half @llvm.rint.f16(half) nounwind readnone
+
+declare i1 @llvm.experimental.constrained.fcmp.f16(half, half, metadata, metadata)
+
+define i32 @fcmp_olt_q(half %a, half %b) nounwind strictfp {
+; RV32IHZFA-LABEL: fcmp_olt_q:
+; RV32IHZFA:       # %bb.0:
+; RV32IHZFA-NEXT:    fltq.h a0, fa0, fa1
+; RV32IHZFA-NEXT:    ret
+;
+; RV64HZFA-LABEL: fcmp_olt_q:
+; RV64HZFA:       # %bb.0:
+; RV64HZFA-NEXT:    fltq.h a0, fa0, fa1
+; RV64HZFA-NEXT:    ret
+  %1 = call i1 @llvm.experimental.constrained.fcmp.f16(half %a, half %b, metadata !"olt", metadata !"fpexcept.strict") strictfp
+  %2 = zext i1 %1 to i32
+  ret i32 %2
+}
+
+define i32 @fcmp_ole_q(half %a, half %b) nounwind strictfp {
+; RV32IHZFA-LABEL: fcmp_ole_q:
+; RV32IHZFA:       # %bb.0:
+; RV32IHZFA-NEXT:    fleq.h a0, fa0, fa1
+; RV32IHZFA-NEXT:    ret
+;
+; RV64HZFA-LABEL: fcmp_ole_q:
+; RV64HZFA:       # %bb.0:
+; RV64HZFA-NEXT:    fleq.h a0, fa0, fa1
+; RV64HZFA-NEXT:    ret
+  %1 = call i1 @llvm.experimental.constrained.fcmp.f16(half %a, half %b, metadata !"ole", metadata !"fpexcept.strict") strictfp
+  %2 = zext i1 %1 to i32
+  ret i32 %2
+}
Index: llvm/test/CodeGen/RISCV/rvv/fixed-vectors-bitcast.ll
===================================================================
--- llvm/test/CodeGen/RISCV/rvv/fixed-vectors-bitcast.ll
+++ llvm/test/CodeGen/RISCV/rvv/fixed-vectors-bitcast.ll
@@ -418,8 +418,8 @@
 ; RV32ELEN32:       # %bb.0:
 ; RV32ELEN32-NEXT:    addi sp, sp, -16
 ; RV32ELEN32-NEXT:    .cfi_def_cfa_offset 16
-; RV32ELEN32-NEXT:    sw a1, 12(sp)
 ; RV32ELEN32-NEXT:    sw a0, 8(sp)
+; RV32ELEN32-NEXT:    sw a1, 12(sp)
 ; RV32ELEN32-NEXT:    fld fa0, 8(sp)
 ; RV32ELEN32-NEXT:    addi sp, sp, 16
 ; RV32ELEN32-NEXT:    ret