This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/RISCV/
-
Target/
-
RISCV/
1/3
RISCVISelLowering.cpp
-
test/CodeGen/RISCV/rvv/
-
CodeGen/
-
RISCV/
-
rvv/
-
fceil-sdnode.ll
-
ffloor-sdnode.ll
-
fixed-vectors-fp.ll
-
ftrunc-sdnode.ll

Differential D113543

[RISCV] Add inline expansion for vector ftrunc/fceil/ffloor.
ClosedPublic

Authored by craig.topper on Nov 9 2021, 11:39 PM.

Download Raw Diff

Details

Reviewers

frasercrmck
rogfer01
HsiangKai
khchen
arcbbb

Commits

rG2f6beb7b0e9e: [RISCV] Add inline expansion for vector ftrunc/fceil/ffloor.

Summary

This prevents scalarization of fixed vector operations or crashes
on scalable vectors.

We don't have direct support for these operations. To emulate
ftrunc we can convert to the same sized integer and back to fp using
round to zero. We don't need to do a convert if the value is large
enough to have no fractional bits or is a nan.

The ceil and floor lowering would be better if we changed FRM, but
we don't model FRM correctly yet. So I've used the trunc lowering
with a conditional add or subtract with 1.0 if the truncate rounded
in the wrong direction.

There are also missed opportunities to use masked instructions.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

craig.topper created this revision.Nov 9 2021, 11:39 PM

Herald added subscribers: VincentWu, luke957, achieveartificialintelligence and 26 others. · View Herald TranscriptNov 9 2021, 11:39 PM

craig.topper requested review of this revision.Nov 9 2021, 11:39 PM

Herald added a project: Restricted Project. · View Herald TranscriptNov 9 2021, 11:39 PM

Herald added a subscriber: MaskRay. · View Herald Transcript

Harbormaster completed remote builds in B133422: Diff 386068.Nov 10 2021, 12:17 AM

Being myself far from an expert in floating-point, the logic and generated code seem correct to me.

llvm/lib/Target/RISCV/RISCVISelLowering.cpp
1691	I understand our current `RISCVISD::V<op>_VL` nodes fall short here because they don't allow mask undisturbed, right?

craig.topper added inline comments.Nov 11 2021, 12:08 AM

llvm/lib/Target/RISCV/RISCVISelLowering.cpp
1691	That or we need to pattern match fadd/fsub+vselect during isel. The other complexity is that if we use RISCVISD::V<op>_VL here, we have to convert fixed types to scalable in this function. Using target independent nodes avoided that.

To what extent is this generic code that other targets would benefit from?

I'm also not the most comfortable with floating-point. I was wondering if we could prove these transformations with https://alive2.llvm.org/ce/. I tried something simple but it doesn't recognize copysign. That's not to say it's impossible to express that operation in another way, but it's cumbersome.

llvm/lib/Target/RISCV/RISCVISelLowering.cpp
1714	Can use `Src` here.

In D113543#3124563, @frasercrmck wrote:

To what extent is this generic code that other targets would benefit from?

I'm also not the most comfortable with floating-point. I was wondering if we could prove these transformations with https://alive2.llvm.org/ce/. I tried something simple but it doesn't recognize copysign. That's not to say it's impossible to express that operation in another way, but it's cumbersome.

I think it is generic unless the target doesn't have integer vectors that match their fp vectors. The other issue might be unsupported FP comparisons, but the comparisons used here are the ones used by C comparison operators.

The algorithm I used is the same as this code from gcc https://godbolt.org/z/Eqjnad9fe but using select instead of branches. Though I did change the cmpnle (which is setugt) to setogt so that it matched the compares RISCV supports and was in a position to allow a masked operation. I don't think the input can be NaN there so changing unordered to ordered shouldn't matter.

I just tried to use alive2 with nsz to avoid caring about the sign of -0.0, but I'm getting a poison value where I don't think I should. https://alive2.llvm.org/ce/z/mtnitt

In D113543#3124872, @craig.topper wrote:

I just tried to use alive2 with nsz to avoid caring about the sign of -0.0, but I'm getting a poison value where I don't think I should. https://alive2.llvm.org/ce/z/mtnitt

Playing with https://alive2.llvm.org/ce/z/j8SJkv is giving really strange results. It thinks fptosi of -1.25 and -1.0 both give -1, and that -0.0 gives 0, but thinks -0.25 gives poison. That's surely wrong per the definition of fptosi? I could vaguely understand it if it also viewed -0.0 as giving poison, but it doesn't...

In D113543#3124895, @jrtc27 wrote:

In D113543#3124872, @craig.topper wrote:

I just tried to use alive2 with nsz to avoid caring about the sign of -0.0, but I'm getting a poison value where I don't think I should. https://alive2.llvm.org/ce/z/mtnitt

Playing with https://alive2.llvm.org/ce/z/j8SJkv is giving really strange results. It thinks fptosi of -1.25 and -1.0 both give -1, and that -0.0 gives 0, but thinks -0.25 gives poison. That's surely wrong per the definition of fptosi? I could vaguely understand it if it also viewed -0.0 as giving poison, but it doesn't...

@aqjune or @nlopes can you help with the alive2 behavior here?

Address review comment

In D113543#3124923, @craig.topper wrote:

In D113543#3124895, @jrtc27 wrote:

In D113543#3124872, @craig.topper wrote:

I just tried to use alive2 with nsz to avoid caring about the sign of -0.0, but I'm getting a poison value where I don't think I should. https://alive2.llvm.org/ce/z/mtnitt

Playing with https://alive2.llvm.org/ce/z/j8SJkv is giving really strange results. It thinks fptosi of -1.25 and -1.0 both give -1, and that -0.0 gives 0, but thinks -0.25 gives poison. That's surely wrong per the definition of fptosi? I could vaguely understand it if it also viewed -0.0 as giving poison, but it doesn't...

@aqjune or @nlopes can you help with the alive2 behavior here?

It's also mishandling fptoui; (-1.0, -0.0] are all legal inputs despite being negative as the result is only poison if the truncated value can't be represented, but 0 can be (see footnote 50 of the C99 spec in 6.3.1.4 which explicitly calls this out; the C semantics are intended to be directly mapped onto fpto[us]i), but it views even fptoui -0.0 as being poison, not 0.

Harbormaster completed remote builds in B133750: Diff 386555.Nov 11 2021, 10:21 AM

Hello all,
I couldn't find this mail because it was somehow buried in other mails.

I made a pull request that fixes the issue as https://github.com/AliveToolkit/alive2/pull/767 .

Here's a new alive2 proof for the trunc. This patch does need to be changed to insert an ISD::FREEZE on the input.

https://alive2.llvm.org/ce/z/8YCDfb

Add freeze

Harbormaster completed remote builds in B136590: Diff 390552.Nov 29 2021, 8:04 PM

Here's the alive2 for ceil https://alive2.llvm.org/ce/z/zgLLd5 it times out the web, but I ran it through alive2 on my local machine.

Thanks, Craig. From what I can see, taking the alive2 for ceil and modifying it to what you've got for floor also times out rather than finding a verification error. If it works for you locally I'm happy.

In D113543#3160892, @frasercrmck wrote:

Thanks, Craig. From what I can see, taking the alive2 for ceil and modifying it to what you've got for floor also times out rather than finding a verification error. If it works for you locally I'm happy.

I tested this for floor locally and it also passed https://alive2.llvm.org/ce/z/r4zopB

LGTM but there's one clang-format issue that should be addressed. Thanks, @craig.topper!

This revision is now accepted and ready to land.Dec 1 2021, 12:11 AM

This revision was landed with ongoing or failed builds.Dec 1 2021, 11:25 AM

Closed by commit rG2f6beb7b0e9e: [RISCV] Add inline expansion for vector ftrunc/fceil/ffloor. (authored by craig.topper). · Explain Why

This revision was automatically updated to reflect the committed changes.

craig.topper added a commit: rG2f6beb7b0e9e: [RISCV] Add inline expansion for vector ftrunc/fceil/ffloor..

Revision Contents

Path

Size

llvm/

lib/

Target/

RISCV/

RISCVISelLowering.cpp

72 lines

test/

CodeGen/

RISCV/

rvv/

350 lines

350 lines

228 lines

275 lines

Diff 391095

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 682 Lines • ▼ Show 20 Lines	const auto SetCommonVFPActions = [&](MVT VT) {
setOperationAction(ISD::EXTRACT_VECTOR_ELT, VT, Custom);		setOperationAction(ISD::EXTRACT_VECTOR_ELT, VT, Custom);
// Expand various condition codes (explained above).		// Expand various condition codes (explained above).
for (auto CC : VFPCCToExpand)		for (auto CC : VFPCCToExpand)
setCondCodeAction(CC, VT, Expand);		setCondCodeAction(CC, VT, Expand);

setOperationAction(ISD::FMINNUM, VT, Legal);		setOperationAction(ISD::FMINNUM, VT, Legal);
setOperationAction(ISD::FMAXNUM, VT, Legal);		setOperationAction(ISD::FMAXNUM, VT, Legal);

		setOperationAction(ISD::FTRUNC, VT, Custom);
		setOperationAction(ISD::FCEIL, VT, Custom);
		setOperationAction(ISD::FFLOOR, VT, Custom);

setOperationAction(ISD::VECREDUCE_FADD, VT, Custom);		setOperationAction(ISD::VECREDUCE_FADD, VT, Custom);
setOperationAction(ISD::VECREDUCE_SEQ_FADD, VT, Custom);		setOperationAction(ISD::VECREDUCE_SEQ_FADD, VT, Custom);
setOperationAction(ISD::VECREDUCE_FMIN, VT, Custom);		setOperationAction(ISD::VECREDUCE_FMIN, VT, Custom);
setOperationAction(ISD::VECREDUCE_FMAX, VT, Custom);		setOperationAction(ISD::VECREDUCE_FMAX, VT, Custom);

setOperationAction(ISD::FCOPYSIGN, VT, Legal);		setOperationAction(ISD::FCOPYSIGN, VT, Legal);

setOperationAction(ISD::LOAD, VT, Custom);		setOperationAction(ISD::LOAD, VT, Custom);
▲ Show 20 Lines • Show All 232 Lines • ▼ Show 20 Lines	if (Subtarget.useRVVForFixedLengthVectors()) {
setOperationAction(ISD::FSQRT, VT, Custom);		setOperationAction(ISD::FSQRT, VT, Custom);
setOperationAction(ISD::FMA, VT, Custom);		setOperationAction(ISD::FMA, VT, Custom);
setOperationAction(ISD::FMINNUM, VT, Custom);		setOperationAction(ISD::FMINNUM, VT, Custom);
setOperationAction(ISD::FMAXNUM, VT, Custom);		setOperationAction(ISD::FMAXNUM, VT, Custom);

setOperationAction(ISD::FP_ROUND, VT, Custom);		setOperationAction(ISD::FP_ROUND, VT, Custom);
setOperationAction(ISD::FP_EXTEND, VT, Custom);		setOperationAction(ISD::FP_EXTEND, VT, Custom);

		setOperationAction(ISD::FTRUNC, VT, Custom);
		setOperationAction(ISD::FCEIL, VT, Custom);
		setOperationAction(ISD::FFLOOR, VT, Custom);

for (auto CC : VFPCCToExpand)		for (auto CC : VFPCCToExpand)
setCondCodeAction(CC, VT, Expand);		setCondCodeAction(CC, VT, Expand);

setOperationAction(ISD::VSELECT, VT, Custom);		setOperationAction(ISD::VSELECT, VT, Custom);
setOperationAction(ISD::SELECT, VT, Custom);		setOperationAction(ISD::SELECT, VT, Custom);
setOperationAction(ISD::SELECT_CC, VT, Expand);		setOperationAction(ISD::SELECT_CC, VT, Expand);

setOperationAction(ISD::BITCAST, VT, Custom);		setOperationAction(ISD::BITCAST, VT, Custom);
▲ Show 20 Lines • Show All 695 Lines • ▼ Show 20 Lines	static SDValue lowerFP_TO_INT_SAT(SDValue Op, SelectionDAG &DAG) {

SDLoc DL(Op);		SDLoc DL(Op);
SDValue FpToInt = DAG.getNode(Opc, DL, DstVT, Src);		SDValue FpToInt = DAG.getNode(Opc, DL, DstVT, Src);

SDValue ZeroInt = DAG.getConstant(0, DL, DstVT);		SDValue ZeroInt = DAG.getConstant(0, DL, DstVT);
return DAG.getSelectCC(DL, Src, Src, ZeroInt, FpToInt, ISD::CondCode::SETUO);		return DAG.getSelectCC(DL, Src, Src, ZeroInt, FpToInt, ISD::CondCode::SETUO);
}		}

		// Expand vector FTRUNC, FCEIL, and FFLOOR by converting to the integer domain
		// and back. Taking care to avoid converting values that are nan or already
		// correct.
		// TODO: Floor and ceil could be shorter by changing rounding mode, but we don't
		// have FRM dependencies modeled yet.
		static SDValue lowerFTRUNC_FCEIL_FFLOOR(SDValue Op, SelectionDAG &DAG) {
		MVT VT = Op.getSimpleValueType();
		assert(VT.isVector() && "Unexpected type");

		SDLoc DL(Op);

		// Freeze the source since we are increasing the number of uses.
		SDValue Src = DAG.getNode(ISD::FREEZE, DL, VT, Op.getOperand(0));

		// Truncate to integer and convert back to FP.
		MVT IntVT = VT.changeVectorElementTypeToInteger();
		SDValue Truncated = DAG.getNode(ISD::FP_TO_SINT, DL, IntVT, Src);
		Truncated = DAG.getNode(ISD::SINT_TO_FP, DL, VT, Truncated);

		MVT SetccVT = MVT::getVectorVT(MVT::i1, VT.getVectorElementCount());

		if (Op.getOpcode() == ISD::FCEIL) {
		// If the truncated value is the greater than or equal to the original
		// value, we've computed the ceil. Otherwise, we went the wrong way and
		// need to increase by 1.
		// FIXME: This should use a masked operation. Handle here or in isel?
		SDValue Adjust = DAG.getNode(ISD::FADD, DL, VT, Truncated,
		DAG.getConstantFP(1.0, DL, VT));
		SDValue NeedAdjust = DAG.getSetCC(DL, SetccVT, Truncated, Src, ISD::SETOLT);
		Truncated = DAG.getSelect(DL, VT, NeedAdjust, Adjust, Truncated);
		} else if (Op.getOpcode() == ISD::FFLOOR) {
		// If the truncated value is the less than or equal to the original value,
		// we've computed the floor. Otherwise, we went the wrong way and need to
		// decrease by 1.
		rogfer01Unsubmitted Not Done Reply Inline Actions I understand our current `RISCVISD::V<op>_VL` nodes fall short here because they don't allow mask undisturbed, right? rogfer01: I understand our current `RISCVISD::V<op>_VL` nodes fall short here because they don't allow…
		craig.topperAuthorUnsubmitted Done Reply Inline Actions That or we need to pattern match fadd/fsub+vselect during isel. The other complexity is that if we use RISCVISD::V<op>_VL here, we have to convert fixed types to scalable in this function. Using target independent nodes avoided that. craig.topper: That or we need to pattern match fadd/fsub+vselect during isel. The other complexity is that if…
		// FIXME: This should use a masked operation. Handle here or in isel?
		SDValue Adjust = DAG.getNode(ISD::FSUB, DL, VT, Truncated,
		DAG.getConstantFP(1.0, DL, VT));
		SDValue NeedAdjust = DAG.getSetCC(DL, SetccVT, Truncated, Src, ISD::SETOGT);
		Truncated = DAG.getSelect(DL, VT, NeedAdjust, Adjust, Truncated);
		}

		// Restore the original sign so that -0.0 is preserved.
		Truncated = DAG.getNode(ISD::FCOPYSIGN, DL, VT, Truncated, Src);

		// Determine the largest integer that can be represented exactly. This and
		// values larger than it don't have any fractional bits so don't need to
		// be converted.
		const fltSemantics &FltSem = DAG.EVTToAPFloatSemantics(VT);
		unsigned Precision = APFloat::semanticsPrecision(FltSem);
		APFloat MaxVal = APFloat(FltSem);
		MaxVal.convertFromAPInt(APInt::getOneBitSet(Precision, Precision - 1),
		/IsSigned/ false, APFloat::rmNearestTiesToEven);
		SDValue MaxValNode = DAG.getConstantFP(MaxVal, DL, VT);

		// If abs(Src) was larger than MaxVal or nan, keep it.
		SDValue Abs = DAG.getNode(ISD::FABS, DL, VT, Src);
		SDValue Setcc = DAG.getSetCC(DL, SetccVT, Abs, MaxValNode, ISD::SETOLT);
		frasercrmckUnsubmitted Not Done Reply Inline Actions Can use `Src` here. frasercrmck: Can use `Src` here.
		return DAG.getSelect(DL, VT, Setcc, Truncated, Src);
		}

static SDValue lowerSPLAT_VECTOR(SDValue Op, SelectionDAG &DAG,		static SDValue lowerSPLAT_VECTOR(SDValue Op, SelectionDAG &DAG,
const RISCVSubtarget &Subtarget) {		const RISCVSubtarget &Subtarget) {
MVT VT = Op.getSimpleValueType();		MVT VT = Op.getSimpleValueType();
assert(VT.isFixedLengthVector() && "Unexpected vector!");		assert(VT.isFixedLengthVector() && "Unexpected vector!");

MVT ContainerVT = getContainerForFixedLengthVector(DAG, VT, Subtarget);		MVT ContainerVT = getContainerForFixedLengthVector(DAG, VT, Subtarget);

SDLoc DL(Op);		SDLoc DL(Op);
▲ Show 20 Lines • Show All 1,225 Lines • ▼ Show 20 Lines	case ISD::UINT_TO_FP: {

Src = convertToScalableVector(SrcContainerVT, Src, DAG, Subtarget);		Src = convertToScalableVector(SrcContainerVT, Src, DAG, Subtarget);
Src = DAG.getNode(RVVOpc, DL, ContainerVT, Src, Mask, VL);		Src = DAG.getNode(RVVOpc, DL, ContainerVT, Src, Mask, VL);
return convertFromScalableVector(VT, Src, DAG, Subtarget);		return convertFromScalableVector(VT, Src, DAG, Subtarget);
}		}
case ISD::FP_TO_SINT_SAT:		case ISD::FP_TO_SINT_SAT:
case ISD::FP_TO_UINT_SAT:		case ISD::FP_TO_UINT_SAT:
return lowerFP_TO_INT_SAT(Op, DAG);		return lowerFP_TO_INT_SAT(Op, DAG);
		case ISD::FTRUNC:
		case ISD::FCEIL:
		case ISD::FFLOOR:
		return lowerFTRUNC_FCEIL_FFLOOR(Op, DAG);
case ISD::VECREDUCE_ADD:		case ISD::VECREDUCE_ADD:
case ISD::VECREDUCE_UMAX:		case ISD::VECREDUCE_UMAX:
case ISD::VECREDUCE_SMAX:		case ISD::VECREDUCE_SMAX:
case ISD::VECREDUCE_UMIN:		case ISD::VECREDUCE_UMIN:
case ISD::VECREDUCE_SMIN:		case ISD::VECREDUCE_SMIN:
return lowerVECREDUCE(Op, DAG);		return lowerVECREDUCE(Op, DAG);
case ISD::VECREDUCE_AND:		case ISD::VECREDUCE_AND:
case ISD::VECREDUCE_OR:		case ISD::VECREDUCE_OR:
▲ Show 20 Lines • Show All 7,220 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fceil-sdnode.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc -mtriple=riscv32 -mattr=+d,+experimental-zfh,+experimental-v -target-abi=ilp32d \
				; RUN: -verify-machineinstrs < %s \| FileCheck %s
				; RUN: llc -mtriple=riscv64 -mattr=+d,+experimental-zfh,+experimental-v -target-abi=lp64d \
				; RUN: -verify-machineinstrs < %s \| FileCheck %s

				define <vscale x 1 x half> @ceil_nxv1f16(<vscale x 1 x half> %x) {
				; CHECK-LABEL: ceil_nxv1f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
				; CHECK-NEXT: vfcvt.f.x.v v9, v9
				; CHECK-NEXT: lui a0, %hi(.LCPI0_0)
				; CHECK-NEXT: flh ft0, %lo(.LCPI0_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v9, v8
				; CHECK-NEXT: lui a0, %hi(.LCPI0_1)
				; CHECK-NEXT: flh ft1, %lo(.LCPI0_1)(a0)
				; CHECK-NEXT: vfadd.vf v10, v9, ft0
				; CHECK-NEXT: vmerge.vvm v9, v9, v10, v0
				; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v10, ft1
				; CHECK-NEXT: vfsgnj.vv v9, v9, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 1 x half> @llvm.ceil.nxv1f16(<vscale x 1 x half> %x)
				ret <vscale x 1 x half> %a
				}
				declare <vscale x 1 x half> @llvm.ceil.nxv1f16(<vscale x 1 x half>)

				define <vscale x 2 x half> @ceil_nxv2f16(<vscale x 2 x half> %x) {
				; CHECK-LABEL: ceil_nxv2f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
				; CHECK-NEXT: vfcvt.f.x.v v9, v9
				; CHECK-NEXT: lui a0, %hi(.LCPI1_0)
				; CHECK-NEXT: flh ft0, %lo(.LCPI1_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v9, v8
				; CHECK-NEXT: lui a0, %hi(.LCPI1_1)
				; CHECK-NEXT: flh ft1, %lo(.LCPI1_1)(a0)
				; CHECK-NEXT: vfadd.vf v10, v9, ft0
				; CHECK-NEXT: vmerge.vvm v9, v9, v10, v0
				; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v10, ft1
				; CHECK-NEXT: vfsgnj.vv v9, v9, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 2 x half> @llvm.ceil.nxv2f16(<vscale x 2 x half> %x)
				ret <vscale x 2 x half> %a
				}
				declare <vscale x 2 x half> @llvm.ceil.nxv2f16(<vscale x 2 x half>)

				define <vscale x 4 x half> @ceil_nxv4f16(<vscale x 4 x half> %x) {
				; CHECK-LABEL: ceil_nxv4f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
				; CHECK-NEXT: vfcvt.f.x.v v9, v9
				; CHECK-NEXT: lui a0, %hi(.LCPI2_0)
				; CHECK-NEXT: flh ft0, %lo(.LCPI2_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v9, v8
				; CHECK-NEXT: lui a0, %hi(.LCPI2_1)
				; CHECK-NEXT: flh ft1, %lo(.LCPI2_1)(a0)
				; CHECK-NEXT: vfadd.vf v10, v9, ft0
				; CHECK-NEXT: vmerge.vvm v9, v9, v10, v0
				; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v10, ft1
				; CHECK-NEXT: vfsgnj.vv v9, v9, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 4 x half> @llvm.ceil.nxv4f16(<vscale x 4 x half> %x)
				ret <vscale x 4 x half> %a
				}
				declare <vscale x 4 x half> @llvm.ceil.nxv4f16(<vscale x 4 x half>)

				define <vscale x 8 x half> @ceil_nxv8f16(<vscale x 8 x half> %x) {
				; CHECK-LABEL: ceil_nxv8f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e16, m2, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v10, v8
				; CHECK-NEXT: vfcvt.f.x.v v10, v10
				; CHECK-NEXT: lui a0, %hi(.LCPI3_0)
				; CHECK-NEXT: flh ft0, %lo(.LCPI3_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v10, v8
				; CHECK-NEXT: lui a0, %hi(.LCPI3_1)
				; CHECK-NEXT: flh ft1, %lo(.LCPI3_1)(a0)
				; CHECK-NEXT: vfadd.vf v12, v10, ft0
				; CHECK-NEXT: vmerge.vvm v10, v10, v12, v0
				; CHECK-NEXT: vfsgnjx.vv v12, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v12, ft1
				; CHECK-NEXT: vfsgnj.vv v10, v10, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v10, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 8 x half> @llvm.ceil.nxv8f16(<vscale x 8 x half> %x)
				ret <vscale x 8 x half> %a
				}
				declare <vscale x 8 x half> @llvm.ceil.nxv8f16(<vscale x 8 x half>)

				define <vscale x 16 x half> @ceil_nxv16f16(<vscale x 16 x half> %x) {
				; CHECK-LABEL: ceil_nxv16f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e16, m4, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v12, v8
				; CHECK-NEXT: vfcvt.f.x.v v12, v12
				; CHECK-NEXT: lui a0, %hi(.LCPI4_0)
				; CHECK-NEXT: flh ft0, %lo(.LCPI4_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v12, v8
				; CHECK-NEXT: lui a0, %hi(.LCPI4_1)
				; CHECK-NEXT: flh ft1, %lo(.LCPI4_1)(a0)
				; CHECK-NEXT: vfadd.vf v16, v12, ft0
				; CHECK-NEXT: vmerge.vvm v12, v12, v16, v0
				; CHECK-NEXT: vfsgnjx.vv v16, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v16, ft1
				; CHECK-NEXT: vfsgnj.vv v12, v12, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v12, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 16 x half> @llvm.ceil.nxv16f16(<vscale x 16 x half> %x)
				ret <vscale x 16 x half> %a
				}
				declare <vscale x 16 x half> @llvm.ceil.nxv16f16(<vscale x 16 x half>)

				define <vscale x 32 x half> @ceil_nxv32f16(<vscale x 32 x half> %x) {
				; CHECK-LABEL: ceil_nxv32f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e16, m8, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v16, v8
				; CHECK-NEXT: vfcvt.f.x.v v16, v16
				; CHECK-NEXT: lui a0, %hi(.LCPI5_0)
				; CHECK-NEXT: flh ft0, %lo(.LCPI5_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v16, v8
				; CHECK-NEXT: lui a0, %hi(.LCPI5_1)
				; CHECK-NEXT: flh ft1, %lo(.LCPI5_1)(a0)
				; CHECK-NEXT: vfadd.vf v24, v16, ft0
				; CHECK-NEXT: vmerge.vvm v16, v16, v24, v0
				; CHECK-NEXT: vfsgnjx.vv v24, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v24, ft1
				; CHECK-NEXT: vfsgnj.vv v16, v16, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v16, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 32 x half> @llvm.ceil.nxv32f16(<vscale x 32 x half> %x)
				ret <vscale x 32 x half> %a
				}
				declare <vscale x 32 x half> @llvm.ceil.nxv32f16(<vscale x 32 x half>)

				define <vscale x 1 x float> @ceil_nxv1f32(<vscale x 1 x float> %x) {
				; CHECK-LABEL: ceil_nxv1f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
				; CHECK-NEXT: vfcvt.f.x.v v9, v9
				; CHECK-NEXT: lui a0, %hi(.LCPI6_0)
				; CHECK-NEXT: flw ft0, %lo(.LCPI6_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v9, v8
				; CHECK-NEXT: lui a0, %hi(.LCPI6_1)
				; CHECK-NEXT: flw ft1, %lo(.LCPI6_1)(a0)
				; CHECK-NEXT: vfadd.vf v10, v9, ft0
				; CHECK-NEXT: vmerge.vvm v9, v9, v10, v0
				; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v10, ft1
				; CHECK-NEXT: vfsgnj.vv v9, v9, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 1 x float> @llvm.ceil.nxv1f32(<vscale x 1 x float> %x)
				ret <vscale x 1 x float> %a
				}
				declare <vscale x 1 x float> @llvm.ceil.nxv1f32(<vscale x 1 x float>)

				define <vscale x 2 x float> @ceil_nxv2f32(<vscale x 2 x float> %x) {
				; CHECK-LABEL: ceil_nxv2f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
				; CHECK-NEXT: vfcvt.f.x.v v9, v9
				; CHECK-NEXT: lui a0, %hi(.LCPI7_0)
				; CHECK-NEXT: flw ft0, %lo(.LCPI7_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v9, v8
				; CHECK-NEXT: lui a0, %hi(.LCPI7_1)
				; CHECK-NEXT: flw ft1, %lo(.LCPI7_1)(a0)
				; CHECK-NEXT: vfadd.vf v10, v9, ft0
				; CHECK-NEXT: vmerge.vvm v9, v9, v10, v0
				; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v10, ft1
				; CHECK-NEXT: vfsgnj.vv v9, v9, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 2 x float> @llvm.ceil.nxv2f32(<vscale x 2 x float> %x)
				ret <vscale x 2 x float> %a
				}
				declare <vscale x 2 x float> @llvm.ceil.nxv2f32(<vscale x 2 x float>)

				define <vscale x 4 x float> @ceil_nxv4f32(<vscale x 4 x float> %x) {
				; CHECK-LABEL: ceil_nxv4f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v10, v8
				; CHECK-NEXT: vfcvt.f.x.v v10, v10
				; CHECK-NEXT: lui a0, %hi(.LCPI8_0)
				; CHECK-NEXT: flw ft0, %lo(.LCPI8_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v10, v8
				; CHECK-NEXT: lui a0, %hi(.LCPI8_1)
				; CHECK-NEXT: flw ft1, %lo(.LCPI8_1)(a0)
				; CHECK-NEXT: vfadd.vf v12, v10, ft0
				; CHECK-NEXT: vmerge.vvm v10, v10, v12, v0
				; CHECK-NEXT: vfsgnjx.vv v12, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v12, ft1
				; CHECK-NEXT: vfsgnj.vv v10, v10, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v10, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 4 x float> @llvm.ceil.nxv4f32(<vscale x 4 x float> %x)
				ret <vscale x 4 x float> %a
				}
				declare <vscale x 4 x float> @llvm.ceil.nxv4f32(<vscale x 4 x float>)

				define <vscale x 8 x float> @ceil_nxv8f32(<vscale x 8 x float> %x) {
				; CHECK-LABEL: ceil_nxv8f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e32, m4, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v12, v8
				; CHECK-NEXT: vfcvt.f.x.v v12, v12
				; CHECK-NEXT: lui a0, %hi(.LCPI9_0)
				; CHECK-NEXT: flw ft0, %lo(.LCPI9_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v12, v8
				; CHECK-NEXT: lui a0, %hi(.LCPI9_1)
				; CHECK-NEXT: flw ft1, %lo(.LCPI9_1)(a0)
				; CHECK-NEXT: vfadd.vf v16, v12, ft0
				; CHECK-NEXT: vmerge.vvm v12, v12, v16, v0
				; CHECK-NEXT: vfsgnjx.vv v16, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v16, ft1
				; CHECK-NEXT: vfsgnj.vv v12, v12, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v12, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 8 x float> @llvm.ceil.nxv8f32(<vscale x 8 x float> %x)
				ret <vscale x 8 x float> %a
				}
				declare <vscale x 8 x float> @llvm.ceil.nxv8f32(<vscale x 8 x float>)

				define <vscale x 16 x float> @ceil_nxv16f32(<vscale x 16 x float> %x) {
				; CHECK-LABEL: ceil_nxv16f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e32, m8, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v16, v8
				; CHECK-NEXT: vfcvt.f.x.v v16, v16
				; CHECK-NEXT: lui a0, %hi(.LCPI10_0)
				; CHECK-NEXT: flw ft0, %lo(.LCPI10_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v16, v8
				; CHECK-NEXT: lui a0, %hi(.LCPI10_1)
				; CHECK-NEXT: flw ft1, %lo(.LCPI10_1)(a0)
				; CHECK-NEXT: vfadd.vf v24, v16, ft0
				; CHECK-NEXT: vmerge.vvm v16, v16, v24, v0
				; CHECK-NEXT: vfsgnjx.vv v24, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v24, ft1
				; CHECK-NEXT: vfsgnj.vv v16, v16, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v16, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 16 x float> @llvm.ceil.nxv16f32(<vscale x 16 x float> %x)
				ret <vscale x 16 x float> %a
				}
				declare <vscale x 16 x float> @llvm.ceil.nxv16f32(<vscale x 16 x float>)

				define <vscale x 1 x double> @ceil_nxv1f64(<vscale x 1 x double> %x) {
				; CHECK-LABEL: ceil_nxv1f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
				; CHECK-NEXT: vfcvt.f.x.v v9, v9
				; CHECK-NEXT: lui a0, %hi(.LCPI11_0)
				; CHECK-NEXT: fld ft0, %lo(.LCPI11_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v9, v8
				; CHECK-NEXT: lui a0, %hi(.LCPI11_1)
				; CHECK-NEXT: fld ft1, %lo(.LCPI11_1)(a0)
				; CHECK-NEXT: vfadd.vf v10, v9, ft0
				; CHECK-NEXT: vmerge.vvm v9, v9, v10, v0
				; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v10, ft1
				; CHECK-NEXT: vfsgnj.vv v9, v9, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 1 x double> @llvm.ceil.nxv1f64(<vscale x 1 x double> %x)
				ret <vscale x 1 x double> %a
				}
				declare <vscale x 1 x double> @llvm.ceil.nxv1f64(<vscale x 1 x double>)

				define <vscale x 2 x double> @ceil_nxv2f64(<vscale x 2 x double> %x) {
				; CHECK-LABEL: ceil_nxv2f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e64, m2, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v10, v8
				; CHECK-NEXT: vfcvt.f.x.v v10, v10
				; CHECK-NEXT: lui a0, %hi(.LCPI12_0)
				; CHECK-NEXT: fld ft0, %lo(.LCPI12_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v10, v8
				; CHECK-NEXT: lui a0, %hi(.LCPI12_1)
				; CHECK-NEXT: fld ft1, %lo(.LCPI12_1)(a0)
				; CHECK-NEXT: vfadd.vf v12, v10, ft0
				; CHECK-NEXT: vmerge.vvm v10, v10, v12, v0
				; CHECK-NEXT: vfsgnjx.vv v12, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v12, ft1
				; CHECK-NEXT: vfsgnj.vv v10, v10, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v10, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 2 x double> @llvm.ceil.nxv2f64(<vscale x 2 x double> %x)
				ret <vscale x 2 x double> %a
				}
				declare <vscale x 2 x double> @llvm.ceil.nxv2f64(<vscale x 2 x double>)

				define <vscale x 4 x double> @ceil_nxv4f64(<vscale x 4 x double> %x) {
				; CHECK-LABEL: ceil_nxv4f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e64, m4, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v12, v8
				; CHECK-NEXT: vfcvt.f.x.v v12, v12
				; CHECK-NEXT: lui a0, %hi(.LCPI13_0)
				; CHECK-NEXT: fld ft0, %lo(.LCPI13_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v12, v8
				; CHECK-NEXT: lui a0, %hi(.LCPI13_1)
				; CHECK-NEXT: fld ft1, %lo(.LCPI13_1)(a0)
				; CHECK-NEXT: vfadd.vf v16, v12, ft0
				; CHECK-NEXT: vmerge.vvm v12, v12, v16, v0
				; CHECK-NEXT: vfsgnjx.vv v16, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v16, ft1
				; CHECK-NEXT: vfsgnj.vv v12, v12, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v12, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 4 x double> @llvm.ceil.nxv4f64(<vscale x 4 x double> %x)
				ret <vscale x 4 x double> %a
				}
				declare <vscale x 4 x double> @llvm.ceil.nxv4f64(<vscale x 4 x double>)

				define <vscale x 8 x double> @ceil_nxv8f64(<vscale x 8 x double> %x) {
				; CHECK-LABEL: ceil_nxv8f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e64, m8, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v16, v8
				; CHECK-NEXT: vfcvt.f.x.v v16, v16
				; CHECK-NEXT: lui a0, %hi(.LCPI14_0)
				; CHECK-NEXT: fld ft0, %lo(.LCPI14_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v16, v8
				; CHECK-NEXT: lui a0, %hi(.LCPI14_1)
				; CHECK-NEXT: fld ft1, %lo(.LCPI14_1)(a0)
				; CHECK-NEXT: vfadd.vf v24, v16, ft0
				; CHECK-NEXT: vmerge.vvm v16, v16, v24, v0
				; CHECK-NEXT: vfsgnjx.vv v24, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v24, ft1
				; CHECK-NEXT: vfsgnj.vv v16, v16, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v16, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 8 x double> @llvm.ceil.nxv8f64(<vscale x 8 x double> %x)
				ret <vscale x 8 x double> %a
				}
				declare <vscale x 8 x double> @llvm.ceil.nxv8f64(<vscale x 8 x double>)

llvm/test/CodeGen/RISCV/rvv/ffloor-sdnode.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc -mtriple=riscv32 -mattr=+d,+experimental-zfh,+experimental-v -target-abi=ilp32d \
				; RUN: -verify-machineinstrs < %s \| FileCheck %s
				; RUN: llc -mtriple=riscv64 -mattr=+d,+experimental-zfh,+experimental-v -target-abi=lp64d \
				; RUN: -verify-machineinstrs < %s \| FileCheck %s

				define <vscale x 1 x half> @floor_nxv1f16(<vscale x 1 x half> %x) {
				; CHECK-LABEL: floor_nxv1f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
				; CHECK-NEXT: vfcvt.f.x.v v9, v9
				; CHECK-NEXT: lui a0, %hi(.LCPI0_0)
				; CHECK-NEXT: flh ft0, %lo(.LCPI0_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v8, v9
				; CHECK-NEXT: lui a0, %hi(.LCPI0_1)
				; CHECK-NEXT: flh ft1, %lo(.LCPI0_1)(a0)
				; CHECK-NEXT: vfsub.vf v10, v9, ft0
				; CHECK-NEXT: vmerge.vvm v9, v9, v10, v0
				; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v10, ft1
				; CHECK-NEXT: vfsgnj.vv v9, v9, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 1 x half> @llvm.floor.nxv1f16(<vscale x 1 x half> %x)
				ret <vscale x 1 x half> %a
				}
				declare <vscale x 1 x half> @llvm.floor.nxv1f16(<vscale x 1 x half>)

				define <vscale x 2 x half> @floor_nxv2f16(<vscale x 2 x half> %x) {
				; CHECK-LABEL: floor_nxv2f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
				; CHECK-NEXT: vfcvt.f.x.v v9, v9
				; CHECK-NEXT: lui a0, %hi(.LCPI1_0)
				; CHECK-NEXT: flh ft0, %lo(.LCPI1_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v8, v9
				; CHECK-NEXT: lui a0, %hi(.LCPI1_1)
				; CHECK-NEXT: flh ft1, %lo(.LCPI1_1)(a0)
				; CHECK-NEXT: vfsub.vf v10, v9, ft0
				; CHECK-NEXT: vmerge.vvm v9, v9, v10, v0
				; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v10, ft1
				; CHECK-NEXT: vfsgnj.vv v9, v9, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 2 x half> @llvm.floor.nxv2f16(<vscale x 2 x half> %x)
				ret <vscale x 2 x half> %a
				}
				declare <vscale x 2 x half> @llvm.floor.nxv2f16(<vscale x 2 x half>)

				define <vscale x 4 x half> @floor_nxv4f16(<vscale x 4 x half> %x) {
				; CHECK-LABEL: floor_nxv4f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
				; CHECK-NEXT: vfcvt.f.x.v v9, v9
				; CHECK-NEXT: lui a0, %hi(.LCPI2_0)
				; CHECK-NEXT: flh ft0, %lo(.LCPI2_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v8, v9
				; CHECK-NEXT: lui a0, %hi(.LCPI2_1)
				; CHECK-NEXT: flh ft1, %lo(.LCPI2_1)(a0)
				; CHECK-NEXT: vfsub.vf v10, v9, ft0
				; CHECK-NEXT: vmerge.vvm v9, v9, v10, v0
				; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v10, ft1
				; CHECK-NEXT: vfsgnj.vv v9, v9, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 4 x half> @llvm.floor.nxv4f16(<vscale x 4 x half> %x)
				ret <vscale x 4 x half> %a
				}
				declare <vscale x 4 x half> @llvm.floor.nxv4f16(<vscale x 4 x half>)

				define <vscale x 8 x half> @floor_nxv8f16(<vscale x 8 x half> %x) {
				; CHECK-LABEL: floor_nxv8f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e16, m2, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v10, v8
				; CHECK-NEXT: vfcvt.f.x.v v10, v10
				; CHECK-NEXT: lui a0, %hi(.LCPI3_0)
				; CHECK-NEXT: flh ft0, %lo(.LCPI3_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v8, v10
				; CHECK-NEXT: lui a0, %hi(.LCPI3_1)
				; CHECK-NEXT: flh ft1, %lo(.LCPI3_1)(a0)
				; CHECK-NEXT: vfsub.vf v12, v10, ft0
				; CHECK-NEXT: vmerge.vvm v10, v10, v12, v0
				; CHECK-NEXT: vfsgnjx.vv v12, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v12, ft1
				; CHECK-NEXT: vfsgnj.vv v10, v10, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v10, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 8 x half> @llvm.floor.nxv8f16(<vscale x 8 x half> %x)
				ret <vscale x 8 x half> %a
				}
				declare <vscale x 8 x half> @llvm.floor.nxv8f16(<vscale x 8 x half>)

				define <vscale x 16 x half> @floor_nxv16f16(<vscale x 16 x half> %x) {
				; CHECK-LABEL: floor_nxv16f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e16, m4, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v12, v8
				; CHECK-NEXT: vfcvt.f.x.v v12, v12
				; CHECK-NEXT: lui a0, %hi(.LCPI4_0)
				; CHECK-NEXT: flh ft0, %lo(.LCPI4_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v8, v12
				; CHECK-NEXT: lui a0, %hi(.LCPI4_1)
				; CHECK-NEXT: flh ft1, %lo(.LCPI4_1)(a0)
				; CHECK-NEXT: vfsub.vf v16, v12, ft0
				; CHECK-NEXT: vmerge.vvm v12, v12, v16, v0
				; CHECK-NEXT: vfsgnjx.vv v16, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v16, ft1
				; CHECK-NEXT: vfsgnj.vv v12, v12, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v12, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 16 x half> @llvm.floor.nxv16f16(<vscale x 16 x half> %x)
				ret <vscale x 16 x half> %a
				}
				declare <vscale x 16 x half> @llvm.floor.nxv16f16(<vscale x 16 x half>)

				define <vscale x 32 x half> @floor_nxv32f16(<vscale x 32 x half> %x) {
				; CHECK-LABEL: floor_nxv32f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e16, m8, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v16, v8
				; CHECK-NEXT: vfcvt.f.x.v v16, v16
				; CHECK-NEXT: lui a0, %hi(.LCPI5_0)
				; CHECK-NEXT: flh ft0, %lo(.LCPI5_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v8, v16
				; CHECK-NEXT: lui a0, %hi(.LCPI5_1)
				; CHECK-NEXT: flh ft1, %lo(.LCPI5_1)(a0)
				; CHECK-NEXT: vfsub.vf v24, v16, ft0
				; CHECK-NEXT: vmerge.vvm v16, v16, v24, v0
				; CHECK-NEXT: vfsgnjx.vv v24, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v24, ft1
				; CHECK-NEXT: vfsgnj.vv v16, v16, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v16, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 32 x half> @llvm.floor.nxv32f16(<vscale x 32 x half> %x)
				ret <vscale x 32 x half> %a
				}
				declare <vscale x 32 x half> @llvm.floor.nxv32f16(<vscale x 32 x half>)

				define <vscale x 1 x float> @floor_nxv1f32(<vscale x 1 x float> %x) {
				; CHECK-LABEL: floor_nxv1f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
				; CHECK-NEXT: vfcvt.f.x.v v9, v9
				; CHECK-NEXT: lui a0, %hi(.LCPI6_0)
				; CHECK-NEXT: flw ft0, %lo(.LCPI6_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v8, v9
				; CHECK-NEXT: lui a0, %hi(.LCPI6_1)
				; CHECK-NEXT: flw ft1, %lo(.LCPI6_1)(a0)
				; CHECK-NEXT: vfsub.vf v10, v9, ft0
				; CHECK-NEXT: vmerge.vvm v9, v9, v10, v0
				; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v10, ft1
				; CHECK-NEXT: vfsgnj.vv v9, v9, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 1 x float> @llvm.floor.nxv1f32(<vscale x 1 x float> %x)
				ret <vscale x 1 x float> %a
				}
				declare <vscale x 1 x float> @llvm.floor.nxv1f32(<vscale x 1 x float>)

				define <vscale x 2 x float> @floor_nxv2f32(<vscale x 2 x float> %x) {
				; CHECK-LABEL: floor_nxv2f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
				; CHECK-NEXT: vfcvt.f.x.v v9, v9
				; CHECK-NEXT: lui a0, %hi(.LCPI7_0)
				; CHECK-NEXT: flw ft0, %lo(.LCPI7_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v8, v9
				; CHECK-NEXT: lui a0, %hi(.LCPI7_1)
				; CHECK-NEXT: flw ft1, %lo(.LCPI7_1)(a0)
				; CHECK-NEXT: vfsub.vf v10, v9, ft0
				; CHECK-NEXT: vmerge.vvm v9, v9, v10, v0
				; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v10, ft1
				; CHECK-NEXT: vfsgnj.vv v9, v9, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 2 x float> @llvm.floor.nxv2f32(<vscale x 2 x float> %x)
				ret <vscale x 2 x float> %a
				}
				declare <vscale x 2 x float> @llvm.floor.nxv2f32(<vscale x 2 x float>)

				define <vscale x 4 x float> @floor_nxv4f32(<vscale x 4 x float> %x) {
				; CHECK-LABEL: floor_nxv4f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v10, v8
				; CHECK-NEXT: vfcvt.f.x.v v10, v10
				; CHECK-NEXT: lui a0, %hi(.LCPI8_0)
				; CHECK-NEXT: flw ft0, %lo(.LCPI8_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v8, v10
				; CHECK-NEXT: lui a0, %hi(.LCPI8_1)
				; CHECK-NEXT: flw ft1, %lo(.LCPI8_1)(a0)
				; CHECK-NEXT: vfsub.vf v12, v10, ft0
				; CHECK-NEXT: vmerge.vvm v10, v10, v12, v0
				; CHECK-NEXT: vfsgnjx.vv v12, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v12, ft1
				; CHECK-NEXT: vfsgnj.vv v10, v10, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v10, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 4 x float> @llvm.floor.nxv4f32(<vscale x 4 x float> %x)
				ret <vscale x 4 x float> %a
				}
				declare <vscale x 4 x float> @llvm.floor.nxv4f32(<vscale x 4 x float>)

				define <vscale x 8 x float> @floor_nxv8f32(<vscale x 8 x float> %x) {
				; CHECK-LABEL: floor_nxv8f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e32, m4, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v12, v8
				; CHECK-NEXT: vfcvt.f.x.v v12, v12
				; CHECK-NEXT: lui a0, %hi(.LCPI9_0)
				; CHECK-NEXT: flw ft0, %lo(.LCPI9_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v8, v12
				; CHECK-NEXT: lui a0, %hi(.LCPI9_1)
				; CHECK-NEXT: flw ft1, %lo(.LCPI9_1)(a0)
				; CHECK-NEXT: vfsub.vf v16, v12, ft0
				; CHECK-NEXT: vmerge.vvm v12, v12, v16, v0
				; CHECK-NEXT: vfsgnjx.vv v16, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v16, ft1
				; CHECK-NEXT: vfsgnj.vv v12, v12, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v12, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 8 x float> @llvm.floor.nxv8f32(<vscale x 8 x float> %x)
				ret <vscale x 8 x float> %a
				}
				declare <vscale x 8 x float> @llvm.floor.nxv8f32(<vscale x 8 x float>)

				define <vscale x 16 x float> @floor_nxv16f32(<vscale x 16 x float> %x) {
				; CHECK-LABEL: floor_nxv16f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e32, m8, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v16, v8
				; CHECK-NEXT: vfcvt.f.x.v v16, v16
				; CHECK-NEXT: lui a0, %hi(.LCPI10_0)
				; CHECK-NEXT: flw ft0, %lo(.LCPI10_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v8, v16
				; CHECK-NEXT: lui a0, %hi(.LCPI10_1)
				; CHECK-NEXT: flw ft1, %lo(.LCPI10_1)(a0)
				; CHECK-NEXT: vfsub.vf v24, v16, ft0
				; CHECK-NEXT: vmerge.vvm v16, v16, v24, v0
				; CHECK-NEXT: vfsgnjx.vv v24, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v24, ft1
				; CHECK-NEXT: vfsgnj.vv v16, v16, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v16, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 16 x float> @llvm.floor.nxv16f32(<vscale x 16 x float> %x)
				ret <vscale x 16 x float> %a
				}
				declare <vscale x 16 x float> @llvm.floor.nxv16f32(<vscale x 16 x float>)

				define <vscale x 1 x double> @floor_nxv1f64(<vscale x 1 x double> %x) {
				; CHECK-LABEL: floor_nxv1f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
				; CHECK-NEXT: vfcvt.f.x.v v9, v9
				; CHECK-NEXT: lui a0, %hi(.LCPI11_0)
				; CHECK-NEXT: fld ft0, %lo(.LCPI11_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v8, v9
				; CHECK-NEXT: lui a0, %hi(.LCPI11_1)
				; CHECK-NEXT: fld ft1, %lo(.LCPI11_1)(a0)
				; CHECK-NEXT: vfsub.vf v10, v9, ft0
				; CHECK-NEXT: vmerge.vvm v9, v9, v10, v0
				; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v10, ft1
				; CHECK-NEXT: vfsgnj.vv v9, v9, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 1 x double> @llvm.floor.nxv1f64(<vscale x 1 x double> %x)
				ret <vscale x 1 x double> %a
				}
				declare <vscale x 1 x double> @llvm.floor.nxv1f64(<vscale x 1 x double>)

				define <vscale x 2 x double> @floor_nxv2f64(<vscale x 2 x double> %x) {
				; CHECK-LABEL: floor_nxv2f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e64, m2, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v10, v8
				; CHECK-NEXT: vfcvt.f.x.v v10, v10
				; CHECK-NEXT: lui a0, %hi(.LCPI12_0)
				; CHECK-NEXT: fld ft0, %lo(.LCPI12_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v8, v10
				; CHECK-NEXT: lui a0, %hi(.LCPI12_1)
				; CHECK-NEXT: fld ft1, %lo(.LCPI12_1)(a0)
				; CHECK-NEXT: vfsub.vf v12, v10, ft0
				; CHECK-NEXT: vmerge.vvm v10, v10, v12, v0
				; CHECK-NEXT: vfsgnjx.vv v12, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v12, ft1
				; CHECK-NEXT: vfsgnj.vv v10, v10, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v10, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 2 x double> @llvm.floor.nxv2f64(<vscale x 2 x double> %x)
				ret <vscale x 2 x double> %a
				}
				declare <vscale x 2 x double> @llvm.floor.nxv2f64(<vscale x 2 x double>)

				define <vscale x 4 x double> @floor_nxv4f64(<vscale x 4 x double> %x) {
				; CHECK-LABEL: floor_nxv4f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e64, m4, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v12, v8
				; CHECK-NEXT: vfcvt.f.x.v v12, v12
				; CHECK-NEXT: lui a0, %hi(.LCPI13_0)
				; CHECK-NEXT: fld ft0, %lo(.LCPI13_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v8, v12
				; CHECK-NEXT: lui a0, %hi(.LCPI13_1)
				; CHECK-NEXT: fld ft1, %lo(.LCPI13_1)(a0)
				; CHECK-NEXT: vfsub.vf v16, v12, ft0
				; CHECK-NEXT: vmerge.vvm v12, v12, v16, v0
				; CHECK-NEXT: vfsgnjx.vv v16, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v16, ft1
				; CHECK-NEXT: vfsgnj.vv v12, v12, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v12, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 4 x double> @llvm.floor.nxv4f64(<vscale x 4 x double> %x)
				ret <vscale x 4 x double> %a
				}
				declare <vscale x 4 x double> @llvm.floor.nxv4f64(<vscale x 4 x double>)

				define <vscale x 8 x double> @floor_nxv8f64(<vscale x 8 x double> %x) {
				; CHECK-LABEL: floor_nxv8f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a0, zero, e64, m8, ta, mu
				; CHECK-NEXT: vfcvt.rtz.x.f.v v16, v8
				; CHECK-NEXT: vfcvt.f.x.v v16, v16
				; CHECK-NEXT: lui a0, %hi(.LCPI14_0)
				; CHECK-NEXT: fld ft0, %lo(.LCPI14_0)(a0)
				; CHECK-NEXT: vmflt.vv v0, v8, v16
				; CHECK-NEXT: lui a0, %hi(.LCPI14_1)
				; CHECK-NEXT: fld ft1, %lo(.LCPI14_1)(a0)
				; CHECK-NEXT: vfsub.vf v24, v16, ft0
				; CHECK-NEXT: vmerge.vvm v16, v16, v24, v0
				; CHECK-NEXT: vfsgnjx.vv v24, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v24, ft1
				; CHECK-NEXT: vfsgnj.vv v16, v16, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v16, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 8 x double> @llvm.floor.nxv8f64(<vscale x 8 x double> %x)
				ret <vscale x 8 x double> %a
				}
				declare <vscale x 8 x double> @llvm.floor.nxv8f64(<vscale x 8 x double>)

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp.ll

Show First 20 Lines • Show All 1,957 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%c = insertelement <2 x double> undef, double %z, i32 0		%c = insertelement <2 x double> undef, double %z, i32 0
%d = shufflevector <2 x double> %c, <2 x double> undef, <2 x i32> zeroinitializer		%d = shufflevector <2 x double> %c, <2 x double> undef, <2 x i32> zeroinitializer
%neg = fneg <2 x double> %d		%neg = fneg <2 x double> %d
%neg2 = fneg <2 x double> %b		%neg2 = fneg <2 x double> %b
%e = call <2 x double> @llvm.fma.v2f64(<2 x double> %neg, <2 x double> %a, <2 x double> %neg2)		%e = call <2 x double> @llvm.fma.v2f64(<2 x double> %neg, <2 x double> %a, <2 x double> %neg2)
store <2 x double> %e, <2 x double>* %x		store <2 x double> %e, <2 x double>* %x
ret void		ret void
}		}

		define void @trunc_v8f16(<8 x half>* %x) {
		; CHECK-LABEL: trunc_v8f16:
		; CHECK: # %bb.0:
		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, mu
		; CHECK-NEXT: vle16.v v8, (a0)
		; CHECK-NEXT: lui a1, %hi(.LCPI91_0)
		; CHECK-NEXT: flh ft0, %lo(.LCPI91_0)(a1)
		; CHECK-NEXT: vfsgnjx.vv v9, v8, v8
		; CHECK-NEXT: vmflt.vf v0, v9, ft0
		; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
		; CHECK-NEXT: vfcvt.f.x.v v9, v9
		; CHECK-NEXT: vfsgnj.vv v9, v9, v8
		; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
		; CHECK-NEXT: vse16.v v8, (a0)
		; CHECK-NEXT: ret
		%a = load <8 x half>, <8 x half>* %x
		%b = call <8 x half> @llvm.trunc.v8f16(<8 x half> %a)
		store <8 x half> %b, <8 x half>* %x
		ret void
		}
		declare <8 x half> @llvm.trunc.v8f16(<8 x half>)

		define void @trunc_v4f32(<4 x float>* %x) {
		; CHECK-LABEL: trunc_v4f32:
		; CHECK: # %bb.0:
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
		; CHECK-NEXT: vle32.v v8, (a0)
		; CHECK-NEXT: lui a1, %hi(.LCPI92_0)
		; CHECK-NEXT: flw ft0, %lo(.LCPI92_0)(a1)
		; CHECK-NEXT: vfsgnjx.vv v9, v8, v8
		; CHECK-NEXT: vmflt.vf v0, v9, ft0
		; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
		; CHECK-NEXT: vfcvt.f.x.v v9, v9
		; CHECK-NEXT: vfsgnj.vv v9, v9, v8
		; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
		; CHECK-NEXT: vse32.v v8, (a0)
		; CHECK-NEXT: ret
		%a = load <4 x float>, <4 x float>* %x
		%b = call <4 x float> @llvm.trunc.v4f32(<4 x float> %a)
		store <4 x float> %b, <4 x float>* %x
		ret void
		}
		declare <4 x float> @llvm.trunc.v4f32(<4 x float>)

		define void @trunc_v2f64(<2 x double>* %x) {
		; CHECK-LABEL: trunc_v2f64:
		; CHECK: # %bb.0:
		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
		; CHECK-NEXT: vle64.v v8, (a0)
		; CHECK-NEXT: lui a1, %hi(.LCPI93_0)
		; CHECK-NEXT: fld ft0, %lo(.LCPI93_0)(a1)
		; CHECK-NEXT: vfsgnjx.vv v9, v8, v8
		; CHECK-NEXT: vmflt.vf v0, v9, ft0
		; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
		; CHECK-NEXT: vfcvt.f.x.v v9, v9
		; CHECK-NEXT: vfsgnj.vv v9, v9, v8
		; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
		; CHECK-NEXT: vse64.v v8, (a0)
		; CHECK-NEXT: ret
		%a = load <2 x double>, <2 x double>* %x
		%b = call <2 x double> @llvm.trunc.v2f64(<2 x double> %a)
		store <2 x double> %b, <2 x double>* %x
		ret void
		}
		declare <2 x double> @llvm.trunc.v2f64(<2 x double>)

		define void @ceil_v8f16(<8 x half>* %x) {
		; CHECK-LABEL: ceil_v8f16:
		; CHECK: # %bb.0:
		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, mu
		; CHECK-NEXT: vle16.v v8, (a0)
		; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
		; CHECK-NEXT: vfcvt.f.x.v v9, v9
		; CHECK-NEXT: lui a1, %hi(.LCPI94_0)
		; CHECK-NEXT: flh ft0, %lo(.LCPI94_0)(a1)
		; CHECK-NEXT: vmflt.vv v0, v9, v8
		; CHECK-NEXT: lui a1, %hi(.LCPI94_1)
		; CHECK-NEXT: flh ft1, %lo(.LCPI94_1)(a1)
		; CHECK-NEXT: vfadd.vf v10, v9, ft0
		; CHECK-NEXT: vmerge.vvm v9, v9, v10, v0
		; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
		; CHECK-NEXT: vmflt.vf v0, v10, ft1
		; CHECK-NEXT: vfsgnj.vv v9, v9, v8
		; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
		; CHECK-NEXT: vse16.v v8, (a0)
		; CHECK-NEXT: ret
		%a = load <8 x half>, <8 x half>* %x
		%b = call <8 x half> @llvm.ceil.v8f16(<8 x half> %a)
		store <8 x half> %b, <8 x half>* %x
		ret void
		}
		declare <8 x half> @llvm.ceil.v8f16(<8 x half>)

		define void @ceil_v4f32(<4 x float>* %x) {
		; CHECK-LABEL: ceil_v4f32:
		; CHECK: # %bb.0:
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
		; CHECK-NEXT: vle32.v v8, (a0)
		; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
		; CHECK-NEXT: vfcvt.f.x.v v9, v9
		; CHECK-NEXT: lui a1, %hi(.LCPI95_0)
		; CHECK-NEXT: flw ft0, %lo(.LCPI95_0)(a1)
		; CHECK-NEXT: vmflt.vv v0, v9, v8
		; CHECK-NEXT: lui a1, %hi(.LCPI95_1)
		; CHECK-NEXT: flw ft1, %lo(.LCPI95_1)(a1)
		; CHECK-NEXT: vfadd.vf v10, v9, ft0
		; CHECK-NEXT: vmerge.vvm v9, v9, v10, v0
		; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
		; CHECK-NEXT: vmflt.vf v0, v10, ft1
		; CHECK-NEXT: vfsgnj.vv v9, v9, v8
		; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
		; CHECK-NEXT: vse32.v v8, (a0)
		; CHECK-NEXT: ret
		%a = load <4 x float>, <4 x float>* %x
		%b = call <4 x float> @llvm.ceil.v4f32(<4 x float> %a)
		store <4 x float> %b, <4 x float>* %x
		ret void
		}
		declare <4 x float> @llvm.ceil.v4f32(<4 x float>)

		define void @ceil_v2f64(<2 x double>* %x) {
		; CHECK-LABEL: ceil_v2f64:
		; CHECK: # %bb.0:
		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
		; CHECK-NEXT: vle64.v v8, (a0)
		; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
		; CHECK-NEXT: vfcvt.f.x.v v9, v9
		; CHECK-NEXT: lui a1, %hi(.LCPI96_0)
		; CHECK-NEXT: fld ft0, %lo(.LCPI96_0)(a1)
		; CHECK-NEXT: vmflt.vv v0, v9, v8
		; CHECK-NEXT: lui a1, %hi(.LCPI96_1)
		; CHECK-NEXT: fld ft1, %lo(.LCPI96_1)(a1)
		; CHECK-NEXT: vfadd.vf v10, v9, ft0
		; CHECK-NEXT: vmerge.vvm v9, v9, v10, v0
		; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
		; CHECK-NEXT: vmflt.vf v0, v10, ft1
		; CHECK-NEXT: vfsgnj.vv v9, v9, v8
		; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
		; CHECK-NEXT: vse64.v v8, (a0)
		; CHECK-NEXT: ret
		%a = load <2 x double>, <2 x double>* %x
		%b = call <2 x double> @llvm.ceil.v2f64(<2 x double> %a)
		store <2 x double> %b, <2 x double>* %x
		ret void
		}
		declare <2 x double> @llvm.ceil.v2f64(<2 x double>)

		define void @floor_v8f16(<8 x half>* %x) {
		; CHECK-LABEL: floor_v8f16:
		; CHECK: # %bb.0:
		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, mu
		; CHECK-NEXT: vle16.v v8, (a0)
		; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
		; CHECK-NEXT: vfcvt.f.x.v v9, v9
		; CHECK-NEXT: lui a1, %hi(.LCPI97_0)
		; CHECK-NEXT: flh ft0, %lo(.LCPI97_0)(a1)
		; CHECK-NEXT: vmflt.vv v0, v8, v9
		; CHECK-NEXT: lui a1, %hi(.LCPI97_1)
		; CHECK-NEXT: flh ft1, %lo(.LCPI97_1)(a1)
		; CHECK-NEXT: vfsub.vf v10, v9, ft0
		; CHECK-NEXT: vmerge.vvm v9, v9, v10, v0
		; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
		; CHECK-NEXT: vmflt.vf v0, v10, ft1
		; CHECK-NEXT: vfsgnj.vv v9, v9, v8
		; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
		; CHECK-NEXT: vse16.v v8, (a0)
		; CHECK-NEXT: ret
		%a = load <8 x half>, <8 x half>* %x
		%b = call <8 x half> @llvm.floor.v8f16(<8 x half> %a)
		store <8 x half> %b, <8 x half>* %x
		ret void
		}
		declare <8 x half> @llvm.floor.v8f16(<8 x half>)

		define void @floor_v4f32(<4 x float>* %x) {
		; CHECK-LABEL: floor_v4f32:
		; CHECK: # %bb.0:
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
		; CHECK-NEXT: vle32.v v8, (a0)
		; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
		; CHECK-NEXT: vfcvt.f.x.v v9, v9
		; CHECK-NEXT: lui a1, %hi(.LCPI98_0)
		; CHECK-NEXT: flw ft0, %lo(.LCPI98_0)(a1)
		; CHECK-NEXT: vmflt.vv v0, v8, v9
		; CHECK-NEXT: lui a1, %hi(.LCPI98_1)
		; CHECK-NEXT: flw ft1, %lo(.LCPI98_1)(a1)
		; CHECK-NEXT: vfsub.vf v10, v9, ft0
		; CHECK-NEXT: vmerge.vvm v9, v9, v10, v0
		; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
		; CHECK-NEXT: vmflt.vf v0, v10, ft1
		; CHECK-NEXT: vfsgnj.vv v9, v9, v8
		; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
		; CHECK-NEXT: vse32.v v8, (a0)
		; CHECK-NEXT: ret
		%a = load <4 x float>, <4 x float>* %x
		%b = call <4 x float> @llvm.floor.v4f32(<4 x float> %a)
		store <4 x float> %b, <4 x float>* %x
		ret void
		}
		declare <4 x float> @llvm.floor.v4f32(<4 x float>)

		define void @floor_v2f64(<2 x double>* %x) {
		; CHECK-LABEL: floor_v2f64:
		; CHECK: # %bb.0:
		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
		; CHECK-NEXT: vle64.v v8, (a0)
		; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
		; CHECK-NEXT: vfcvt.f.x.v v9, v9
		; CHECK-NEXT: lui a1, %hi(.LCPI99_0)
		; CHECK-NEXT: fld ft0, %lo(.LCPI99_0)(a1)
		; CHECK-NEXT: vmflt.vv v0, v8, v9
		; CHECK-NEXT: lui a1, %hi(.LCPI99_1)
		; CHECK-NEXT: fld ft1, %lo(.LCPI99_1)(a1)
		; CHECK-NEXT: vfsub.vf v10, v9, ft0
		; CHECK-NEXT: vmerge.vvm v9, v9, v10, v0
		; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
		; CHECK-NEXT: vmflt.vf v0, v10, ft1
		; CHECK-NEXT: vfsgnj.vv v9, v9, v8
		; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
		; CHECK-NEXT: vse64.v v8, (a0)
		; CHECK-NEXT: ret
		%a = load <2 x double>, <2 x double>* %x
		%b = call <2 x double> @llvm.floor.v2f64(<2 x double> %a)
		store <2 x double> %b, <2 x double>* %x
		ret void
		}
		declare <2 x double> @llvm.floor.v2f64(<2 x double>)

llvm/test/CodeGen/RISCV/rvv/ftrunc-sdnode.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc -mtriple=riscv32 -mattr=+d,+experimental-zfh,+experimental-v -target-abi=ilp32d \
				; RUN: -verify-machineinstrs < %s \| FileCheck %s
				; RUN: llc -mtriple=riscv64 -mattr=+d,+experimental-zfh,+experimental-v -target-abi=lp64d \
				; RUN: -verify-machineinstrs < %s \| FileCheck %s

				define <vscale x 1 x half> @trunc_nxv1f16(<vscale x 1 x half> %x) {
				; CHECK-LABEL: trunc_nxv1f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lui a0, %hi(.LCPI0_0)
				; CHECK-NEXT: flh ft0, %lo(.LCPI0_0)(a0)
				; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, mu
				; CHECK-NEXT: vfsgnjx.vv v9, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v9, ft0
				; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
				; CHECK-NEXT: vfcvt.f.x.v v9, v9
				; CHECK-NEXT: vfsgnj.vv v9, v9, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 1 x half> @llvm.trunc.nxv1f16(<vscale x 1 x half> %x)
				ret <vscale x 1 x half> %a
				}
				declare <vscale x 1 x half> @llvm.trunc.nxv1f16(<vscale x 1 x half>)

				define <vscale x 2 x half> @trunc_nxv2f16(<vscale x 2 x half> %x) {
				; CHECK-LABEL: trunc_nxv2f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lui a0, %hi(.LCPI1_0)
				; CHECK-NEXT: flh ft0, %lo(.LCPI1_0)(a0)
				; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, mu
				; CHECK-NEXT: vfsgnjx.vv v9, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v9, ft0
				; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
				; CHECK-NEXT: vfcvt.f.x.v v9, v9
				; CHECK-NEXT: vfsgnj.vv v9, v9, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 2 x half> @llvm.trunc.nxv2f16(<vscale x 2 x half> %x)
				ret <vscale x 2 x half> %a
				}
				declare <vscale x 2 x half> @llvm.trunc.nxv2f16(<vscale x 2 x half>)

				define <vscale x 4 x half> @trunc_nxv4f16(<vscale x 4 x half> %x) {
				; CHECK-LABEL: trunc_nxv4f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lui a0, %hi(.LCPI2_0)
				; CHECK-NEXT: flh ft0, %lo(.LCPI2_0)(a0)
				; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, mu
				; CHECK-NEXT: vfsgnjx.vv v9, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v9, ft0
				; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
				; CHECK-NEXT: vfcvt.f.x.v v9, v9
				; CHECK-NEXT: vfsgnj.vv v9, v9, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 4 x half> @llvm.trunc.nxv4f16(<vscale x 4 x half> %x)
				ret <vscale x 4 x half> %a
				}
				declare <vscale x 4 x half> @llvm.trunc.nxv4f16(<vscale x 4 x half>)

				define <vscale x 8 x half> @trunc_nxv8f16(<vscale x 8 x half> %x) {
				; CHECK-LABEL: trunc_nxv8f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lui a0, %hi(.LCPI3_0)
				; CHECK-NEXT: flh ft0, %lo(.LCPI3_0)(a0)
				; CHECK-NEXT: vsetvli a0, zero, e16, m2, ta, mu
				; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v10, ft0
				; CHECK-NEXT: vfcvt.rtz.x.f.v v10, v8
				; CHECK-NEXT: vfcvt.f.x.v v10, v10
				; CHECK-NEXT: vfsgnj.vv v10, v10, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v10, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 8 x half> @llvm.trunc.nxv8f16(<vscale x 8 x half> %x)
				ret <vscale x 8 x half> %a
				}
				declare <vscale x 8 x half> @llvm.trunc.nxv8f16(<vscale x 8 x half>)

				define <vscale x 16 x half> @trunc_nxv16f16(<vscale x 16 x half> %x) {
				; CHECK-LABEL: trunc_nxv16f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lui a0, %hi(.LCPI4_0)
				; CHECK-NEXT: flh ft0, %lo(.LCPI4_0)(a0)
				; CHECK-NEXT: vsetvli a0, zero, e16, m4, ta, mu
				; CHECK-NEXT: vfsgnjx.vv v12, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v12, ft0
				; CHECK-NEXT: vfcvt.rtz.x.f.v v12, v8
				; CHECK-NEXT: vfcvt.f.x.v v12, v12
				; CHECK-NEXT: vfsgnj.vv v12, v12, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v12, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 16 x half> @llvm.trunc.nxv16f16(<vscale x 16 x half> %x)
				ret <vscale x 16 x half> %a
				}
				declare <vscale x 16 x half> @llvm.trunc.nxv16f16(<vscale x 16 x half>)

				define <vscale x 32 x half> @trunc_nxv32f16(<vscale x 32 x half> %x) {
				; CHECK-LABEL: trunc_nxv32f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lui a0, %hi(.LCPI5_0)
				; CHECK-NEXT: flh ft0, %lo(.LCPI5_0)(a0)
				; CHECK-NEXT: vsetvli a0, zero, e16, m8, ta, mu
				; CHECK-NEXT: vfsgnjx.vv v16, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v16, ft0
				; CHECK-NEXT: vfcvt.rtz.x.f.v v16, v8
				; CHECK-NEXT: vfcvt.f.x.v v16, v16
				; CHECK-NEXT: vfsgnj.vv v16, v16, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v16, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 32 x half> @llvm.trunc.nxv32f16(<vscale x 32 x half> %x)
				ret <vscale x 32 x half> %a
				}
				declare <vscale x 32 x half> @llvm.trunc.nxv32f16(<vscale x 32 x half>)

				define <vscale x 1 x float> @trunc_nxv1f32(<vscale x 1 x float> %x) {
				; CHECK-LABEL: trunc_nxv1f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lui a0, %hi(.LCPI6_0)
				; CHECK-NEXT: flw ft0, %lo(.LCPI6_0)(a0)
				; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, mu
				; CHECK-NEXT: vfsgnjx.vv v9, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v9, ft0
				; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
				; CHECK-NEXT: vfcvt.f.x.v v9, v9
				; CHECK-NEXT: vfsgnj.vv v9, v9, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 1 x float> @llvm.trunc.nxv1f32(<vscale x 1 x float> %x)
				ret <vscale x 1 x float> %a
				}
				declare <vscale x 1 x float> @llvm.trunc.nxv1f32(<vscale x 1 x float>)

				define <vscale x 2 x float> @trunc_nxv2f32(<vscale x 2 x float> %x) {
				; CHECK-LABEL: trunc_nxv2f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lui a0, %hi(.LCPI7_0)
				; CHECK-NEXT: flw ft0, %lo(.LCPI7_0)(a0)
				; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, mu
				; CHECK-NEXT: vfsgnjx.vv v9, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v9, ft0
				; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
				; CHECK-NEXT: vfcvt.f.x.v v9, v9
				; CHECK-NEXT: vfsgnj.vv v9, v9, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 2 x float> @llvm.trunc.nxv2f32(<vscale x 2 x float> %x)
				ret <vscale x 2 x float> %a
				}
				declare <vscale x 2 x float> @llvm.trunc.nxv2f32(<vscale x 2 x float>)

				define <vscale x 4 x float> @trunc_nxv4f32(<vscale x 4 x float> %x) {
				; CHECK-LABEL: trunc_nxv4f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lui a0, %hi(.LCPI8_0)
				; CHECK-NEXT: flw ft0, %lo(.LCPI8_0)(a0)
				; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, mu
				; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v10, ft0
				; CHECK-NEXT: vfcvt.rtz.x.f.v v10, v8
				; CHECK-NEXT: vfcvt.f.x.v v10, v10
				; CHECK-NEXT: vfsgnj.vv v10, v10, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v10, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 4 x float> @llvm.trunc.nxv4f32(<vscale x 4 x float> %x)
				ret <vscale x 4 x float> %a
				}
				declare <vscale x 4 x float> @llvm.trunc.nxv4f32(<vscale x 4 x float>)

				define <vscale x 8 x float> @trunc_nxv8f32(<vscale x 8 x float> %x) {
				; CHECK-LABEL: trunc_nxv8f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lui a0, %hi(.LCPI9_0)
				; CHECK-NEXT: flw ft0, %lo(.LCPI9_0)(a0)
				; CHECK-NEXT: vsetvli a0, zero, e32, m4, ta, mu
				; CHECK-NEXT: vfsgnjx.vv v12, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v12, ft0
				; CHECK-NEXT: vfcvt.rtz.x.f.v v12, v8
				; CHECK-NEXT: vfcvt.f.x.v v12, v12
				; CHECK-NEXT: vfsgnj.vv v12, v12, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v12, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 8 x float> @llvm.trunc.nxv8f32(<vscale x 8 x float> %x)
				ret <vscale x 8 x float> %a
				}
				declare <vscale x 8 x float> @llvm.trunc.nxv8f32(<vscale x 8 x float>)

				define <vscale x 16 x float> @trunc_nxv16f32(<vscale x 16 x float> %x) {
				; CHECK-LABEL: trunc_nxv16f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lui a0, %hi(.LCPI10_0)
				; CHECK-NEXT: flw ft0, %lo(.LCPI10_0)(a0)
				; CHECK-NEXT: vsetvli a0, zero, e32, m8, ta, mu
				; CHECK-NEXT: vfsgnjx.vv v16, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v16, ft0
				; CHECK-NEXT: vfcvt.rtz.x.f.v v16, v8
				; CHECK-NEXT: vfcvt.f.x.v v16, v16
				; CHECK-NEXT: vfsgnj.vv v16, v16, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v16, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 16 x float> @llvm.trunc.nxv16f32(<vscale x 16 x float> %x)
				ret <vscale x 16 x float> %a
				}
				declare <vscale x 16 x float> @llvm.trunc.nxv16f32(<vscale x 16 x float>)

				define <vscale x 1 x double> @trunc_nxv1f64(<vscale x 1 x double> %x) {
				; CHECK-LABEL: trunc_nxv1f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lui a0, %hi(.LCPI11_0)
				; CHECK-NEXT: fld ft0, %lo(.LCPI11_0)(a0)
				; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, mu
				; CHECK-NEXT: vfsgnjx.vv v9, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v9, ft0
				; CHECK-NEXT: vfcvt.rtz.x.f.v v9, v8
				; CHECK-NEXT: vfcvt.f.x.v v9, v9
				; CHECK-NEXT: vfsgnj.vv v9, v9, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 1 x double> @llvm.trunc.nxv1f64(<vscale x 1 x double> %x)
				ret <vscale x 1 x double> %a
				}
				declare <vscale x 1 x double> @llvm.trunc.nxv1f64(<vscale x 1 x double>)

				define <vscale x 2 x double> @trunc_nxv2f64(<vscale x 2 x double> %x) {
				; CHECK-LABEL: trunc_nxv2f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lui a0, %hi(.LCPI12_0)
				; CHECK-NEXT: fld ft0, %lo(.LCPI12_0)(a0)
				; CHECK-NEXT: vsetvli a0, zero, e64, m2, ta, mu
				; CHECK-NEXT: vfsgnjx.vv v10, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v10, ft0
				; CHECK-NEXT: vfcvt.rtz.x.f.v v10, v8
				; CHECK-NEXT: vfcvt.f.x.v v10, v10
				; CHECK-NEXT: vfsgnj.vv v10, v10, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v10, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 2 x double> @llvm.trunc.nxv2f64(<vscale x 2 x double> %x)
				ret <vscale x 2 x double> %a
				}
				declare <vscale x 2 x double> @llvm.trunc.nxv2f64(<vscale x 2 x double>)

				define <vscale x 4 x double> @trunc_nxv4f64(<vscale x 4 x double> %x) {
				; CHECK-LABEL: trunc_nxv4f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lui a0, %hi(.LCPI13_0)
				; CHECK-NEXT: fld ft0, %lo(.LCPI13_0)(a0)
				; CHECK-NEXT: vsetvli a0, zero, e64, m4, ta, mu
				; CHECK-NEXT: vfsgnjx.vv v12, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v12, ft0
				; CHECK-NEXT: vfcvt.rtz.x.f.v v12, v8
				; CHECK-NEXT: vfcvt.f.x.v v12, v12
				; CHECK-NEXT: vfsgnj.vv v12, v12, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v12, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 4 x double> @llvm.trunc.nxv4f64(<vscale x 4 x double> %x)
				ret <vscale x 4 x double> %a
				}
				declare <vscale x 4 x double> @llvm.trunc.nxv4f64(<vscale x 4 x double>)

				define <vscale x 8 x double> @trunc_nxv8f64(<vscale x 8 x double> %x) {
				; CHECK-LABEL: trunc_nxv8f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lui a0, %hi(.LCPI14_0)
				; CHECK-NEXT: fld ft0, %lo(.LCPI14_0)(a0)
				; CHECK-NEXT: vsetvli a0, zero, e64, m8, ta, mu
				; CHECK-NEXT: vfsgnjx.vv v16, v8, v8
				; CHECK-NEXT: vmflt.vf v0, v16, ft0
				; CHECK-NEXT: vfcvt.rtz.x.f.v v16, v8
				; CHECK-NEXT: vfcvt.f.x.v v16, v16
				; CHECK-NEXT: vfsgnj.vv v16, v16, v8
				; CHECK-NEXT: vmerge.vvm v8, v8, v16, v0
				; CHECK-NEXT: ret
				%a = call <vscale x 8 x double> @llvm.trunc.nxv8f64(<vscale x 8 x double> %x)
				ret <vscale x 8 x double> %a
				}
				declare <vscale x 8 x double> @llvm.trunc.nxv8f64(<vscale x 8 x double>)