This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Reuse VL (if non-zero) when building single element vector for start of reduction chain
ClosedPublic

Authored by reames on Dec 8 2022, 11:32 AM.

Download Raw Diff

Details

Reviewers

craig.topper
asb
• pcwang-thead
kito-cheng

Commits

rG668cde81df53: [RISCV] Reuse VL (if non-zero) when building single element vector for start of…

Summary

This is an alternative patch on a path to D137530.

The basic problem being tackled here is that we need to place a scalar into lane 0 of a vector register before our reduction instructions. Since we only care about lane 0 of the vector, we can use any VL >= 1 provided that the total amount of work performed matches the work performed for a VL=1.

This change does not contain the logic from D137530 to perform the insert at the original VT, and then extract down to LMUL1. That turns out to be a good choice, as discussion in this review has indicated there are issues around LMUL2 and above with our representation of vmv.s.x. We'd also need to be careful with the splat logic for the same reasons.

The only potentially concerning codegen change I spot here is that we stop using a broadcast load (for VL=1) and instead do a scalar load and insert. I think this is probably reasonable; if reviewers disagree, I can investigate using a broadcast load which writes to the undef lanes. If we want to do that, we should do it for VECTOR_INSERT_ELT as well, so that'll end up as it's own patch series.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

reames created this revision.Dec 8 2022, 11:32 AM

Herald added a project: Restricted Project. · View Herald TranscriptDec 8 2022, 11:32 AM

Herald added subscribers: sunshaoce, VincentWu, StephenFan and 29 others. · View Herald Transcript

reames requested review of this revision.Dec 8 2022, 11:32 AM

Herald added a project: Restricted Project. · View Herald TranscriptDec 8 2022, 11:32 AM

Herald added subscribers: eopXD, MaskRay. · View Herald Transcript

Harbormaster completed remote builds in B202041: Diff 481374.Dec 8 2022, 11:33 AM

reames mentioned this in D137530: [RISCV] Splat scalar to be of length VL instead of 1 for reductions.Dec 8 2022, 11:36 AM

reames added a parent revision: D139648: [RISCV] Use vmv.v.i for insertion into lane 0 of undef vector when profitable.

Some thoughts

What if we had a a second set of VMV_S_X pseudos with LMUL1 register class, but LMUL=1,2,4,8,etc. in TSFlags for the vsetvli insertion pass to see.

We'd need a second ISD node that takes LMUL as an operand since it can't use the type. Then isel could pick the pseudo with the correct LMUL in TSFlags.

We would match the LMUL to the input type of the reduction instead of using LMUL=1.

For non-VP reductions, the VL would be the fixed width or vlmax VL. For VP, we'd still need to deal with zero vs non-zero VL to have correct behavior.

Talked to Craig because I hadn't followed his last comment.

The issue that we have is that vmv.x.s is modeled badly. We model it as if it had an LMUL8 variant, but if you read the actual instruction manual you'll see that it ignores register groups and only writes to a single register. This isn't a correctness concern, but it does mean that this patch over constrains the register allocator (by using a lmul8 reg class), which could result in poor codegen. This is only an issue for this call site as the previous callsite (earlier change in stack), already had this issue and was likely going to write to the full LMUL8 register group in the following instruction anyways. The reduction instruction also only writes to a single vector register.

In D139656#3982876, @reames wrote:

Talked to Craig because I hadn't followed his last comment.

The issue that we have is that vmv.x.s is modeled badly. We model it as if it had an LMUL8 variant, but if you read the actual instruction manual you'll see that it ignores register groups and only writes to a single register. This isn't a correctness concern, but it does mean that this patch over constrains the register allocator (by using a lmul8 reg class), which could result in poor codegen. This is only an issue for this call site as the previous callsite (earlier change in stack), already had this issue and was likely going to write to the full LMUL8 register group in the following instruction anyways. The reduction instruction also only writes to a single vector register.

If I understand correctly, the concern is, though the vmv.s.x/vmv.s.f ignore LMUL and vector register groups, we will still allocate a register with LMUL>1 register class for them, which will result in bad register allocation. And this is same for the destination register of reduction instructions.
Hmmmm…so we may apply these optimizations only for LMUL<=1, or redesign the pseudos of vmv.s.x/vmv.s.f and reductions (sooner of later).

• pcwang-thead mentioned this in D139699: [RISCV][WIP] Add register class for instructions that ignore register groups.Dec 9 2022, 2:24 AM

reames added a parent revision: D139733: [RISCV] Share reduction lowering code for vp.reduce.Dec 9 2022, 11:22 AM

reames planned changes to this revision.Dec 9 2022, 4:09 PM

reames added a parent revision: D139747: [RISCV] Allow fractional LMUL for reduction start value.

Rebase over landed changes, and request re-review.

@craig.topper Can you take a second look at this? I think we might have been chasing a red herring on the LMUL2 and above concern for this patch. This patch specifically only reuses VL at a callsite where we know that lmul is constrained to LMUL1 or less. As such, I don't think we can get the over-constrained vmv.s.x issue we'd discussed in this patch.

It's definitely still a real issue which can be exercised from the insert element path, but that has not (edit!) changed with this patch (or the preceding patches).

reames retitled this revision from [RISCV] Build single element vector for start of reduction change to [RISCV] Reuse VL (if non-zero) when building single element vector for start of reduction change.Dec 13 2022, 11:00 AM

reames edited the summary of this revision. (Show Details)

reames retitled this revision from [RISCV] Reuse VL (if non-zero) when building single element vector for start of reduction change to [RISCV] Reuse VL (if non-zero) when building single element vector for start of reduction chain.

LGTM

This revision is now accepted and ready to land.Dec 13 2022, 11:22 AM

In D139656#3992661, @reames wrote:

Rebase over landed changes, and request re-review.

@craig.topper Can you take a second look at this? I think we might have been chasing a red herring on the LMUL2 and above concern for this patch. This patch specifically only reuses VL at a callsite where we know that lmul is constrained to LMUL1 or less. As such, I don't think we can get the over-constrained vmv.s.x issue we'd discussed in this patch.

It's definitely still a real issue which can be exercised from the insert element path, but that has not (edit!) changed with this patch (or the preceding patches).

I think the overconstrained regalloc came up when we talked about using LMUL>1 vmv.s.x and an extract to LMUL=1. We still have a lot of vsetvlis in the LMUL>1 tests that could be removed.

This revision was landed with ongoing or failed builds.Dec 13 2022, 12:16 PM

Closed by commit rG668cde81df53: [RISCV] Reuse VL (if non-zero) when building single element vector for start of… (authored by reames). · Explain Why

This revision was automatically updated to reflect the committed changes.

reames added a commit: rG668cde81df53: [RISCV] Reuse VL (if non-zero) when building single element vector for start of….

Harbormaster completed remote builds in B202907: Diff 482558.Dec 13 2022, 12:45 PM

reames mentioned this in D140027: [RISCV] Avoid generate large LMUL vmv.s.x or fvmv.s.f.Dec 14 2022, 7:58 AM

reames mentioned this in rGd86011984e27: [RISCV] Avoid generate large LMUL vmv.s.x or fvmv.s.f.Dec 14 2022, 10:54 AM

• pcwang-thead mentioned this in D151653: [RISCV] Combine vmv.s.x of constants into vmv.v.i.May 29 2023, 7:59 PM

Revision Contents

Path

Size

llvm/

lib/

Target/

RISCV/

RISCVISelLowering.cpp

14 lines

test/

CodeGen/

RISCV/

rvv/

fixed-vectors-reduction-fp.ll

1040 lines

fixed-vectors-reduction-int.ll

402 lines

fold-binary-reduce.ll

44 lines

vreductions-fp-sdnode.ll

311 lines

vreductions-int.ll

341 lines

Diff 482589

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 5,847 Lines • ▼ Show 20 Lines
/// scalar = reduce_op vec, scalar_start		/// scalar = reduce_op vec, scalar_start
static SDValue lowerReductionSeq(unsigned RVVOpcode, MVT ResVT,		static SDValue lowerReductionSeq(unsigned RVVOpcode, MVT ResVT,
SDValue StartValue, SDValue Vec, SDValue Mask,		SDValue StartValue, SDValue Vec, SDValue Mask,
SDValue VL, SDLoc DL, SelectionDAG &DAG,		SDValue VL, SDLoc DL, SelectionDAG &DAG,
const RISCVSubtarget &Subtarget) {		const RISCVSubtarget &Subtarget) {
const MVT VecVT = Vec.getSimpleValueType();		const MVT VecVT = Vec.getSimpleValueType();
const MVT M1VT = getLMUL1VT(VecVT);		const MVT M1VT = getLMUL1VT(VecVT);
const MVT XLenVT = Subtarget.getXLenVT();		const MVT XLenVT = Subtarget.getXLenVT();
		const bool NonZeroAVL = hasNonZeroAVL(VL);

// The reduction needs an LMUL1 input; do the splat at either LMUL1		// The reduction needs an LMUL1 input; do the splat at either LMUL1
// or the original VT if fractional.		// or the original VT if fractional.
auto InnerVT = VecVT.bitsLE(M1VT) ? VecVT : M1VT;		auto InnerVT = VecVT.bitsLE(M1VT) ? VecVT : M1VT;
SDValue InitialValue =		// We reuse the VL of the reduction to reduce vsetvli toggles if we can
lowerScalarInsert(StartValue, DAG.getConstant(1, DL, XLenVT),		// prove it is non-zero. For the AVL=0 case, we need the scalar to
InnerVT, DL, DAG, Subtarget);		// be the result of the reduction operation.
		auto InnerVL = NonZeroAVL ? VL : DAG.getConstant(1, DL, XLenVT);
		SDValue InitialValue = lowerScalarInsert(StartValue, InnerVL, InnerVT, DL,
		DAG, Subtarget);
if (M1VT != InnerVT)		if (M1VT != InnerVT)
InitialValue = DAG.getNode(ISD::INSERT_SUBVECTOR, DL, M1VT,		InitialValue = DAG.getNode(ISD::INSERT_SUBVECTOR, DL, M1VT,
DAG.getUNDEF(M1VT),		DAG.getUNDEF(M1VT),
InitialValue, DAG.getConstant(0, DL, XLenVT));		InitialValue, DAG.getConstant(0, DL, XLenVT));
SDValue PassThru = hasNonZeroAVL(VL) ? DAG.getUNDEF(M1VT) : InitialValue;		SDValue PassThru = NonZeroAVL ? DAG.getUNDEF(M1VT) : InitialValue;
SDValue Reduction = DAG.getNode(RVVOpcode, DL, M1VT, PassThru, Vec,		SDValue Reduction = DAG.getNode(RVVOpcode, DL, M1VT, PassThru, Vec,
InitialValue, Mask, VL);		InitialValue, Mask, VL);
return DAG.getNode(ISD::EXTRACT_VECTOR_ELT, DL, ResVT, Reduction,		return DAG.getNode(ISD::EXTRACT_VECTOR_ELT, DL, ResVT, Reduction,
DAG.getConstant(0, DL, XLenVT));		DAG.getConstant(0, DL, XLenVT));
}		}

SDValue RISCVTargetLowering::lowerVECREDUCE(SDValue Op,		SDValue RISCVTargetLowering::lowerVECREDUCE(SDValue Op,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
▲ Show 20 Lines • Show All 2,187 Lines • ▼ Show 20 Lines	if (ScalarV.getOpcode() == ISD::INSERT_SUBVECTOR &&
ScalarV = ScalarV.getOperand(1);		ScalarV = ScalarV.getOperand(1);

// Make sure that ScalarV is a splat with VL=1.		// Make sure that ScalarV is a splat with VL=1.
if (ScalarV.getOpcode() != RISCVISD::VFMV_S_F_VL &&		if (ScalarV.getOpcode() != RISCVISD::VFMV_S_F_VL &&
ScalarV.getOpcode() != RISCVISD::VMV_S_X_VL &&		ScalarV.getOpcode() != RISCVISD::VMV_S_X_VL &&
ScalarV.getOpcode() != RISCVISD::VMV_V_X_VL)		ScalarV.getOpcode() != RISCVISD::VMV_V_X_VL)
return SDValue();		return SDValue();

if (!isOneConstant(ScalarV.getOperand(2)))		if (!hasNonZeroAVL(ScalarV.getOperand(2)))
return SDValue();		return SDValue();

// Check the scalar of ScalarV is neutral element		// Check the scalar of ScalarV is neutral element
// TODO: Deal with value other than neutral element.		// TODO: Deal with value other than neutral element.
if (!isNeutralConstant(N->getOpcode(), N->getFlags(), ScalarV.getOperand(1),		if (!isNeutralConstant(N->getOpcode(), N->getFlags(), ScalarV.getOperand(1),
0))		0))
return SDValue();		return SDValue();

▲ Show 20 Lines • Show All 5,507 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-fp.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -mtriple=riscv32 -target-abi=ilp32d -mattr=+v,+zfh,+experimental-zvfh,+f,+d -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \| FileCheck %s		; RUN: llc -mtriple=riscv32 -target-abi=ilp32d -mattr=+v,+zfh,+experimental-zvfh,+f,+d -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \| FileCheck --check-prefixes=CHECK,RV32 %s
; RUN: llc -mtriple=riscv64 -target-abi=lp64d -mattr=+v,+zfh,+experimental-zvfh,+f,+d -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \| FileCheck %s		; RUN: llc -mtriple=riscv64 -target-abi=lp64d -mattr=+v,+zfh,+experimental-zvfh,+f,+d -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \| FileCheck --check-prefixes=CHECK,RV64 %s

declare half @llvm.vector.reduce.fadd.v1f16(half, <1 x half>)		declare half @llvm.vector.reduce.fadd.v1f16(half, <1 x half>)

define half @vreduce_fadd_v1f16(<1 x half>* %x, half %s) {		define half @vreduce_fadd_v1f16(<1 x half>* %x, half %s) {
; CHECK-LABEL: vreduce_fadd_v1f16:		; CHECK-LABEL: vreduce_fadd_v1f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
▲ Show 20 Lines • Show All 142 Lines • ▼ Show 20 Lines
declare half @llvm.vector.reduce.fadd.v32f16(half, <32 x half>)		declare half @llvm.vector.reduce.fadd.v32f16(half, <32 x half>)

define half @vreduce_fadd_v32f16(<32 x half>* %x, half %s) {		define half @vreduce_fadd_v32f16(<32 x half>* %x, half %s) {
; CHECK-LABEL: vreduce_fadd_v32f16:		; CHECK-LABEL: vreduce_fadd_v32f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v12, fa0		; CHECK-NEXT: vfmv.s.f v12, fa0
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vfredusum.vs v8, v8, v12		; CHECK-NEXT: vfredusum.vs v8, v8, v12
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x half>, <32 x half>* %x		%v = load <32 x half>, <32 x half>* %x
%red = call reassoc half @llvm.vector.reduce.fadd.v32f16(half %s, <32 x half> %v)		%red = call reassoc half @llvm.vector.reduce.fadd.v32f16(half %s, <32 x half> %v)
ret half %red		ret half %red
}		}

define half @vreduce_ord_fadd_v32f16(<32 x half>* %x, half %s) {		define half @vreduce_ord_fadd_v32f16(<32 x half>* %x, half %s) {
; CHECK-LABEL: vreduce_ord_fadd_v32f16:		; CHECK-LABEL: vreduce_ord_fadd_v32f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v12, fa0		; CHECK-NEXT: vfmv.s.f v12, fa0
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vfredosum.vs v8, v8, v12		; CHECK-NEXT: vfredosum.vs v8, v8, v12
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x half>, <32 x half>* %x		%v = load <32 x half>, <32 x half>* %x
%red = call half @llvm.vector.reduce.fadd.v32f16(half %s, <32 x half> %v)		%red = call half @llvm.vector.reduce.fadd.v32f16(half %s, <32 x half> %v)
ret half %red		ret half %red
}		}

declare half @llvm.vector.reduce.fadd.v64f16(half, <64 x half>)		declare half @llvm.vector.reduce.fadd.v64f16(half, <64 x half>)

define half @vreduce_fadd_v64f16(<64 x half>* %x, half %s) {		define half @vreduce_fadd_v64f16(<64 x half>* %x, half %s) {
; CHECK-LABEL: vreduce_fadd_v64f16:		; CHECK-LABEL: vreduce_fadd_v64f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v16, fa0		; CHECK-NEXT: vfmv.s.f v16, fa0
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vfredusum.vs v8, v8, v16		; CHECK-NEXT: vfredusum.vs v8, v8, v16
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x half>, <64 x half>* %x		%v = load <64 x half>, <64 x half>* %x
%red = call reassoc half @llvm.vector.reduce.fadd.v64f16(half %s, <64 x half> %v)		%red = call reassoc half @llvm.vector.reduce.fadd.v64f16(half %s, <64 x half> %v)
ret half %red		ret half %red
}		}

define half @vreduce_ord_fadd_v64f16(<64 x half>* %x, half %s) {		define half @vreduce_ord_fadd_v64f16(<64 x half>* %x, half %s) {
; CHECK-LABEL: vreduce_ord_fadd_v64f16:		; CHECK-LABEL: vreduce_ord_fadd_v64f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v16, fa0		; CHECK-NEXT: vfmv.s.f v16, fa0
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vfredosum.vs v8, v8, v16		; CHECK-NEXT: vfredosum.vs v8, v8, v16
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x half>, <64 x half>* %x		%v = load <64 x half>, <64 x half>* %x
%red = call half @llvm.vector.reduce.fadd.v64f16(half %s, <64 x half> %v)		%red = call half @llvm.vector.reduce.fadd.v64f16(half %s, <64 x half> %v)
ret half %red		ret half %red
}		}

declare half @llvm.vector.reduce.fadd.v128f16(half, <128 x half>)		declare half @llvm.vector.reduce.fadd.v128f16(half, <128 x half>)

define half @vreduce_fadd_v128f16(<128 x half>* %x, half %s) {		define half @vreduce_fadd_v128f16(<128 x half>* %x, half %s) {
; CHECK-LABEL: vreduce_fadd_v128f16:		; CHECK-LABEL: vreduce_fadd_v128f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle16.v v16, (a0)		; CHECK-NEXT: vle16.v v16, (a0)
		; CHECK-NEXT: vfmv.s.f v24, fa0
; CHECK-NEXT: vfadd.vv v8, v8, v16		; CHECK-NEXT: vfadd.vv v8, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vfredusum.vs v8, v8, v24
; CHECK-NEXT: vfmv.s.f v16, fa0
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vfredusum.vs v8, v8, v16
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x half>, <128 x half>* %x		%v = load <128 x half>, <128 x half>* %x
%red = call reassoc half @llvm.vector.reduce.fadd.v128f16(half %s, <128 x half> %v)		%red = call reassoc half @llvm.vector.reduce.fadd.v128f16(half %s, <128 x half> %v)
ret half %red		ret half %red
}		}

define half @vreduce_ord_fadd_v128f16(<128 x half>* %x, half %s) {		define half @vreduce_ord_fadd_v128f16(<128 x half>* %x, half %s) {
; CHECK-LABEL: vreduce_ord_fadd_v128f16:		; CHECK-LABEL: vreduce_ord_fadd_v128f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: addi a1, a0, 128		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: li a2, 64		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vsetvli zero, a2, e16, m8, ta, ma		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vle16.v v8, (a1)		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle16.v v16, (a0)		; CHECK-NEXT: vle16.v v16, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v24, fa0		; CHECK-NEXT: vfmv.s.f v24, fa0
; CHECK-NEXT: vsetvli zero, a2, e16, m8, ta, ma		; CHECK-NEXT: vfredosum.vs v8, v8, v24
; CHECK-NEXT: vfredosum.vs v16, v16, v24		; CHECK-NEXT: vfmv.f.s ft0, v8
; CHECK-NEXT: vfmv.f.s ft0, v16		; CHECK-NEXT: vfmv.s.f v8, ft0
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vfredosum.vs v8, v16, v8
; CHECK-NEXT: vfmv.s.f v16, ft0
; CHECK-NEXT: vsetvli zero, a2, e16, m8, ta, ma
; CHECK-NEXT: vfredosum.vs v8, v8, v16
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x half>, <128 x half>* %x		%v = load <128 x half>, <128 x half>* %x
%red = call half @llvm.vector.reduce.fadd.v128f16(half %s, <128 x half> %v)		%red = call half @llvm.vector.reduce.fadd.v128f16(half %s, <128 x half> %v)
ret half %red		ret half %red
}		}

declare float @llvm.vector.reduce.fadd.v1f32(float, <1 x float>)		declare float @llvm.vector.reduce.fadd.v1f32(float, <1 x float>)
▲ Show 20 Lines • Show All 216 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret float %red		ret float %red
}		}

define float @vreduce_fwadd_v8f32(<8 x half>* %x, float %s) {		define float @vreduce_fwadd_v8f32(<8 x half>* %x, float %s) {
; CHECK-LABEL: vreduce_fwadd_v8f32:		; CHECK-LABEL: vreduce_fwadd_v8f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; CHECK-NEXT: vfwredusum.vs v8, v8, v9		; CHECK-NEXT: vfwredusum.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <8 x half>, <8 x half>* %x		%v = load <8 x half>, <8 x half>* %x
%e = fpext <8 x half> %v to <8 x float>		%e = fpext <8 x half> %v to <8 x float>
%red = call reassoc float @llvm.vector.reduce.fadd.v8f32(float %s, <8 x float> %e)		%red = call reassoc float @llvm.vector.reduce.fadd.v8f32(float %s, <8 x float> %e)
ret float %red		ret float %red
}		}

define float @vreduce_ord_fwadd_v8f32(<8 x half>* %x, float %s) {		define float @vreduce_ord_fwadd_v8f32(<8 x half>* %x, float %s) {
; CHECK-LABEL: vreduce_ord_fwadd_v8f32:		; CHECK-LABEL: vreduce_ord_fwadd_v8f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; CHECK-NEXT: vfwredosum.vs v8, v8, v9		; CHECK-NEXT: vfwredosum.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <8 x half>, <8 x half>* %x		%v = load <8 x half>, <8 x half>* %x
%e = fpext <8 x half> %v to <8 x float>		%e = fpext <8 x half> %v to <8 x float>
Show All 31 Lines	; CHECK-NEXT: ret
ret float %red		ret float %red
}		}

define float @vreduce_fwadd_v16f32(<16 x half>* %x, float %s) {		define float @vreduce_fwadd_v16f32(<16 x half>* %x, float %s) {
; CHECK-LABEL: vreduce_fwadd_v16f32:		; CHECK-LABEL: vreduce_fwadd_v16f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v10, fa0		; CHECK-NEXT: vfmv.s.f v10, fa0
; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma
; CHECK-NEXT: vfwredusum.vs v8, v8, v10		; CHECK-NEXT: vfwredusum.vs v8, v8, v10
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <16 x half>, <16 x half>* %x		%v = load <16 x half>, <16 x half>* %x
%e = fpext <16 x half> %v to <16 x float>		%e = fpext <16 x half> %v to <16 x float>
%red = call reassoc float @llvm.vector.reduce.fadd.v16f32(float %s, <16 x float> %e)		%red = call reassoc float @llvm.vector.reduce.fadd.v16f32(float %s, <16 x float> %e)
ret float %red		ret float %red
}		}

define float @vreduce_ord_fwadd_v16f32(<16 x half>* %x, float %s) {		define float @vreduce_ord_fwadd_v16f32(<16 x half>* %x, float %s) {
; CHECK-LABEL: vreduce_ord_fwadd_v16f32:		; CHECK-LABEL: vreduce_ord_fwadd_v16f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v10, fa0		; CHECK-NEXT: vfmv.s.f v10, fa0
; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma
; CHECK-NEXT: vfwredosum.vs v8, v8, v10		; CHECK-NEXT: vfwredosum.vs v8, v8, v10
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <16 x half>, <16 x half>* %x		%v = load <16 x half>, <16 x half>* %x
%e = fpext <16 x half> %v to <16 x float>		%e = fpext <16 x half> %v to <16 x float>
%red = call float @llvm.vector.reduce.fadd.v16f32(float %s, <16 x float> %e)		%red = call float @llvm.vector.reduce.fadd.v16f32(float %s, <16 x float> %e)
ret float %red		ret float %red
}		}

declare float @llvm.vector.reduce.fadd.v32f32(float, <32 x float>)		declare float @llvm.vector.reduce.fadd.v32f32(float, <32 x float>)

define float @vreduce_fadd_v32f32(<32 x float>* %x, float %s) {		define float @vreduce_fadd_v32f32(<32 x float>* %x, float %s) {
; CHECK-LABEL: vreduce_fadd_v32f32:		; CHECK-LABEL: vreduce_fadd_v32f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v16, fa0		; CHECK-NEXT: vfmv.s.f v16, fa0
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vfredusum.vs v8, v8, v16		; CHECK-NEXT: vfredusum.vs v8, v8, v16
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x float>, <32 x float>* %x		%v = load <32 x float>, <32 x float>* %x
%red = call reassoc float @llvm.vector.reduce.fadd.v32f32(float %s, <32 x float> %v)		%red = call reassoc float @llvm.vector.reduce.fadd.v32f32(float %s, <32 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_ord_fadd_v32f32(<32 x float>* %x, float %s) {		define float @vreduce_ord_fadd_v32f32(<32 x float>* %x, float %s) {
; CHECK-LABEL: vreduce_ord_fadd_v32f32:		; CHECK-LABEL: vreduce_ord_fadd_v32f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v16, fa0		; CHECK-NEXT: vfmv.s.f v16, fa0
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vfredosum.vs v8, v8, v16		; CHECK-NEXT: vfredosum.vs v8, v8, v16
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x float>, <32 x float>* %x		%v = load <32 x float>, <32 x float>* %x
%red = call float @llvm.vector.reduce.fadd.v32f32(float %s, <32 x float> %v)		%red = call float @llvm.vector.reduce.fadd.v32f32(float %s, <32 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_fwadd_v32f32(<32 x half>* %x, float %s) {		define float @vreduce_fwadd_v32f32(<32 x half>* %x, float %s) {
; CHECK-LABEL: vreduce_fwadd_v32f32:		; CHECK-LABEL: vreduce_fwadd_v32f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v12, fa0		; CHECK-NEXT: vfmv.s.f v12, fa0
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vfwredusum.vs v8, v8, v12		; CHECK-NEXT: vfwredusum.vs v8, v8, v12
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x half>, <32 x half>* %x		%v = load <32 x half>, <32 x half>* %x
%e = fpext <32 x half> %v to <32 x float>		%e = fpext <32 x half> %v to <32 x float>
%red = call reassoc float @llvm.vector.reduce.fadd.v32f32(float %s, <32 x float> %e)		%red = call reassoc float @llvm.vector.reduce.fadd.v32f32(float %s, <32 x float> %e)
ret float %red		ret float %red
}		}

define float @vreduce_ord_fwadd_v32f32(<32 x half>* %x, float %s) {		define float @vreduce_ord_fwadd_v32f32(<32 x half>* %x, float %s) {
; CHECK-LABEL: vreduce_ord_fwadd_v32f32:		; CHECK-LABEL: vreduce_ord_fwadd_v32f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v12, fa0		; CHECK-NEXT: vfmv.s.f v12, fa0
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vfwredosum.vs v8, v8, v12		; CHECK-NEXT: vfwredosum.vs v8, v8, v12
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x half>, <32 x half>* %x		%v = load <32 x half>, <32 x half>* %x
%e = fpext <32 x half> %v to <32 x float>		%e = fpext <32 x half> %v to <32 x float>
%red = call float @llvm.vector.reduce.fadd.v32f32(float %s, <32 x float> %e)		%red = call float @llvm.vector.reduce.fadd.v32f32(float %s, <32 x float> %e)
ret float %red		ret float %red
}		}

declare float @llvm.vector.reduce.fadd.v64f32(float, <64 x float>)		declare float @llvm.vector.reduce.fadd.v64f32(float, <64 x float>)

define float @vreduce_fadd_v64f32(<64 x float>* %x, float %s) {		define float @vreduce_fadd_v64f32(<64 x float>* %x, float %s) {
; CHECK-LABEL: vreduce_fadd_v64f32:		; CHECK-LABEL: vreduce_fadd_v64f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle32.v v16, (a0)		; CHECK-NEXT: vle32.v v16, (a0)
		; CHECK-NEXT: vfmv.s.f v24, fa0
; CHECK-NEXT: vfadd.vv v8, v8, v16		; CHECK-NEXT: vfadd.vv v8, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vfredusum.vs v8, v8, v24
; CHECK-NEXT: vfmv.s.f v16, fa0
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vfredusum.vs v8, v8, v16
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x float>, <64 x float>* %x		%v = load <64 x float>, <64 x float>* %x
%red = call reassoc float @llvm.vector.reduce.fadd.v64f32(float %s, <64 x float> %v)		%red = call reassoc float @llvm.vector.reduce.fadd.v64f32(float %s, <64 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_ord_fadd_v64f32(<64 x float>* %x, float %s) {		define float @vreduce_ord_fadd_v64f32(<64 x float>* %x, float %s) {
; CHECK-LABEL: vreduce_ord_fadd_v64f32:		; CHECK-LABEL: vreduce_ord_fadd_v64f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: addi a1, a0, 128		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: li a2, 32		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vsetvli zero, a2, e32, m8, ta, ma		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vle32.v v8, (a1)		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle32.v v16, (a0)		; CHECK-NEXT: vle32.v v16, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v24, fa0		; CHECK-NEXT: vfmv.s.f v24, fa0
; CHECK-NEXT: vsetvli zero, a2, e32, m8, ta, ma		; CHECK-NEXT: vfredosum.vs v8, v8, v24
; CHECK-NEXT: vfredosum.vs v16, v16, v24		; CHECK-NEXT: vfmv.f.s ft0, v8
; CHECK-NEXT: vfmv.f.s ft0, v16		; CHECK-NEXT: vfmv.s.f v8, ft0
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vfredosum.vs v8, v16, v8
; CHECK-NEXT: vfmv.s.f v16, ft0
; CHECK-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; CHECK-NEXT: vfredosum.vs v8, v8, v16
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x float>, <64 x float>* %x		%v = load <64 x float>, <64 x float>* %x
%red = call float @llvm.vector.reduce.fadd.v64f32(float %s, <64 x float> %v)		%red = call float @llvm.vector.reduce.fadd.v64f32(float %s, <64 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_fwadd_v64f32(<64 x half>* %x, float %s) {		define float @vreduce_fwadd_v64f32(<64 x half>* %x, float %s) {
; CHECK-LABEL: vreduce_fwadd_v64f32:		; CHECK-LABEL: vreduce_fwadd_v64f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: li a0, 32		; CHECK-NEXT: li a0, 32
; CHECK-NEXT: vsetvli zero, a0, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e16, m8, ta, ma
; CHECK-NEXT: vslidedown.vx v16, v8, a0		; CHECK-NEXT: vslidedown.vx v16, v8, a0
		; CHECK-NEXT: vsetvli zero, a0, e32, m1, ta, ma
		; CHECK-NEXT: vfmv.s.f v24, fa0
; CHECK-NEXT: vsetvli zero, a0, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e16, m4, ta, ma
; CHECK-NEXT: vfwadd.vv v24, v8, v16		; CHECK-NEXT: vfwadd.vv v0, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e32, m8, ta, ma
; CHECK-NEXT: vfmv.s.f v8, fa0		; CHECK-NEXT: vfredusum.vs v8, v0, v24
; CHECK-NEXT: vsetvli zero, a0, e32, m8, ta, ma
; CHECK-NEXT: vfredusum.vs v8, v24, v8
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x half>, <64 x half>* %x		%v = load <64 x half>, <64 x half>* %x
%e = fpext <64 x half> %v to <64 x float>		%e = fpext <64 x half> %v to <64 x float>
%red = call reassoc float @llvm.vector.reduce.fadd.v64f32(float %s, <64 x float> %e)		%red = call reassoc float @llvm.vector.reduce.fadd.v64f32(float %s, <64 x float> %e)
ret float %red		ret float %red
}		}

define float @vreduce_ord_fwadd_v64f32(<64 x half>* %x, float %s) {		define float @vreduce_ord_fwadd_v64f32(<64 x half>* %x, float %s) {
; CHECK-LABEL: vreduce_ord_fwadd_v64f32:		; CHECK-LABEL: vreduce_ord_fwadd_v64f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v16, (a0)		; CHECK-NEXT: vle16.v v16, (a0)
; CHECK-NEXT: li a0, 32		; CHECK-NEXT: li a0, 32
; CHECK-NEXT: vsetvli zero, a0, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e16, m8, ta, ma
; CHECK-NEXT: vslidedown.vx v8, v16, a0		; CHECK-NEXT: vslidedown.vx v8, v16, a0
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v24, fa0		; CHECK-NEXT: vfmv.s.f v24, fa0
; CHECK-NEXT: vsetvli zero, a0, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e16, m4, ta, ma
; CHECK-NEXT: vfwredosum.vs v16, v16, v24		; CHECK-NEXT: vfwredosum.vs v16, v16, v24
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vfmv.f.s ft0, v16		; CHECK-NEXT: vfmv.f.s ft0, v16
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v16, ft0		; CHECK-NEXT: vfmv.s.f v16, ft0
; CHECK-NEXT: vsetvli zero, a0, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e16, m4, ta, ma
; CHECK-NEXT: vfwredosum.vs v8, v8, v16		; CHECK-NEXT: vfwredosum.vs v8, v8, v16
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x half>, <64 x half>* %x		%v = load <64 x half>, <64 x half>* %x
%e = fpext <64 x half> %v to <64 x float>		%e = fpext <64 x half> %v to <64 x float>
▲ Show 20 Lines • Show All 157 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret double %red		ret double %red
}		}

define double @vreduce_fwadd_v4f64(<4 x float>* %x, double %s) {		define double @vreduce_fwadd_v4f64(<4 x float>* %x, double %s) {
; CHECK-LABEL: vreduce_fwadd_v4f64:		; CHECK-LABEL: vreduce_fwadd_v4f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e64, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vfwredusum.vs v8, v8, v9		; CHECK-NEXT: vfwredusum.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x float>, <4 x float>* %x		%v = load <4 x float>, <4 x float>* %x
%e = fpext <4 x float> %v to <4 x double>		%e = fpext <4 x float> %v to <4 x double>
%red = call reassoc double @llvm.vector.reduce.fadd.v4f64(double %s, <4 x double> %e)		%red = call reassoc double @llvm.vector.reduce.fadd.v4f64(double %s, <4 x double> %e)
ret double %red		ret double %red
}		}

define double @vreduce_ord_fwadd_v4f64(<4 x float>* %x, double %s) {		define double @vreduce_ord_fwadd_v4f64(<4 x float>* %x, double %s) {
; CHECK-LABEL: vreduce_ord_fwadd_v4f64:		; CHECK-LABEL: vreduce_ord_fwadd_v4f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e64, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vfwredosum.vs v8, v8, v9		; CHECK-NEXT: vfwredosum.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x float>, <4 x float>* %x		%v = load <4 x float>, <4 x float>* %x
%e = fpext <4 x float> %v to <4 x double>		%e = fpext <4 x float> %v to <4 x double>
Show All 31 Lines	; CHECK-NEXT: ret
ret double %red		ret double %red
}		}

define double @vreduce_fwadd_v8f64(<8 x float>* %x, double %s) {		define double @vreduce_fwadd_v8f64(<8 x float>* %x, double %s) {
; CHECK-LABEL: vreduce_fwadd_v8f64:		; CHECK-LABEL: vreduce_fwadd_v8f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e64, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v10, fa0		; CHECK-NEXT: vfmv.s.f v10, fa0
; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, ma
; CHECK-NEXT: vfwredusum.vs v8, v8, v10		; CHECK-NEXT: vfwredusum.vs v8, v8, v10
; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <8 x float>, <8 x float>* %x		%v = load <8 x float>, <8 x float>* %x
%e = fpext <8 x float> %v to <8 x double>		%e = fpext <8 x float> %v to <8 x double>
%red = call reassoc double @llvm.vector.reduce.fadd.v8f64(double %s, <8 x double> %e)		%red = call reassoc double @llvm.vector.reduce.fadd.v8f64(double %s, <8 x double> %e)
ret double %red		ret double %red
}		}

define double @vreduce_ord_fwadd_v8f64(<8 x float>* %x, double %s) {		define double @vreduce_ord_fwadd_v8f64(<8 x float>* %x, double %s) {
; CHECK-LABEL: vreduce_ord_fwadd_v8f64:		; CHECK-LABEL: vreduce_ord_fwadd_v8f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e64, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v10, fa0		; CHECK-NEXT: vfmv.s.f v10, fa0
; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, ma
; CHECK-NEXT: vfwredosum.vs v8, v8, v10		; CHECK-NEXT: vfwredosum.vs v8, v8, v10
; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <8 x float>, <8 x float>* %x		%v = load <8 x float>, <8 x float>* %x
%e = fpext <8 x float> %v to <8 x double>		%e = fpext <8 x float> %v to <8 x double>
Show All 31 Lines	; CHECK-NEXT: ret
ret double %red		ret double %red
}		}

define double @vreduce_fwadd_v16f64(<16 x float>* %x, double %s) {		define double @vreduce_fwadd_v16f64(<16 x float>* %x, double %s) {
; CHECK-LABEL: vreduce_fwadd_v16f64:		; CHECK-LABEL: vreduce_fwadd_v16f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e64, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v12, fa0		; CHECK-NEXT: vfmv.s.f v12, fa0
; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; CHECK-NEXT: vfwredusum.vs v8, v8, v12		; CHECK-NEXT: vfwredusum.vs v8, v8, v12
; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <16 x float>, <16 x float>* %x		%v = load <16 x float>, <16 x float>* %x
%e = fpext <16 x float> %v to <16 x double>		%e = fpext <16 x float> %v to <16 x double>
%red = call reassoc double @llvm.vector.reduce.fadd.v16f64(double %s, <16 x double> %e)		%red = call reassoc double @llvm.vector.reduce.fadd.v16f64(double %s, <16 x double> %e)
ret double %red		ret double %red
}		}

define double @vreduce_ord_fwadd_v16f64(<16 x float>* %x, double %s) {		define double @vreduce_ord_fwadd_v16f64(<16 x float>* %x, double %s) {
; CHECK-LABEL: vreduce_ord_fwadd_v16f64:		; CHECK-LABEL: vreduce_ord_fwadd_v16f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e64, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v12, fa0		; CHECK-NEXT: vfmv.s.f v12, fa0
; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; CHECK-NEXT: vfwredosum.vs v8, v8, v12		; CHECK-NEXT: vfwredosum.vs v8, v8, v12
; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <16 x float>, <16 x float>* %x		%v = load <16 x float>, <16 x float>* %x
%e = fpext <16 x float> %v to <16 x double>		%e = fpext <16 x float> %v to <16 x double>
▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 16, e32, m8, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e32, m8, ta, ma
; CHECK-NEXT: vslidedown.vi v16, v8, 16		; CHECK-NEXT: vslidedown.vi v16, v8, 16
; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; CHECK-NEXT: vfwadd.vv v24, v8, v16		; CHECK-NEXT: vfwadd.vv v24, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e64, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v8, fa0		; CHECK-NEXT: vfmv.s.f v8, fa0
; CHECK-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; CHECK-NEXT: vfredusum.vs v8, v24, v8		; CHECK-NEXT: vfredusum.vs v8, v24, v8
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x float>, <32 x float>* %x		%v = load <32 x float>, <32 x float>* %x
%e = fpext <32 x float> %v to <32 x double>		%e = fpext <32 x float> %v to <32 x double>
%red = call reassoc double @llvm.vector.reduce.fadd.v32f64(double %s, <32 x double> %e)		%red = call reassoc double @llvm.vector.reduce.fadd.v32f64(double %s, <32 x double> %e)
ret double %red		ret double %red
}		}

define double @vreduce_ord_fwadd_v32f64(<32 x float>* %x, double %s) {		define double @vreduce_ord_fwadd_v32f64(<32 x float>* %x, double %s) {
; CHECK-LABEL: vreduce_ord_fwadd_v32f64:		; CHECK-LABEL: vreduce_ord_fwadd_v32f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v16, (a0)		; CHECK-NEXT: vle32.v v16, (a0)
; CHECK-NEXT: vsetivli zero, 16, e32, m8, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e32, m8, ta, ma
; CHECK-NEXT: vslidedown.vi v8, v16, 16		; CHECK-NEXT: vslidedown.vi v8, v16, 16
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e64, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v24, fa0		; CHECK-NEXT: vfmv.s.f v24, fa0
; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; CHECK-NEXT: vfwredosum.vs v16, v16, v24		; CHECK-NEXT: vfwredosum.vs v16, v16, v24
; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma
; CHECK-NEXT: vfmv.f.s ft0, v16		; CHECK-NEXT: vfmv.f.s ft0, v16
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e64, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v16, ft0		; CHECK-NEXT: vfmv.s.f v16, ft0
; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; CHECK-NEXT: vfwredosum.vs v8, v8, v16		; CHECK-NEXT: vfwredosum.vs v8, v8, v16
; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x float>, <32 x float>* %x		%v = load <32 x float>, <32 x float>* %x
%e = fpext <32 x float> %v to <32 x double>		%e = fpext <32 x float> %v to <32 x double>
%red = call double @llvm.vector.reduce.fadd.v32f64(double %s, <32 x double> %e)		%red = call double @llvm.vector.reduce.fadd.v32f64(double %s, <32 x double> %e)
ret double %red		ret double %red
}		}

declare half @llvm.vector.reduce.fmin.v2f16(<2 x half>)		declare half @llvm.vector.reduce.fmin.v2f16(<2 x half>)

define half @vreduce_fmin_v2f16(<2 x half>* %x) {		define half @vreduce_fmin_v2f16(<2 x half>* %x) {
; CHECK-LABEL: vreduce_fmin_v2f16:		; RV32-LABEL: vreduce_fmin_v2f16:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma		; RV32-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI68_0)
; CHECK-NEXT: lui a0, %hi(.LCPI68_0)		; RV32-NEXT: flh ft0, %lo(.LCPI68_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI68_0)		; RV32-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma		; RV32-NEXT: vfmv.s.f v9, ft0
; CHECK-NEXT: vlse16.v v9, (a0), zero		; RV32-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmin_v2f16:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI68_0)
		; RV64-NEXT: flh ft0, %lo(.LCPI68_0)(a1)
		; RV64-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
		; RV64-NEXT: vle16.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v9, ft0
		; RV64-NEXT: vfredmin.vs v8, v8, v9
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <2 x half>, <2 x half>* %x		%v = load <2 x half>, <2 x half>* %x
%red = call half @llvm.vector.reduce.fmin.v2f16(<2 x half> %v)		%red = call half @llvm.vector.reduce.fmin.v2f16(<2 x half> %v)
ret half %red		ret half %red
}		}

declare half @llvm.vector.reduce.fmin.v4f16(<4 x half>)		declare half @llvm.vector.reduce.fmin.v4f16(<4 x half>)

define half @vreduce_fmin_v4f16(<4 x half>* %x) {		define half @vreduce_fmin_v4f16(<4 x half>* %x) {
; CHECK-LABEL: vreduce_fmin_v4f16:		; RV32-LABEL: vreduce_fmin_v4f16:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI69_0)
; CHECK-NEXT: lui a0, %hi(.LCPI69_0)		; RV32-NEXT: flh ft0, %lo(.LCPI69_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI69_0)		; RV32-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma		; RV32-NEXT: vfmv.s.f v9, ft0
; CHECK-NEXT: vlse16.v v9, (a0), zero		; RV32-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmin_v4f16:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI69_0)
		; RV64-NEXT: flh ft0, %lo(.LCPI69_0)(a1)
		; RV64-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
		; RV64-NEXT: vle16.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v9, ft0
		; RV64-NEXT: vfredmin.vs v8, v8, v9
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <4 x half>, <4 x half>* %x		%v = load <4 x half>, <4 x half>* %x
%red = call half @llvm.vector.reduce.fmin.v4f16(<4 x half> %v)		%red = call half @llvm.vector.reduce.fmin.v4f16(<4 x half> %v)
ret half %red		ret half %red
}		}

define half @vreduce_fmin_v4f16_nonans(<4 x half>* %x) {		define half @vreduce_fmin_v4f16_nonans(<4 x half>* %x) {
; CHECK-LABEL: vreduce_fmin_v4f16_nonans:		; RV32-LABEL: vreduce_fmin_v4f16_nonans:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI70_0)
; CHECK-NEXT: lui a0, %hi(.LCPI70_0)		; RV32-NEXT: flh ft0, %lo(.LCPI70_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI70_0)		; RV32-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma		; RV32-NEXT: vfmv.s.f v9, ft0
; CHECK-NEXT: vlse16.v v9, (a0), zero		; RV32-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmin_v4f16_nonans:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI70_0)
		; RV64-NEXT: flh ft0, %lo(.LCPI70_0)(a1)
		; RV64-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
		; RV64-NEXT: vle16.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v9, ft0
		; RV64-NEXT: vfredmin.vs v8, v8, v9
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <4 x half>, <4 x half>* %x		%v = load <4 x half>, <4 x half>* %x
%red = call nnan half @llvm.vector.reduce.fmin.v4f16(<4 x half> %v)		%red = call nnan half @llvm.vector.reduce.fmin.v4f16(<4 x half> %v)
ret half %red		ret half %red
}		}

define half @vreduce_fmin_v4f16_nonans_noinfs(<4 x half>* %x) {		define half @vreduce_fmin_v4f16_nonans_noinfs(<4 x half>* %x) {
; CHECK-LABEL: vreduce_fmin_v4f16_nonans_noinfs:		; RV32-LABEL: vreduce_fmin_v4f16_nonans_noinfs:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI71_0)
; CHECK-NEXT: lui a0, %hi(.LCPI71_0)		; RV32-NEXT: flh ft0, %lo(.LCPI71_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI71_0)		; RV32-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma		; RV32-NEXT: vfmv.s.f v9, ft0
; CHECK-NEXT: vlse16.v v9, (a0), zero		; RV32-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmin_v4f16_nonans_noinfs:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI71_0)
		; RV64-NEXT: flh ft0, %lo(.LCPI71_0)(a1)
		; RV64-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
		; RV64-NEXT: vle16.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v9, ft0
		; RV64-NEXT: vfredmin.vs v8, v8, v9
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <4 x half>, <4 x half>* %x		%v = load <4 x half>, <4 x half>* %x
%red = call nnan ninf half @llvm.vector.reduce.fmin.v4f16(<4 x half> %v)		%red = call nnan ninf half @llvm.vector.reduce.fmin.v4f16(<4 x half> %v)
ret half %red		ret half %red
}		}

declare half @llvm.vector.reduce.fmin.v128f16(<128 x half>)		declare half @llvm.vector.reduce.fmin.v128f16(<128 x half>)

define half @vreduce_fmin_v128f16(<128 x half>* %x) {		define half @vreduce_fmin_v128f16(<128 x half>* %x) {
; CHECK-LABEL: vreduce_fmin_v128f16:		; CHECK-LABEL: vreduce_fmin_v128f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
		; CHECK-NEXT: lui a1, %hi(.LCPI72_0)
		; CHECK-NEXT: flh ft0, %lo(.LCPI72_0)(a1)
; CHECK-NEXT: vle16.v v16, (a0)		; CHECK-NEXT: vle16.v v16, (a0)
		; CHECK-NEXT: vfmv.s.f v24, ft0
; CHECK-NEXT: vfmin.vv v8, v8, v16		; CHECK-NEXT: vfmin.vv v8, v8, v16
; CHECK-NEXT: lui a0, %hi(.LCPI72_0)		; CHECK-NEXT: vfredmin.vs v8, v8, v24
; CHECK-NEXT: addi a0, a0, %lo(.LCPI72_0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vlse16.v v16, (a0), zero
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v16
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x half>, <128 x half>* %x		%v = load <128 x half>, <128 x half>* %x
%red = call half @llvm.vector.reduce.fmin.v128f16(<128 x half> %v)		%red = call half @llvm.vector.reduce.fmin.v128f16(<128 x half> %v)
ret half %red		ret half %red
}		}

declare float @llvm.vector.reduce.fmin.v2f32(<2 x float>)		declare float @llvm.vector.reduce.fmin.v2f32(<2 x float>)

define float @vreduce_fmin_v2f32(<2 x float>* %x) {		define float @vreduce_fmin_v2f32(<2 x float>* %x) {
; CHECK-LABEL: vreduce_fmin_v2f32:		; RV32-LABEL: vreduce_fmin_v2f32:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI73_0)
; CHECK-NEXT: lui a0, %hi(.LCPI73_0)		; RV32-NEXT: flw ft0, %lo(.LCPI73_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI73_0)		; RV32-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma		; RV32-NEXT: vfmv.s.f v9, ft0
; CHECK-NEXT: vlse32.v v9, (a0), zero		; RV32-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmin_v2f32:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI73_0)
		; RV64-NEXT: flw ft0, %lo(.LCPI73_0)(a1)
		; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
		; RV64-NEXT: vle32.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v9, ft0
		; RV64-NEXT: vfredmin.vs v8, v8, v9
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <2 x float>, <2 x float>* %x		%v = load <2 x float>, <2 x float>* %x
%red = call float @llvm.vector.reduce.fmin.v2f32(<2 x float> %v)		%red = call float @llvm.vector.reduce.fmin.v2f32(<2 x float> %v)
ret float %red		ret float %red
}		}

declare float @llvm.vector.reduce.fmin.v4f32(<4 x float>)		declare float @llvm.vector.reduce.fmin.v4f32(<4 x float>)

define float @vreduce_fmin_v4f32(<4 x float>* %x) {		define float @vreduce_fmin_v4f32(<4 x float>* %x) {
; CHECK-LABEL: vreduce_fmin_v4f32:		; RV32-LABEL: vreduce_fmin_v4f32:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI74_0)
; CHECK-NEXT: lui a0, %hi(.LCPI74_0)		; RV32-NEXT: flw ft0, %lo(.LCPI74_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI74_0)		; RV32-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; RV32-NEXT: vfmv.s.f v9, ft0
; CHECK-NEXT: vlse32.v v9, (a0), zero		; RV32-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmin_v4f32:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI74_0)
		; RV64-NEXT: flw ft0, %lo(.LCPI74_0)(a1)
		; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
		; RV64-NEXT: vle32.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v9, ft0
		; RV64-NEXT: vfredmin.vs v8, v8, v9
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <4 x float>, <4 x float>* %x		%v = load <4 x float>, <4 x float>* %x
%red = call float @llvm.vector.reduce.fmin.v4f32(<4 x float> %v)		%red = call float @llvm.vector.reduce.fmin.v4f32(<4 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_fmin_v4f32_nonans(<4 x float>* %x) {		define float @vreduce_fmin_v4f32_nonans(<4 x float>* %x) {
; CHECK-LABEL: vreduce_fmin_v4f32_nonans:		; RV32-LABEL: vreduce_fmin_v4f32_nonans:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI75_0)
; CHECK-NEXT: lui a0, %hi(.LCPI75_0)		; RV32-NEXT: flw ft0, %lo(.LCPI75_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI75_0)		; RV32-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; RV32-NEXT: vfmv.s.f v9, ft0
; CHECK-NEXT: vlse32.v v9, (a0), zero		; RV32-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmin_v4f32_nonans:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI75_0)
		; RV64-NEXT: flw ft0, %lo(.LCPI75_0)(a1)
		; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
		; RV64-NEXT: vle32.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v9, ft0
		; RV64-NEXT: vfredmin.vs v8, v8, v9
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <4 x float>, <4 x float>* %x		%v = load <4 x float>, <4 x float>* %x
%red = call nnan float @llvm.vector.reduce.fmin.v4f32(<4 x float> %v)		%red = call nnan float @llvm.vector.reduce.fmin.v4f32(<4 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_fmin_v4f32_nonans_noinfs(<4 x float>* %x) {		define float @vreduce_fmin_v4f32_nonans_noinfs(<4 x float>* %x) {
; CHECK-LABEL: vreduce_fmin_v4f32_nonans_noinfs:		; RV32-LABEL: vreduce_fmin_v4f32_nonans_noinfs:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI76_0)
; CHECK-NEXT: lui a0, %hi(.LCPI76_0)		; RV32-NEXT: flw ft0, %lo(.LCPI76_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI76_0)		; RV32-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; RV32-NEXT: vfmv.s.f v9, ft0
; CHECK-NEXT: vlse32.v v9, (a0), zero		; RV32-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmin_v4f32_nonans_noinfs:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI76_0)
		; RV64-NEXT: flw ft0, %lo(.LCPI76_0)(a1)
		; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
		; RV64-NEXT: vle32.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v9, ft0
		; RV64-NEXT: vfredmin.vs v8, v8, v9
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <4 x float>, <4 x float>* %x		%v = load <4 x float>, <4 x float>* %x
%red = call nnan ninf float @llvm.vector.reduce.fmin.v4f32(<4 x float> %v)		%red = call nnan ninf float @llvm.vector.reduce.fmin.v4f32(<4 x float> %v)
ret float %red		ret float %red
}		}

declare float @llvm.vector.reduce.fmin.v128f32(<128 x float>)		declare float @llvm.vector.reduce.fmin.v128f32(<128 x float>)

define float @vreduce_fmin_v128f32(<128 x float>* %x) {		define float @vreduce_fmin_v128f32(<128 x float>* %x) {
; CHECK-LABEL: vreduce_fmin_v128f32:		; CHECK-LABEL: vreduce_fmin_v128f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: addi a2, a0, 384		; CHECK-NEXT: addi a1, a0, 384
; CHECK-NEXT: vle32.v v16, (a2)		; CHECK-NEXT: vle32.v v16, (a1)
; CHECK-NEXT: addi a2, a0, 256		; CHECK-NEXT: addi a1, a0, 256
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle32.v v24, (a0)		; CHECK-NEXT: vle32.v v24, (a0)
; CHECK-NEXT: vle32.v v0, (a2)		; CHECK-NEXT: vle32.v v0, (a1)
		; CHECK-NEXT: lui a0, %hi(.LCPI77_0)
		; CHECK-NEXT: flw ft0, %lo(.LCPI77_0)(a0)
; CHECK-NEXT: vfmin.vv v16, v24, v16		; CHECK-NEXT: vfmin.vv v16, v24, v16
; CHECK-NEXT: vfmin.vv v8, v8, v0		; CHECK-NEXT: vfmin.vv v8, v8, v0
; CHECK-NEXT: vfmin.vv v8, v8, v16		; CHECK-NEXT: vfmin.vv v8, v8, v16
; CHECK-NEXT: lui a0, %hi(.LCPI77_0)		; CHECK-NEXT: vfmv.s.f v16, ft0
; CHECK-NEXT: addi a0, a0, %lo(.LCPI77_0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vlse32.v v16, (a0), zero
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v16		; CHECK-NEXT: vfredmin.vs v8, v8, v16
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x float>, <128 x float>* %x		%v = load <128 x float>, <128 x float>* %x
%red = call float @llvm.vector.reduce.fmin.v128f32(<128 x float> %v)		%red = call float @llvm.vector.reduce.fmin.v128f32(<128 x float> %v)
ret float %red		ret float %red
}		}

declare double @llvm.vector.reduce.fmin.v2f64(<2 x double>)		declare double @llvm.vector.reduce.fmin.v2f64(<2 x double>)

define double @vreduce_fmin_v2f64(<2 x double>* %x) {		define double @vreduce_fmin_v2f64(<2 x double>* %x) {
; CHECK-LABEL: vreduce_fmin_v2f64:		; RV32-LABEL: vreduce_fmin_v2f64:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-NEXT: vle64.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI78_0)
; CHECK-NEXT: lui a0, %hi(.LCPI78_0)		; RV32-NEXT: fld ft0, %lo(.LCPI78_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI78_0)		; RV32-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vfmv.s.f v9, ft0
; CHECK-NEXT: vlse64.v v9, (a0), zero		; RV32-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmin_v2f64:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI78_0)
		; RV64-NEXT: fld ft0, %lo(.LCPI78_0)(a1)
		; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
		; RV64-NEXT: vle64.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v9, ft0
		; RV64-NEXT: vfredmin.vs v8, v8, v9
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <2 x double>, <2 x double>* %x		%v = load <2 x double>, <2 x double>* %x
%red = call double @llvm.vector.reduce.fmin.v2f64(<2 x double> %v)		%red = call double @llvm.vector.reduce.fmin.v2f64(<2 x double> %v)
ret double %red		ret double %red
}		}

declare double @llvm.vector.reduce.fmin.v4f64(<4 x double>)		declare double @llvm.vector.reduce.fmin.v4f64(<4 x double>)

define double @vreduce_fmin_v4f64(<4 x double>* %x) {		define double @vreduce_fmin_v4f64(<4 x double>* %x) {
; CHECK-LABEL: vreduce_fmin_v4f64:		; RV32-LABEL: vreduce_fmin_v4f64:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-NEXT: vle64.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI79_0)
; CHECK-NEXT: lui a0, %hi(.LCPI79_0)		; RV32-NEXT: fld ft0, %lo(.LCPI79_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI79_0)		; RV32-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vfmv.s.f v10, ft0
; CHECK-NEXT: vlse64.v v10, (a0), zero		; RV32-NEXT: vfredmin.vs v8, v8, v10
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmin.vs v8, v8, v10		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmin_v4f64:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI79_0)
		; RV64-NEXT: fld ft0, %lo(.LCPI79_0)(a1)
		; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
		; RV64-NEXT: vle64.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v10, ft0
		; RV64-NEXT: vfredmin.vs v8, v8, v10
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <4 x double>, <4 x double>* %x		%v = load <4 x double>, <4 x double>* %x
%red = call double @llvm.vector.reduce.fmin.v4f64(<4 x double> %v)		%red = call double @llvm.vector.reduce.fmin.v4f64(<4 x double> %v)
ret double %red		ret double %red
}		}

define double @vreduce_fmin_v4f64_nonans(<4 x double>* %x) {		define double @vreduce_fmin_v4f64_nonans(<4 x double>* %x) {
; CHECK-LABEL: vreduce_fmin_v4f64_nonans:		; RV32-LABEL: vreduce_fmin_v4f64_nonans:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-NEXT: vle64.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI80_0)
; CHECK-NEXT: lui a0, %hi(.LCPI80_0)		; RV32-NEXT: fld ft0, %lo(.LCPI80_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI80_0)		; RV32-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vfmv.s.f v10, ft0
; CHECK-NEXT: vlse64.v v10, (a0), zero		; RV32-NEXT: vfredmin.vs v8, v8, v10
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmin.vs v8, v8, v10		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmin_v4f64_nonans:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI80_0)
		; RV64-NEXT: fld ft0, %lo(.LCPI80_0)(a1)
		; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
		; RV64-NEXT: vle64.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v10, ft0
		; RV64-NEXT: vfredmin.vs v8, v8, v10
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <4 x double>, <4 x double>* %x		%v = load <4 x double>, <4 x double>* %x
%red = call nnan double @llvm.vector.reduce.fmin.v4f64(<4 x double> %v)		%red = call nnan double @llvm.vector.reduce.fmin.v4f64(<4 x double> %v)
ret double %red		ret double %red
}		}

define double @vreduce_fmin_v4f64_nonans_noinfs(<4 x double>* %x) {		define double @vreduce_fmin_v4f64_nonans_noinfs(<4 x double>* %x) {
; CHECK-LABEL: vreduce_fmin_v4f64_nonans_noinfs:		; RV32-LABEL: vreduce_fmin_v4f64_nonans_noinfs:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-NEXT: vle64.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI81_0)
; CHECK-NEXT: lui a0, %hi(.LCPI81_0)		; RV32-NEXT: fld ft0, %lo(.LCPI81_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI81_0)		; RV32-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vfmv.s.f v10, ft0
; CHECK-NEXT: vlse64.v v10, (a0), zero		; RV32-NEXT: vfredmin.vs v8, v8, v10
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmin.vs v8, v8, v10		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmin_v4f64_nonans_noinfs:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI81_0)
		; RV64-NEXT: fld ft0, %lo(.LCPI81_0)(a1)
		; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
		; RV64-NEXT: vle64.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v10, ft0
		; RV64-NEXT: vfredmin.vs v8, v8, v10
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <4 x double>, <4 x double>* %x		%v = load <4 x double>, <4 x double>* %x
%red = call nnan ninf double @llvm.vector.reduce.fmin.v4f64(<4 x double> %v)		%red = call nnan ninf double @llvm.vector.reduce.fmin.v4f64(<4 x double> %v)
ret double %red		ret double %red
}		}

declare double @llvm.vector.reduce.fmin.v32f64(<32 x double>)		declare double @llvm.vector.reduce.fmin.v32f64(<32 x double>)

define double @vreduce_fmin_v32f64(<32 x double>* %x) {		define double @vreduce_fmin_v32f64(<32 x double>* %x) {
; CHECK-LABEL: vreduce_fmin_v32f64:		; RV32-LABEL: vreduce_fmin_v32f64:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; RV32-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; CHECK-NEXT: vle64.v v8, (a0)		; RV32-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; RV32-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle64.v v16, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI82_0)
; CHECK-NEXT: vfmin.vv v8, v8, v16		; RV32-NEXT: fld ft0, %lo(.LCPI82_0)(a1)
; CHECK-NEXT: lui a0, %hi(.LCPI82_0)		; RV32-NEXT: vle64.v v16, (a0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI82_0)		; RV32-NEXT: vfmv.s.f v24, ft0
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vfmin.vv v8, v8, v16
; CHECK-NEXT: vlse64.v v16, (a0), zero		; RV32-NEXT: vfredmin.vs v8, v8, v24
; CHECK-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmin.vs v8, v8, v16		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmin_v32f64:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI82_0)
		; RV64-NEXT: fld ft0, %lo(.LCPI82_0)(a1)
		; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
		; RV64-NEXT: vle64.v v8, (a0)
		; RV64-NEXT: addi a0, a0, 128
		; RV64-NEXT: vle64.v v16, (a0)
		; RV64-NEXT: vfmv.s.f v24, ft0
		; RV64-NEXT: vfmin.vv v8, v8, v16
		; RV64-NEXT: vfredmin.vs v8, v8, v24
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <32 x double>, <32 x double>* %x		%v = load <32 x double>, <32 x double>* %x
%red = call double @llvm.vector.reduce.fmin.v32f64(<32 x double> %v)		%red = call double @llvm.vector.reduce.fmin.v32f64(<32 x double> %v)
ret double %red		ret double %red
}		}

declare half @llvm.vector.reduce.fmax.v2f16(<2 x half>)		declare half @llvm.vector.reduce.fmax.v2f16(<2 x half>)

define half @vreduce_fmax_v2f16(<2 x half>* %x) {		define half @vreduce_fmax_v2f16(<2 x half>* %x) {
; CHECK-LABEL: vreduce_fmax_v2f16:		; RV32-LABEL: vreduce_fmax_v2f16:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma		; RV32-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI83_0)
; CHECK-NEXT: lui a0, %hi(.LCPI83_0)		; RV32-NEXT: flh ft0, %lo(.LCPI83_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI83_0)		; RV32-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma		; RV32-NEXT: vfmv.s.f v9, ft0
; CHECK-NEXT: vlse16.v v9, (a0), zero		; RV32-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmax_v2f16:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI83_0)
		; RV64-NEXT: flh ft0, %lo(.LCPI83_0)(a1)
		; RV64-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
		; RV64-NEXT: vle16.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v9, ft0
		; RV64-NEXT: vfredmax.vs v8, v8, v9
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <2 x half>, <2 x half>* %x		%v = load <2 x half>, <2 x half>* %x
%red = call half @llvm.vector.reduce.fmax.v2f16(<2 x half> %v)		%red = call half @llvm.vector.reduce.fmax.v2f16(<2 x half> %v)
ret half %red		ret half %red
}		}

declare half @llvm.vector.reduce.fmax.v4f16(<4 x half>)		declare half @llvm.vector.reduce.fmax.v4f16(<4 x half>)

define half @vreduce_fmax_v4f16(<4 x half>* %x) {		define half @vreduce_fmax_v4f16(<4 x half>* %x) {
; CHECK-LABEL: vreduce_fmax_v4f16:		; RV32-LABEL: vreduce_fmax_v4f16:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI84_0)
; CHECK-NEXT: lui a0, %hi(.LCPI84_0)		; RV32-NEXT: flh ft0, %lo(.LCPI84_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI84_0)		; RV32-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma		; RV32-NEXT: vfmv.s.f v9, ft0
; CHECK-NEXT: vlse16.v v9, (a0), zero		; RV32-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmax_v4f16:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI84_0)
		; RV64-NEXT: flh ft0, %lo(.LCPI84_0)(a1)
		; RV64-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
		; RV64-NEXT: vle16.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v9, ft0
		; RV64-NEXT: vfredmax.vs v8, v8, v9
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <4 x half>, <4 x half>* %x		%v = load <4 x half>, <4 x half>* %x
%red = call half @llvm.vector.reduce.fmax.v4f16(<4 x half> %v)		%red = call half @llvm.vector.reduce.fmax.v4f16(<4 x half> %v)
ret half %red		ret half %red
}		}

define half @vreduce_fmax_v4f16_nonans(<4 x half>* %x) {		define half @vreduce_fmax_v4f16_nonans(<4 x half>* %x) {
; CHECK-LABEL: vreduce_fmax_v4f16_nonans:		; RV32-LABEL: vreduce_fmax_v4f16_nonans:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI85_0)
; CHECK-NEXT: lui a0, %hi(.LCPI85_0)		; RV32-NEXT: flh ft0, %lo(.LCPI85_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI85_0)		; RV32-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma		; RV32-NEXT: vfmv.s.f v9, ft0
; CHECK-NEXT: vlse16.v v9, (a0), zero		; RV32-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmax_v4f16_nonans:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI85_0)
		; RV64-NEXT: flh ft0, %lo(.LCPI85_0)(a1)
		; RV64-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
		; RV64-NEXT: vle16.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v9, ft0
		; RV64-NEXT: vfredmax.vs v8, v8, v9
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <4 x half>, <4 x half>* %x		%v = load <4 x half>, <4 x half>* %x
%red = call nnan half @llvm.vector.reduce.fmax.v4f16(<4 x half> %v)		%red = call nnan half @llvm.vector.reduce.fmax.v4f16(<4 x half> %v)
ret half %red		ret half %red
}		}

define half @vreduce_fmax_v4f16_nonans_noinfs(<4 x half>* %x) {		define half @vreduce_fmax_v4f16_nonans_noinfs(<4 x half>* %x) {
; CHECK-LABEL: vreduce_fmax_v4f16_nonans_noinfs:		; RV32-LABEL: vreduce_fmax_v4f16_nonans_noinfs:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI86_0)
; CHECK-NEXT: lui a0, %hi(.LCPI86_0)		; RV32-NEXT: flh ft0, %lo(.LCPI86_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI86_0)		; RV32-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma		; RV32-NEXT: vfmv.s.f v9, ft0
; CHECK-NEXT: vlse16.v v9, (a0), zero		; RV32-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmax_v4f16_nonans_noinfs:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI86_0)
		; RV64-NEXT: flh ft0, %lo(.LCPI86_0)(a1)
		; RV64-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
		; RV64-NEXT: vle16.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v9, ft0
		; RV64-NEXT: vfredmax.vs v8, v8, v9
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <4 x half>, <4 x half>* %x		%v = load <4 x half>, <4 x half>* %x
%red = call nnan ninf half @llvm.vector.reduce.fmax.v4f16(<4 x half> %v)		%red = call nnan ninf half @llvm.vector.reduce.fmax.v4f16(<4 x half> %v)
ret half %red		ret half %red
}		}

declare half @llvm.vector.reduce.fmax.v128f16(<128 x half>)		declare half @llvm.vector.reduce.fmax.v128f16(<128 x half>)

define half @vreduce_fmax_v128f16(<128 x half>* %x) {		define half @vreduce_fmax_v128f16(<128 x half>* %x) {
; CHECK-LABEL: vreduce_fmax_v128f16:		; CHECK-LABEL: vreduce_fmax_v128f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
		; CHECK-NEXT: lui a1, %hi(.LCPI87_0)
		; CHECK-NEXT: flh ft0, %lo(.LCPI87_0)(a1)
; CHECK-NEXT: vle16.v v16, (a0)		; CHECK-NEXT: vle16.v v16, (a0)
		; CHECK-NEXT: vfmv.s.f v24, ft0
; CHECK-NEXT: vfmax.vv v8, v8, v16		; CHECK-NEXT: vfmax.vv v8, v8, v16
; CHECK-NEXT: lui a0, %hi(.LCPI87_0)		; CHECK-NEXT: vfredmax.vs v8, v8, v24
; CHECK-NEXT: addi a0, a0, %lo(.LCPI87_0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vlse16.v v16, (a0), zero
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v16
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x half>, <128 x half>* %x		%v = load <128 x half>, <128 x half>* %x
%red = call half @llvm.vector.reduce.fmax.v128f16(<128 x half> %v)		%red = call half @llvm.vector.reduce.fmax.v128f16(<128 x half> %v)
ret half %red		ret half %red
}		}

declare float @llvm.vector.reduce.fmax.v2f32(<2 x float>)		declare float @llvm.vector.reduce.fmax.v2f32(<2 x float>)

define float @vreduce_fmax_v2f32(<2 x float>* %x) {		define float @vreduce_fmax_v2f32(<2 x float>* %x) {
; CHECK-LABEL: vreduce_fmax_v2f32:		; RV32-LABEL: vreduce_fmax_v2f32:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI88_0)
; CHECK-NEXT: lui a0, %hi(.LCPI88_0)		; RV32-NEXT: flw ft0, %lo(.LCPI88_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI88_0)		; RV32-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma		; RV32-NEXT: vfmv.s.f v9, ft0
; CHECK-NEXT: vlse32.v v9, (a0), zero		; RV32-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmax_v2f32:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI88_0)
		; RV64-NEXT: flw ft0, %lo(.LCPI88_0)(a1)
		; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
		; RV64-NEXT: vle32.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v9, ft0
		; RV64-NEXT: vfredmax.vs v8, v8, v9
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <2 x float>, <2 x float>* %x		%v = load <2 x float>, <2 x float>* %x
%red = call float @llvm.vector.reduce.fmax.v2f32(<2 x float> %v)		%red = call float @llvm.vector.reduce.fmax.v2f32(<2 x float> %v)
ret float %red		ret float %red
}		}

declare float @llvm.vector.reduce.fmax.v4f32(<4 x float>)		declare float @llvm.vector.reduce.fmax.v4f32(<4 x float>)

define float @vreduce_fmax_v4f32(<4 x float>* %x) {		define float @vreduce_fmax_v4f32(<4 x float>* %x) {
; CHECK-LABEL: vreduce_fmax_v4f32:		; RV32-LABEL: vreduce_fmax_v4f32:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI89_0)
; CHECK-NEXT: lui a0, %hi(.LCPI89_0)		; RV32-NEXT: flw ft0, %lo(.LCPI89_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI89_0)		; RV32-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; RV32-NEXT: vfmv.s.f v9, ft0
; CHECK-NEXT: vlse32.v v9, (a0), zero		; RV32-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmax_v4f32:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI89_0)
		; RV64-NEXT: flw ft0, %lo(.LCPI89_0)(a1)
		; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
		; RV64-NEXT: vle32.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v9, ft0
		; RV64-NEXT: vfredmax.vs v8, v8, v9
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <4 x float>, <4 x float>* %x		%v = load <4 x float>, <4 x float>* %x
%red = call float @llvm.vector.reduce.fmax.v4f32(<4 x float> %v)		%red = call float @llvm.vector.reduce.fmax.v4f32(<4 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_fmax_v4f32_nonans(<4 x float>* %x) {		define float @vreduce_fmax_v4f32_nonans(<4 x float>* %x) {
; CHECK-LABEL: vreduce_fmax_v4f32_nonans:		; RV32-LABEL: vreduce_fmax_v4f32_nonans:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI90_0)
; CHECK-NEXT: lui a0, %hi(.LCPI90_0)		; RV32-NEXT: flw ft0, %lo(.LCPI90_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI90_0)		; RV32-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; RV32-NEXT: vfmv.s.f v9, ft0
; CHECK-NEXT: vlse32.v v9, (a0), zero		; RV32-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmax_v4f32_nonans:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI90_0)
		; RV64-NEXT: flw ft0, %lo(.LCPI90_0)(a1)
		; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
		; RV64-NEXT: vle32.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v9, ft0
		; RV64-NEXT: vfredmax.vs v8, v8, v9
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <4 x float>, <4 x float>* %x		%v = load <4 x float>, <4 x float>* %x
%red = call nnan float @llvm.vector.reduce.fmax.v4f32(<4 x float> %v)		%red = call nnan float @llvm.vector.reduce.fmax.v4f32(<4 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_fmax_v4f32_nonans_noinfs(<4 x float>* %x) {		define float @vreduce_fmax_v4f32_nonans_noinfs(<4 x float>* %x) {
; CHECK-LABEL: vreduce_fmax_v4f32_nonans_noinfs:		; RV32-LABEL: vreduce_fmax_v4f32_nonans_noinfs:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI91_0)
; CHECK-NEXT: lui a0, %hi(.LCPI91_0)		; RV32-NEXT: flw ft0, %lo(.LCPI91_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI91_0)		; RV32-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; RV32-NEXT: vfmv.s.f v9, ft0
; CHECK-NEXT: vlse32.v v9, (a0), zero		; RV32-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmax_v4f32_nonans_noinfs:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI91_0)
		; RV64-NEXT: flw ft0, %lo(.LCPI91_0)(a1)
		; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
		; RV64-NEXT: vle32.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v9, ft0
		; RV64-NEXT: vfredmax.vs v8, v8, v9
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <4 x float>, <4 x float>* %x		%v = load <4 x float>, <4 x float>* %x
%red = call nnan ninf float @llvm.vector.reduce.fmax.v4f32(<4 x float> %v)		%red = call nnan ninf float @llvm.vector.reduce.fmax.v4f32(<4 x float> %v)
ret float %red		ret float %red
}		}

declare float @llvm.vector.reduce.fmax.v128f32(<128 x float>)		declare float @llvm.vector.reduce.fmax.v128f32(<128 x float>)

define float @vreduce_fmax_v128f32(<128 x float>* %x) {		define float @vreduce_fmax_v128f32(<128 x float>* %x) {
; CHECK-LABEL: vreduce_fmax_v128f32:		; CHECK-LABEL: vreduce_fmax_v128f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: addi a2, a0, 384		; CHECK-NEXT: addi a1, a0, 384
; CHECK-NEXT: vle32.v v16, (a2)		; CHECK-NEXT: vle32.v v16, (a1)
; CHECK-NEXT: addi a2, a0, 256		; CHECK-NEXT: addi a1, a0, 256
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle32.v v24, (a0)		; CHECK-NEXT: vle32.v v24, (a0)
; CHECK-NEXT: vle32.v v0, (a2)		; CHECK-NEXT: vle32.v v0, (a1)
		; CHECK-NEXT: lui a0, %hi(.LCPI92_0)
		; CHECK-NEXT: flw ft0, %lo(.LCPI92_0)(a0)
; CHECK-NEXT: vfmax.vv v16, v24, v16		; CHECK-NEXT: vfmax.vv v16, v24, v16
; CHECK-NEXT: vfmax.vv v8, v8, v0		; CHECK-NEXT: vfmax.vv v8, v8, v0
; CHECK-NEXT: vfmax.vv v8, v8, v16		; CHECK-NEXT: vfmax.vv v8, v8, v16
; CHECK-NEXT: lui a0, %hi(.LCPI92_0)		; CHECK-NEXT: vfmv.s.f v16, ft0
; CHECK-NEXT: addi a0, a0, %lo(.LCPI92_0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vlse32.v v16, (a0), zero
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v16		; CHECK-NEXT: vfredmax.vs v8, v8, v16
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x float>, <128 x float>* %x		%v = load <128 x float>, <128 x float>* %x
%red = call float @llvm.vector.reduce.fmax.v128f32(<128 x float> %v)		%red = call float @llvm.vector.reduce.fmax.v128f32(<128 x float> %v)
ret float %red		ret float %red
}		}

declare double @llvm.vector.reduce.fmax.v2f64(<2 x double>)		declare double @llvm.vector.reduce.fmax.v2f64(<2 x double>)

define double @vreduce_fmax_v2f64(<2 x double>* %x) {		define double @vreduce_fmax_v2f64(<2 x double>* %x) {
; CHECK-LABEL: vreduce_fmax_v2f64:		; RV32-LABEL: vreduce_fmax_v2f64:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-NEXT: vle64.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI93_0)
; CHECK-NEXT: lui a0, %hi(.LCPI93_0)		; RV32-NEXT: fld ft0, %lo(.LCPI93_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI93_0)		; RV32-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vfmv.s.f v9, ft0
; CHECK-NEXT: vlse64.v v9, (a0), zero		; RV32-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmax_v2f64:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI93_0)
		; RV64-NEXT: fld ft0, %lo(.LCPI93_0)(a1)
		; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
		; RV64-NEXT: vle64.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v9, ft0
		; RV64-NEXT: vfredmax.vs v8, v8, v9
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <2 x double>, <2 x double>* %x		%v = load <2 x double>, <2 x double>* %x
%red = call double @llvm.vector.reduce.fmax.v2f64(<2 x double> %v)		%red = call double @llvm.vector.reduce.fmax.v2f64(<2 x double> %v)
ret double %red		ret double %red
}		}

declare double @llvm.vector.reduce.fmax.v4f64(<4 x double>)		declare double @llvm.vector.reduce.fmax.v4f64(<4 x double>)

define double @vreduce_fmax_v4f64(<4 x double>* %x) {		define double @vreduce_fmax_v4f64(<4 x double>* %x) {
; CHECK-LABEL: vreduce_fmax_v4f64:		; RV32-LABEL: vreduce_fmax_v4f64:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-NEXT: vle64.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI94_0)
; CHECK-NEXT: lui a0, %hi(.LCPI94_0)		; RV32-NEXT: fld ft0, %lo(.LCPI94_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI94_0)		; RV32-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vfmv.s.f v10, ft0
; CHECK-NEXT: vlse64.v v10, (a0), zero		; RV32-NEXT: vfredmax.vs v8, v8, v10
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmax.vs v8, v8, v10		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmax_v4f64:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI94_0)
		; RV64-NEXT: fld ft0, %lo(.LCPI94_0)(a1)
		; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
		; RV64-NEXT: vle64.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v10, ft0
		; RV64-NEXT: vfredmax.vs v8, v8, v10
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <4 x double>, <4 x double>* %x		%v = load <4 x double>, <4 x double>* %x
%red = call double @llvm.vector.reduce.fmax.v4f64(<4 x double> %v)		%red = call double @llvm.vector.reduce.fmax.v4f64(<4 x double> %v)
ret double %red		ret double %red
}		}

define double @vreduce_fmax_v4f64_nonans(<4 x double>* %x) {		define double @vreduce_fmax_v4f64_nonans(<4 x double>* %x) {
; CHECK-LABEL: vreduce_fmax_v4f64_nonans:		; RV32-LABEL: vreduce_fmax_v4f64_nonans:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-NEXT: vle64.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI95_0)
; CHECK-NEXT: lui a0, %hi(.LCPI95_0)		; RV32-NEXT: fld ft0, %lo(.LCPI95_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI95_0)		; RV32-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vfmv.s.f v10, ft0
; CHECK-NEXT: vlse64.v v10, (a0), zero		; RV32-NEXT: vfredmax.vs v8, v8, v10
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmax.vs v8, v8, v10		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmax_v4f64_nonans:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI95_0)
		; RV64-NEXT: fld ft0, %lo(.LCPI95_0)(a1)
		; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
		; RV64-NEXT: vle64.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v10, ft0
		; RV64-NEXT: vfredmax.vs v8, v8, v10
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <4 x double>, <4 x double>* %x		%v = load <4 x double>, <4 x double>* %x
%red = call nnan double @llvm.vector.reduce.fmax.v4f64(<4 x double> %v)		%red = call nnan double @llvm.vector.reduce.fmax.v4f64(<4 x double> %v)
ret double %red		ret double %red
}		}

define double @vreduce_fmax_v4f64_nonans_noinfs(<4 x double>* %x) {		define double @vreduce_fmax_v4f64_nonans_noinfs(<4 x double>* %x) {
; CHECK-LABEL: vreduce_fmax_v4f64_nonans_noinfs:		; RV32-LABEL: vreduce_fmax_v4f64_nonans_noinfs:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-NEXT: vle64.v v8, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI96_0)
; CHECK-NEXT: lui a0, %hi(.LCPI96_0)		; RV32-NEXT: fld ft0, %lo(.LCPI96_0)(a1)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI96_0)		; RV32-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vfmv.s.f v10, ft0
; CHECK-NEXT: vlse64.v v10, (a0), zero		; RV32-NEXT: vfredmax.vs v8, v8, v10
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmax.vs v8, v8, v10		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmax_v4f64_nonans_noinfs:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI96_0)
		; RV64-NEXT: fld ft0, %lo(.LCPI96_0)(a1)
		; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
		; RV64-NEXT: vle64.v v8, (a0)
		; RV64-NEXT: vfmv.s.f v10, ft0
		; RV64-NEXT: vfredmax.vs v8, v8, v10
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <4 x double>, <4 x double>* %x		%v = load <4 x double>, <4 x double>* %x
%red = call nnan ninf double @llvm.vector.reduce.fmax.v4f64(<4 x double> %v)		%red = call nnan ninf double @llvm.vector.reduce.fmax.v4f64(<4 x double> %v)
ret double %red		ret double %red
}		}

declare double @llvm.vector.reduce.fmax.v32f64(<32 x double>)		declare double @llvm.vector.reduce.fmax.v32f64(<32 x double>)

define double @vreduce_fmax_v32f64(<32 x double>* %x) {		define double @vreduce_fmax_v32f64(<32 x double>* %x) {
; CHECK-LABEL: vreduce_fmax_v32f64:		; RV32-LABEL: vreduce_fmax_v32f64:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; RV32-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; CHECK-NEXT: vle64.v v8, (a0)		; RV32-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; RV32-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle64.v v16, (a0)		; RV32-NEXT: lui a1, %hi(.LCPI97_0)
; CHECK-NEXT: vfmax.vv v8, v8, v16		; RV32-NEXT: fld ft0, %lo(.LCPI97_0)(a1)
; CHECK-NEXT: lui a0, %hi(.LCPI97_0)		; RV32-NEXT: vle64.v v16, (a0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI97_0)		; RV32-NEXT: vfmv.s.f v24, ft0
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vfmax.vv v8, v8, v16
; CHECK-NEXT: vlse64.v v16, (a0), zero		; RV32-NEXT: vfredmax.vs v8, v8, v24
; CHECK-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; RV32-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: vfredmax.vs v8, v8, v16		; RV32-NEXT: ret
; CHECK-NEXT: vfmv.f.s fa0, v8		;
; CHECK-NEXT: ret		; RV64-LABEL: vreduce_fmax_v32f64:
		; RV64: # %bb.0:
		; RV64-NEXT: lui a1, %hi(.LCPI97_0)
		; RV64-NEXT: fld ft0, %lo(.LCPI97_0)(a1)
		; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
		; RV64-NEXT: vle64.v v8, (a0)
		; RV64-NEXT: addi a0, a0, 128
		; RV64-NEXT: vle64.v v16, (a0)
		; RV64-NEXT: vfmv.s.f v24, ft0
		; RV64-NEXT: vfmax.vv v8, v8, v16
		; RV64-NEXT: vfredmax.vs v8, v8, v24
		; RV64-NEXT: vfmv.f.s fa0, v8
		; RV64-NEXT: ret
%v = load <32 x double>, <32 x double>* %x		%v = load <32 x double>, <32 x double>* %x
%red = call double @llvm.vector.reduce.fmax.v32f64(<32 x double> %v)		%red = call double @llvm.vector.reduce.fmax.v32f64(<32 x double> %v)
ret double %red		ret double %red
}		}

define float @vreduce_nsz_fadd_v4f32(<4 x float>* %x, float %s) {		define float @vreduce_nsz_fadd_v4f32(<4 x float>* %x, float %s) {
; CHECK-LABEL: vreduce_nsz_fadd_v4f32:		; CHECK-LABEL: vreduce_nsz_fadd_v4f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
Show All 10 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-int.ll

Show First 20 Lines • Show All 82 Lines • ▼ Show 20 Lines
declare i8 @llvm.vector.reduce.add.v32i8(<32 x i8>)		declare i8 @llvm.vector.reduce.add.v32i8(<32 x i8>)

define i8 @vreduce_add_v32i8(<32 x i8>* %x) {		define i8 @vreduce_add_v32i8(<32 x i8>* %x) {
; CHECK-LABEL: vreduce_add_v32i8:		; CHECK-LABEL: vreduce_add_v32i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v10, zero		; CHECK-NEXT: vmv.s.x v10, zero
; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma
; CHECK-NEXT: vredsum.vs v8, v8, v10		; CHECK-NEXT: vredsum.vs v8, v8, v10
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i8>, <32 x i8>* %x		%v = load <32 x i8>, <32 x i8>* %x
%red = call i8 @llvm.vector.reduce.add.v32i8(<32 x i8> %v)		%red = call i8 @llvm.vector.reduce.add.v32i8(<32 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.add.v64i8(<64 x i8>)		declare i8 @llvm.vector.reduce.add.v64i8(<64 x i8>)

define i8 @vreduce_add_v64i8(<64 x i8>* %x) {		define i8 @vreduce_add_v64i8(<64 x i8>* %x) {
; CHECK-LABEL: vreduce_add_v64i8:		; CHECK-LABEL: vreduce_add_v64i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v12, zero		; CHECK-NEXT: vmv.s.x v12, zero
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vredsum.vs v8, v8, v12		; CHECK-NEXT: vredsum.vs v8, v8, v12
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i8>, <64 x i8>* %x		%v = load <64 x i8>, <64 x i8>* %x
%red = call i8 @llvm.vector.reduce.add.v64i8(<64 x i8> %v)		%red = call i8 @llvm.vector.reduce.add.v64i8(<64 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.add.v128i8(<128 x i8>)		declare i8 @llvm.vector.reduce.add.v128i8(<128 x i8>)

define i8 @vreduce_add_v128i8(<128 x i8>* %x) {		define i8 @vreduce_add_v128i8(<128 x i8>* %x) {
; CHECK-LABEL: vreduce_add_v128i8:		; CHECK-LABEL: vreduce_add_v128i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 128		; CHECK-NEXT: li a1, 128
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v16, zero		; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vredsum.vs v8, v8, v16		; CHECK-NEXT: vredsum.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x i8>, <128 x i8>* %x		%v = load <128 x i8>, <128 x i8>* %x
%red = call i8 @llvm.vector.reduce.add.v128i8(<128 x i8> %v)		%red = call i8 @llvm.vector.reduce.add.v128i8(<128 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.add.v256i8(<256 x i8>)		declare i8 @llvm.vector.reduce.add.v256i8(<256 x i8>)

define i8 @vreduce_add_v256i8(<256 x i8>* %x) {		define i8 @vreduce_add_v256i8(<256 x i8>* %x) {
; CHECK-LABEL: vreduce_add_v256i8:		; CHECK-LABEL: vreduce_add_v256i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 128		; CHECK-NEXT: li a1, 128
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle8.v v16, (a0)		; CHECK-NEXT: vle8.v v16, (a0)
		; CHECK-NEXT: vmv.s.x v24, zero
; CHECK-NEXT: vadd.vv v8, v8, v16		; CHECK-NEXT: vadd.vv v8, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma		; CHECK-NEXT: vredsum.vs v8, v8, v24
; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vredsum.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <256 x i8>, <256 x i8>* %x		%v = load <256 x i8>, <256 x i8>* %x
%red = call i8 @llvm.vector.reduce.add.v256i8(<256 x i8> %v)		%red = call i8 @llvm.vector.reduce.add.v256i8(<256 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i16 @llvm.vector.reduce.add.v1i16(<1 x i16>)		declare i16 @llvm.vector.reduce.add.v1i16(<1 x i16>)
▲ Show 20 Lines • Show All 204 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret i16 %red		ret i16 %red
}		}

define i16 @vwreduce_add_v16i16(<16 x i8>* %x) {		define i16 @vwreduce_add_v16i16(<16 x i8>* %x) {
; CHECK-LABEL: vwreduce_add_v16i16:		; CHECK-LABEL: vwreduce_add_v16i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero		; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma
; CHECK-NEXT: vwredsum.vs v8, v8, v9		; CHECK-NEXT: vwredsum.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <16 x i8>, <16 x i8>* %x		%v = load <16 x i8>, <16 x i8>* %x
%e = sext <16 x i8> %v to <16 x i16>		%e = sext <16 x i8> %v to <16 x i16>
%red = call i16 @llvm.vector.reduce.add.v16i16(<16 x i16> %e)		%red = call i16 @llvm.vector.reduce.add.v16i16(<16 x i16> %e)
ret i16 %red		ret i16 %red
}		}

define i16 @vwreduce_uadd_v16i16(<16 x i8>* %x) {		define i16 @vwreduce_uadd_v16i16(<16 x i8>* %x) {
; CHECK-LABEL: vwreduce_uadd_v16i16:		; CHECK-LABEL: vwreduce_uadd_v16i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero		; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma
; CHECK-NEXT: vwredsumu.vs v8, v8, v9		; CHECK-NEXT: vwredsumu.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <16 x i8>, <16 x i8>* %x		%v = load <16 x i8>, <16 x i8>* %x
%e = zext <16 x i8> %v to <16 x i16>		%e = zext <16 x i8> %v to <16 x i16>
%red = call i16 @llvm.vector.reduce.add.v16i16(<16 x i16> %e)		%red = call i16 @llvm.vector.reduce.add.v16i16(<16 x i16> %e)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.add.v32i16(<32 x i16>)		declare i16 @llvm.vector.reduce.add.v32i16(<32 x i16>)

define i16 @vreduce_add_v32i16(<32 x i16>* %x) {		define i16 @vreduce_add_v32i16(<32 x i16>* %x) {
; CHECK-LABEL: vreduce_add_v32i16:		; CHECK-LABEL: vreduce_add_v32i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v12, zero		; CHECK-NEXT: vmv.s.x v12, zero
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vredsum.vs v8, v8, v12		; CHECK-NEXT: vredsum.vs v8, v8, v12
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i16>, <32 x i16>* %x		%v = load <32 x i16>, <32 x i16>* %x
%red = call i16 @llvm.vector.reduce.add.v32i16(<32 x i16> %v)		%red = call i16 @llvm.vector.reduce.add.v32i16(<32 x i16> %v)
ret i16 %red		ret i16 %red
}		}

define i16 @vwreduce_add_v32i16(<32 x i8>* %x) {		define i16 @vwreduce_add_v32i16(<32 x i8>* %x) {
; CHECK-LABEL: vwreduce_add_v32i16:		; CHECK-LABEL: vwreduce_add_v32i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v10, zero		; CHECK-NEXT: vmv.s.x v10, zero
; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma
; CHECK-NEXT: vwredsum.vs v8, v8, v10		; CHECK-NEXT: vwredsum.vs v8, v8, v10
; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i8>, <32 x i8>* %x		%v = load <32 x i8>, <32 x i8>* %x
%e = sext <32 x i8> %v to <32 x i16>		%e = sext <32 x i8> %v to <32 x i16>
%red = call i16 @llvm.vector.reduce.add.v32i16(<32 x i16> %e)		%red = call i16 @llvm.vector.reduce.add.v32i16(<32 x i16> %e)
ret i16 %red		ret i16 %red
}		}

define i16 @vwreduce_uadd_v32i16(<32 x i8>* %x) {		define i16 @vwreduce_uadd_v32i16(<32 x i8>* %x) {
; CHECK-LABEL: vwreduce_uadd_v32i16:		; CHECK-LABEL: vwreduce_uadd_v32i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v10, zero		; CHECK-NEXT: vmv.s.x v10, zero
; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma
; CHECK-NEXT: vwredsumu.vs v8, v8, v10		; CHECK-NEXT: vwredsumu.vs v8, v8, v10
; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i8>, <32 x i8>* %x		%v = load <32 x i8>, <32 x i8>* %x
%e = zext <32 x i8> %v to <32 x i16>		%e = zext <32 x i8> %v to <32 x i16>
%red = call i16 @llvm.vector.reduce.add.v32i16(<32 x i16> %e)		%red = call i16 @llvm.vector.reduce.add.v32i16(<32 x i16> %e)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.add.v64i16(<64 x i16>)		declare i16 @llvm.vector.reduce.add.v64i16(<64 x i16>)

define i16 @vreduce_add_v64i16(<64 x i16>* %x) {		define i16 @vreduce_add_v64i16(<64 x i16>* %x) {
; CHECK-LABEL: vreduce_add_v64i16:		; CHECK-LABEL: vreduce_add_v64i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v16, zero		; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vredsum.vs v8, v8, v16		; CHECK-NEXT: vredsum.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i16>, <64 x i16>* %x		%v = load <64 x i16>, <64 x i16>* %x
%red = call i16 @llvm.vector.reduce.add.v64i16(<64 x i16> %v)		%red = call i16 @llvm.vector.reduce.add.v64i16(<64 x i16> %v)
ret i16 %red		ret i16 %red
}		}

define i16 @vwreduce_add_v64i16(<64 x i8>* %x) {		define i16 @vwreduce_add_v64i16(<64 x i8>* %x) {
; CHECK-LABEL: vwreduce_add_v64i16:		; CHECK-LABEL: vwreduce_add_v64i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v12, zero		; CHECK-NEXT: vmv.s.x v12, zero
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vwredsum.vs v8, v8, v12		; CHECK-NEXT: vwredsum.vs v8, v8, v12
; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i8>, <64 x i8>* %x		%v = load <64 x i8>, <64 x i8>* %x
%e = sext <64 x i8> %v to <64 x i16>		%e = sext <64 x i8> %v to <64 x i16>
%red = call i16 @llvm.vector.reduce.add.v64i16(<64 x i16> %e)		%red = call i16 @llvm.vector.reduce.add.v64i16(<64 x i16> %e)
ret i16 %red		ret i16 %red
}		}

define i16 @vwreduce_uadd_v64i16(<64 x i8>* %x) {		define i16 @vwreduce_uadd_v64i16(<64 x i8>* %x) {
; CHECK-LABEL: vwreduce_uadd_v64i16:		; CHECK-LABEL: vwreduce_uadd_v64i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v12, zero		; CHECK-NEXT: vmv.s.x v12, zero
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vwredsumu.vs v8, v8, v12		; CHECK-NEXT: vwredsumu.vs v8, v8, v12
; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i8>, <64 x i8>* %x		%v = load <64 x i8>, <64 x i8>* %x
%e = zext <64 x i8> %v to <64 x i16>		%e = zext <64 x i8> %v to <64 x i16>
%red = call i16 @llvm.vector.reduce.add.v64i16(<64 x i16> %e)		%red = call i16 @llvm.vector.reduce.add.v64i16(<64 x i16> %e)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.add.v128i16(<128 x i16>)		declare i16 @llvm.vector.reduce.add.v128i16(<128 x i16>)

define i16 @vreduce_add_v128i16(<128 x i16>* %x) {		define i16 @vreduce_add_v128i16(<128 x i16>* %x) {
; CHECK-LABEL: vreduce_add_v128i16:		; CHECK-LABEL: vreduce_add_v128i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle16.v v16, (a0)		; CHECK-NEXT: vle16.v v16, (a0)
		; CHECK-NEXT: vmv.s.x v24, zero
; CHECK-NEXT: vadd.vv v8, v8, v16		; CHECK-NEXT: vadd.vv v8, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vredsum.vs v8, v8, v24
; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vredsum.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x i16>, <128 x i16>* %x		%v = load <128 x i16>, <128 x i16>* %x
%red = call i16 @llvm.vector.reduce.add.v128i16(<128 x i16> %v)		%red = call i16 @llvm.vector.reduce.add.v128i16(<128 x i16> %v)
ret i16 %red		ret i16 %red
}		}

define i16 @vwreduce_add_v128i16(<128 x i8>* %x) {		define i16 @vwreduce_add_v128i16(<128 x i8>* %x) {
; CHECK-LABEL: vwreduce_add_v128i16:		; CHECK-LABEL: vwreduce_add_v128i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 128		; CHECK-NEXT: li a1, 128
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: li a0, 64		; CHECK-NEXT: li a0, 64
; CHECK-NEXT: vsetvli zero, a0, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e8, m8, ta, ma
; CHECK-NEXT: vslidedown.vx v16, v8, a0		; CHECK-NEXT: vslidedown.vx v16, v8, a0
		; CHECK-NEXT: vsetvli zero, a0, e16, m1, ta, ma
		; CHECK-NEXT: vmv.s.x v24, zero
; CHECK-NEXT: vsetvli zero, a0, e8, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e8, m4, ta, ma
; CHECK-NEXT: vwadd.vv v24, v8, v16		; CHECK-NEXT: vwadd.vv v0, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e16, m8, ta, ma
; CHECK-NEXT: vmv.s.x v8, zero		; CHECK-NEXT: vredsum.vs v8, v0, v24
; CHECK-NEXT: vsetvli zero, a0, e16, m8, ta, ma
; CHECK-NEXT: vredsum.vs v8, v24, v8
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x i8>, <128 x i8>* %x		%v = load <128 x i8>, <128 x i8>* %x
%e = sext <128 x i8> %v to <128 x i16>		%e = sext <128 x i8> %v to <128 x i16>
%red = call i16 @llvm.vector.reduce.add.v128i16(<128 x i16> %e)		%red = call i16 @llvm.vector.reduce.add.v128i16(<128 x i16> %e)
ret i16 %red		ret i16 %red
}		}

define i16 @vwreduce_uadd_v128i16(<128 x i8>* %x) {		define i16 @vwreduce_uadd_v128i16(<128 x i8>* %x) {
; CHECK-LABEL: vwreduce_uadd_v128i16:		; CHECK-LABEL: vwreduce_uadd_v128i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 128		; CHECK-NEXT: li a1, 128
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: li a0, 64		; CHECK-NEXT: li a0, 64
; CHECK-NEXT: vsetvli zero, a0, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e8, m8, ta, ma
; CHECK-NEXT: vslidedown.vx v16, v8, a0		; CHECK-NEXT: vslidedown.vx v16, v8, a0
		; CHECK-NEXT: vsetvli zero, a0, e16, m1, ta, ma
		; CHECK-NEXT: vmv.s.x v24, zero
; CHECK-NEXT: vsetvli zero, a0, e8, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e8, m4, ta, ma
; CHECK-NEXT: vwaddu.vv v24, v8, v16		; CHECK-NEXT: vwaddu.vv v0, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e16, m8, ta, ma
; CHECK-NEXT: vmv.s.x v8, zero		; CHECK-NEXT: vredsum.vs v8, v0, v24
; CHECK-NEXT: vsetvli zero, a0, e16, m8, ta, ma
; CHECK-NEXT: vredsum.vs v8, v24, v8
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x i8>, <128 x i8>* %x		%v = load <128 x i8>, <128 x i8>* %x
%e = zext <128 x i8> %v to <128 x i16>		%e = zext <128 x i8> %v to <128 x i16>
%red = call i16 @llvm.vector.reduce.add.v128i16(<128 x i16> %e)		%red = call i16 @llvm.vector.reduce.add.v128i16(<128 x i16> %e)
ret i16 %red		ret i16 %red
}		}

▲ Show 20 Lines • Show All 155 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret i32 %red		ret i32 %red
}		}

define i32 @vwreduce_add_v8i32(<8 x i16>* %x) {		define i32 @vwreduce_add_v8i32(<8 x i16>* %x) {
; CHECK-LABEL: vwreduce_add_v8i32:		; CHECK-LABEL: vwreduce_add_v8i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero		; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; CHECK-NEXT: vwredsum.vs v8, v8, v9		; CHECK-NEXT: vwredsum.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <8 x i16>, <8 x i16>* %x		%v = load <8 x i16>, <8 x i16>* %x
%e = sext <8 x i16> %v to <8 x i32>		%e = sext <8 x i16> %v to <8 x i32>
%red = call i32 @llvm.vector.reduce.add.v8i32(<8 x i32> %e)		%red = call i32 @llvm.vector.reduce.add.v8i32(<8 x i32> %e)
ret i32 %red		ret i32 %red
}		}

define i32 @vwreduce_uadd_v8i32(<8 x i16>* %x) {		define i32 @vwreduce_uadd_v8i32(<8 x i16>* %x) {
; CHECK-LABEL: vwreduce_uadd_v8i32:		; CHECK-LABEL: vwreduce_uadd_v8i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero		; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; CHECK-NEXT: vwredsumu.vs v8, v8, v9		; CHECK-NEXT: vwredsumu.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <8 x i16>, <8 x i16>* %x		%v = load <8 x i16>, <8 x i16>* %x
%e = zext <8 x i16> %v to <8 x i32>		%e = zext <8 x i16> %v to <8 x i32>
Show All 17 Lines	; CHECK-NEXT: ret
ret i32 %red		ret i32 %red
}		}

define i32 @vwreduce_add_v16i32(<16 x i16>* %x) {		define i32 @vwreduce_add_v16i32(<16 x i16>* %x) {
; CHECK-LABEL: vwreduce_add_v16i32:		; CHECK-LABEL: vwreduce_add_v16i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v10, zero		; CHECK-NEXT: vmv.s.x v10, zero
; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma
; CHECK-NEXT: vwredsum.vs v8, v8, v10		; CHECK-NEXT: vwredsum.vs v8, v8, v10
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <16 x i16>, <16 x i16>* %x		%v = load <16 x i16>, <16 x i16>* %x
%e = sext <16 x i16> %v to <16 x i32>		%e = sext <16 x i16> %v to <16 x i32>
%red = call i32 @llvm.vector.reduce.add.v16i32(<16 x i32> %e)		%red = call i32 @llvm.vector.reduce.add.v16i32(<16 x i32> %e)
ret i32 %red		ret i32 %red
}		}

define i32 @vwreduce_uadd_v16i32(<16 x i16>* %x) {		define i32 @vwreduce_uadd_v16i32(<16 x i16>* %x) {
; CHECK-LABEL: vwreduce_uadd_v16i32:		; CHECK-LABEL: vwreduce_uadd_v16i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v10, zero		; CHECK-NEXT: vmv.s.x v10, zero
; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma
; CHECK-NEXT: vwredsumu.vs v8, v8, v10		; CHECK-NEXT: vwredsumu.vs v8, v8, v10
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <16 x i16>, <16 x i16>* %x		%v = load <16 x i16>, <16 x i16>* %x
%e = zext <16 x i16> %v to <16 x i32>		%e = zext <16 x i16> %v to <16 x i32>
%red = call i32 @llvm.vector.reduce.add.v16i32(<16 x i32> %e)		%red = call i32 @llvm.vector.reduce.add.v16i32(<16 x i32> %e)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.add.v32i32(<32 x i32>)		declare i32 @llvm.vector.reduce.add.v32i32(<32 x i32>)

define i32 @vreduce_add_v32i32(<32 x i32>* %x) {		define i32 @vreduce_add_v32i32(<32 x i32>* %x) {
; CHECK-LABEL: vreduce_add_v32i32:		; CHECK-LABEL: vreduce_add_v32i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v16, zero		; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vredsum.vs v8, v8, v16		; CHECK-NEXT: vredsum.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i32>, <32 x i32>* %x		%v = load <32 x i32>, <32 x i32>* %x
%red = call i32 @llvm.vector.reduce.add.v32i32(<32 x i32> %v)		%red = call i32 @llvm.vector.reduce.add.v32i32(<32 x i32> %v)
ret i32 %red		ret i32 %red
}		}

define i32 @vwreduce_add_v32i32(<32 x i16>* %x) {		define i32 @vwreduce_add_v32i32(<32 x i16>* %x) {
; CHECK-LABEL: vwreduce_add_v32i32:		; CHECK-LABEL: vwreduce_add_v32i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v12, zero		; CHECK-NEXT: vmv.s.x v12, zero
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vwredsum.vs v8, v8, v12		; CHECK-NEXT: vwredsum.vs v8, v8, v12
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i16>, <32 x i16>* %x		%v = load <32 x i16>, <32 x i16>* %x
%e = sext <32 x i16> %v to <32 x i32>		%e = sext <32 x i16> %v to <32 x i32>
%red = call i32 @llvm.vector.reduce.add.v32i32(<32 x i32> %e)		%red = call i32 @llvm.vector.reduce.add.v32i32(<32 x i32> %e)
ret i32 %red		ret i32 %red
}		}

define i32 @vwreduce_uadd_v32i32(<32 x i16>* %x) {		define i32 @vwreduce_uadd_v32i32(<32 x i16>* %x) {
; CHECK-LABEL: vwreduce_uadd_v32i32:		; CHECK-LABEL: vwreduce_uadd_v32i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v12, zero		; CHECK-NEXT: vmv.s.x v12, zero
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vwredsumu.vs v8, v8, v12		; CHECK-NEXT: vwredsumu.vs v8, v8, v12
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i16>, <32 x i16>* %x		%v = load <32 x i16>, <32 x i16>* %x
%e = zext <32 x i16> %v to <32 x i32>		%e = zext <32 x i16> %v to <32 x i32>
%red = call i32 @llvm.vector.reduce.add.v32i32(<32 x i32> %e)		%red = call i32 @llvm.vector.reduce.add.v32i32(<32 x i32> %e)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.add.v64i32(<64 x i32>)		declare i32 @llvm.vector.reduce.add.v64i32(<64 x i32>)

define i32 @vreduce_add_v64i32(<64 x i32>* %x) {		define i32 @vreduce_add_v64i32(<64 x i32>* %x) {
; CHECK-LABEL: vreduce_add_v64i32:		; CHECK-LABEL: vreduce_add_v64i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle32.v v16, (a0)		; CHECK-NEXT: vle32.v v16, (a0)
		; CHECK-NEXT: vmv.s.x v24, zero
; CHECK-NEXT: vadd.vv v8, v8, v16		; CHECK-NEXT: vadd.vv v8, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vredsum.vs v8, v8, v24
; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vredsum.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i32>, <64 x i32>* %x		%v = load <64 x i32>, <64 x i32>* %x
%red = call i32 @llvm.vector.reduce.add.v64i32(<64 x i32> %v)		%red = call i32 @llvm.vector.reduce.add.v64i32(<64 x i32> %v)
ret i32 %red		ret i32 %red
}		}

define i32 @vwreduce_add_v64i32(<64 x i16>* %x) {		define i32 @vwreduce_add_v64i32(<64 x i16>* %x) {
; CHECK-LABEL: vwreduce_add_v64i32:		; CHECK-LABEL: vwreduce_add_v64i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: li a0, 32		; CHECK-NEXT: li a0, 32
; CHECK-NEXT: vsetvli zero, a0, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e16, m8, ta, ma
; CHECK-NEXT: vslidedown.vx v16, v8, a0		; CHECK-NEXT: vslidedown.vx v16, v8, a0
		; CHECK-NEXT: vsetvli zero, a0, e32, m1, ta, ma
		; CHECK-NEXT: vmv.s.x v24, zero
; CHECK-NEXT: vsetvli zero, a0, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e16, m4, ta, ma
; CHECK-NEXT: vwadd.vv v24, v8, v16		; CHECK-NEXT: vwadd.vv v0, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e32, m8, ta, ma
; CHECK-NEXT: vmv.s.x v8, zero		; CHECK-NEXT: vredsum.vs v8, v0, v24
; CHECK-NEXT: vsetvli zero, a0, e32, m8, ta, ma
; CHECK-NEXT: vredsum.vs v8, v24, v8
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i16>, <64 x i16>* %x		%v = load <64 x i16>, <64 x i16>* %x
%e = sext <64 x i16> %v to <64 x i32>		%e = sext <64 x i16> %v to <64 x i32>
%red = call i32 @llvm.vector.reduce.add.v64i32(<64 x i32> %e)		%red = call i32 @llvm.vector.reduce.add.v64i32(<64 x i32> %e)
ret i32 %red		ret i32 %red
}		}

define i32 @vwreduce_uadd_v64i32(<64 x i16>* %x) {		define i32 @vwreduce_uadd_v64i32(<64 x i16>* %x) {
; CHECK-LABEL: vwreduce_uadd_v64i32:		; CHECK-LABEL: vwreduce_uadd_v64i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: li a0, 32		; CHECK-NEXT: li a0, 32
; CHECK-NEXT: vsetvli zero, a0, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e16, m8, ta, ma
; CHECK-NEXT: vslidedown.vx v16, v8, a0		; CHECK-NEXT: vslidedown.vx v16, v8, a0
		; CHECK-NEXT: vsetvli zero, a0, e32, m1, ta, ma
		; CHECK-NEXT: vmv.s.x v24, zero
; CHECK-NEXT: vsetvli zero, a0, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e16, m4, ta, ma
; CHECK-NEXT: vwaddu.vv v24, v8, v16		; CHECK-NEXT: vwaddu.vv v0, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e32, m8, ta, ma
; CHECK-NEXT: vmv.s.x v8, zero		; CHECK-NEXT: vredsum.vs v8, v0, v24
; CHECK-NEXT: vsetvli zero, a0, e32, m8, ta, ma
; CHECK-NEXT: vredsum.vs v8, v24, v8
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i16>, <64 x i16>* %x		%v = load <64 x i16>, <64 x i16>* %x
%e = zext <64 x i16> %v to <64 x i32>		%e = zext <64 x i16> %v to <64 x i32>
%red = call i32 @llvm.vector.reduce.add.v64i32(<64 x i32> %e)		%red = call i32 @llvm.vector.reduce.add.v64i32(<64 x i32> %e)
ret i32 %red		ret i32 %red
}		}

▲ Show 20 Lines • Show All 209 Lines • ▼ Show 20 Lines
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwreduce_add_v4i64:		; RV64-LABEL: vwreduce_add_v4i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; RV64-NEXT: vle32.v v8, (a0)		; RV64-NEXT: vle32.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 4, e64, m1, ta, ma
; RV64-NEXT: vmv.s.x v9, zero		; RV64-NEXT: vmv.s.x v9, zero
; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; RV64-NEXT: vwredsum.vs v8, v8, v9		; RV64-NEXT: vwredsum.vs v8, v8, v9
; RV64-NEXT: vsetivli zero, 0, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 0, e64, m1, ta, ma
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <4 x i32>, <4 x i32>* %x		%v = load <4 x i32>, <4 x i32>* %x
%e = sext <4 x i32> %v to <4 x i64>		%e = sext <4 x i32> %v to <4 x i64>
Show All 17 Lines
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwreduce_uadd_v4i64:		; RV64-LABEL: vwreduce_uadd_v4i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; RV64-NEXT: vle32.v v8, (a0)		; RV64-NEXT: vle32.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 4, e64, m1, ta, ma
; RV64-NEXT: vmv.s.x v9, zero		; RV64-NEXT: vmv.s.x v9, zero
; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; RV64-NEXT: vwredsumu.vs v8, v8, v9		; RV64-NEXT: vwredsumu.vs v8, v8, v9
; RV64-NEXT: vsetivli zero, 0, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 0, e64, m1, ta, ma
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <4 x i32>, <4 x i32>* %x		%v = load <4 x i32>, <4 x i32>* %x
%e = zext <4 x i32> %v to <4 x i64>		%e = zext <4 x i32> %v to <4 x i64>
▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwreduce_add_v8i64:		; RV64-LABEL: vwreduce_add_v8i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; RV64-NEXT: vsetivli zero, 8, e32, m2, ta, ma
; RV64-NEXT: vle32.v v8, (a0)		; RV64-NEXT: vle32.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 8, e64, m1, ta, ma
; RV64-NEXT: vmv.s.x v10, zero		; RV64-NEXT: vmv.s.x v10, zero
; RV64-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; RV64-NEXT: vsetivli zero, 8, e32, m2, ta, ma
; RV64-NEXT: vwredsum.vs v8, v8, v10		; RV64-NEXT: vwredsum.vs v8, v8, v10
; RV64-NEXT: vsetivli zero, 0, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 0, e64, m1, ta, ma
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <8 x i32>, <8 x i32>* %x		%v = load <8 x i32>, <8 x i32>* %x
%e = sext <8 x i32> %v to <8 x i64>		%e = sext <8 x i32> %v to <8 x i64>
Show All 17 Lines
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwreduce_uadd_v8i64:		; RV64-LABEL: vwreduce_uadd_v8i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; RV64-NEXT: vsetivli zero, 8, e32, m2, ta, ma
; RV64-NEXT: vle32.v v8, (a0)		; RV64-NEXT: vle32.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 8, e64, m1, ta, ma
; RV64-NEXT: vmv.s.x v10, zero		; RV64-NEXT: vmv.s.x v10, zero
; RV64-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; RV64-NEXT: vsetivli zero, 8, e32, m2, ta, ma
; RV64-NEXT: vwredsumu.vs v8, v8, v10		; RV64-NEXT: vwredsumu.vs v8, v8, v10
; RV64-NEXT: vsetivli zero, 0, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 0, e64, m1, ta, ma
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <8 x i32>, <8 x i32>* %x		%v = load <8 x i32>, <8 x i32>* %x
%e = zext <8 x i32> %v to <8 x i64>		%e = zext <8 x i32> %v to <8 x i64>
▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwreduce_add_v16i64:		; RV64-LABEL: vwreduce_add_v16i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; RV64-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; RV64-NEXT: vle32.v v8, (a0)		; RV64-NEXT: vle32.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m1, ta, ma
; RV64-NEXT: vmv.s.x v12, zero		; RV64-NEXT: vmv.s.x v12, zero
; RV64-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; RV64-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; RV64-NEXT: vwredsum.vs v8, v8, v12		; RV64-NEXT: vwredsum.vs v8, v8, v12
; RV64-NEXT: vsetivli zero, 0, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 0, e64, m1, ta, ma
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <16 x i32>, <16 x i32>* %x		%v = load <16 x i32>, <16 x i32>* %x
%e = sext <16 x i32> %v to <16 x i64>		%e = sext <16 x i32> %v to <16 x i64>
Show All 17 Lines
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwreduce_uadd_v16i64:		; RV64-LABEL: vwreduce_uadd_v16i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; RV64-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; RV64-NEXT: vle32.v v8, (a0)		; RV64-NEXT: vle32.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m1, ta, ma
; RV64-NEXT: vmv.s.x v12, zero		; RV64-NEXT: vmv.s.x v12, zero
; RV64-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; RV64-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; RV64-NEXT: vwredsumu.vs v8, v8, v12		; RV64-NEXT: vwredsumu.vs v8, v8, v12
; RV64-NEXT: vsetivli zero, 0, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 0, e64, m1, ta, ma
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <16 x i32>, <16 x i32>* %x		%v = load <16 x i32>, <16 x i32>* %x
%e = zext <16 x i32> %v to <16 x i64>		%e = zext <16 x i32> %v to <16 x i64>
▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: li a1, 32		; RV64-NEXT: li a1, 32
; RV64-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV64-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; RV64-NEXT: vle32.v v8, (a0)		; RV64-NEXT: vle32.v v8, (a0)
; RV64-NEXT: vsetivli zero, 16, e32, m8, ta, ma		; RV64-NEXT: vsetivli zero, 16, e32, m8, ta, ma
; RV64-NEXT: vslidedown.vi v16, v8, 16		; RV64-NEXT: vslidedown.vi v16, v8, 16
; RV64-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; RV64-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; RV64-NEXT: vwadd.vv v24, v8, v16		; RV64-NEXT: vwadd.vv v24, v8, v16
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m1, ta, ma
; RV64-NEXT: vmv.s.x v8, zero		; RV64-NEXT: vmv.s.x v8, zero
; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV64-NEXT: vredsum.vs v8, v24, v8		; RV64-NEXT: vredsum.vs v8, v24, v8
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <32 x i32>, <32 x i32>* %x		%v = load <32 x i32>, <32 x i32>* %x
%e = sext <32 x i32> %v to <32 x i64>		%e = sext <32 x i32> %v to <32 x i64>
%red = call i64 @llvm.vector.reduce.add.v32i64(<32 x i64> %e)		%red = call i64 @llvm.vector.reduce.add.v32i64(<32 x i64> %e)
Show All 24 Lines
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: li a1, 32		; RV64-NEXT: li a1, 32
; RV64-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV64-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; RV64-NEXT: vle32.v v8, (a0)		; RV64-NEXT: vle32.v v8, (a0)
; RV64-NEXT: vsetivli zero, 16, e32, m8, ta, ma		; RV64-NEXT: vsetivli zero, 16, e32, m8, ta, ma
; RV64-NEXT: vslidedown.vi v16, v8, 16		; RV64-NEXT: vslidedown.vi v16, v8, 16
; RV64-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; RV64-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; RV64-NEXT: vwaddu.vv v24, v8, v16		; RV64-NEXT: vwaddu.vv v24, v8, v16
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m1, ta, ma
; RV64-NEXT: vmv.s.x v8, zero		; RV64-NEXT: vmv.s.x v8, zero
; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV64-NEXT: vredsum.vs v8, v24, v8		; RV64-NEXT: vredsum.vs v8, v24, v8
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <32 x i32>, <32 x i32>* %x		%v = load <32 x i32>, <32 x i32>* %x
%e = zext <32 x i32> %v to <32 x i64>		%e = zext <32 x i32> %v to <32 x i64>
%red = call i64 @llvm.vector.reduce.add.v32i64(<32 x i64> %e)		%red = call i64 @llvm.vector.reduce.add.v32i64(<32 x i64> %e)
▲ Show 20 Lines • Show All 345 Lines • ▼ Show 20 Lines

declare i8 @llvm.vector.reduce.and.v2i8(<2 x i8>)		declare i8 @llvm.vector.reduce.and.v2i8(<2 x i8>)

define i8 @vreduce_and_v2i8(<2 x i8>* %x) {		define i8 @vreduce_and_v2i8(<2 x i8>* %x) {
; CHECK-LABEL: vreduce_and_v2i8:		; CHECK-LABEL: vreduce_and_v2i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v9		; CHECK-NEXT: vredand.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x i8>, <2 x i8>* %x		%v = load <2 x i8>, <2 x i8>* %x
%red = call i8 @llvm.vector.reduce.and.v2i8(<2 x i8> %v)		%red = call i8 @llvm.vector.reduce.and.v2i8(<2 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.and.v4i8(<4 x i8>)		declare i8 @llvm.vector.reduce.and.v4i8(<4 x i8>)

define i8 @vreduce_and_v4i8(<4 x i8>* %x) {		define i8 @vreduce_and_v4i8(<4 x i8>* %x) {
; CHECK-LABEL: vreduce_and_v4i8:		; CHECK-LABEL: vreduce_and_v4i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v9		; CHECK-NEXT: vredand.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x i8>, <4 x i8>* %x		%v = load <4 x i8>, <4 x i8>* %x
%red = call i8 @llvm.vector.reduce.and.v4i8(<4 x i8> %v)		%red = call i8 @llvm.vector.reduce.and.v4i8(<4 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.and.v8i8(<8 x i8>)		declare i8 @llvm.vector.reduce.and.v8i8(<8 x i8>)

define i8 @vreduce_and_v8i8(<8 x i8>* %x) {		define i8 @vreduce_and_v8i8(<8 x i8>* %x) {
; CHECK-LABEL: vreduce_and_v8i8:		; CHECK-LABEL: vreduce_and_v8i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, mf2, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v9		; CHECK-NEXT: vredand.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <8 x i8>, <8 x i8>* %x		%v = load <8 x i8>, <8 x i8>* %x
%red = call i8 @llvm.vector.reduce.and.v8i8(<8 x i8> %v)		%red = call i8 @llvm.vector.reduce.and.v8i8(<8 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.and.v16i8(<16 x i8>)		declare i8 @llvm.vector.reduce.and.v16i8(<16 x i8>)

define i8 @vreduce_and_v16i8(<16 x i8>* %x) {		define i8 @vreduce_and_v16i8(<16 x i8>* %x) {
; CHECK-LABEL: vreduce_and_v16i8:		; CHECK-LABEL: vreduce_and_v16i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v9		; CHECK-NEXT: vredand.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <16 x i8>, <16 x i8>* %x		%v = load <16 x i8>, <16 x i8>* %x
%red = call i8 @llvm.vector.reduce.and.v16i8(<16 x i8> %v)		%red = call i8 @llvm.vector.reduce.and.v16i8(<16 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.and.v32i8(<32 x i8>)		declare i8 @llvm.vector.reduce.and.v32i8(<32 x i8>)

define i8 @vreduce_and_v32i8(<32 x i8>* %x) {		define i8 @vreduce_and_v32i8(<32 x i8>* %x) {
; CHECK-LABEL: vreduce_and_v32i8:		; CHECK-LABEL: vreduce_and_v32i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m1, ta, ma
; CHECK-NEXT: vmv.v.i v10, -1		; CHECK-NEXT: vmv.v.i v10, -1
; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v10		; CHECK-NEXT: vredand.vs v8, v8, v10
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i8>, <32 x i8>* %x		%v = load <32 x i8>, <32 x i8>* %x
%red = call i8 @llvm.vector.reduce.and.v32i8(<32 x i8> %v)		%red = call i8 @llvm.vector.reduce.and.v32i8(<32 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.and.v64i8(<64 x i8>)		declare i8 @llvm.vector.reduce.and.v64i8(<64 x i8>)

define i8 @vreduce_and_v64i8(<64 x i8>* %x) {		define i8 @vreduce_and_v64i8(<64 x i8>* %x) {
; CHECK-LABEL: vreduce_and_v64i8:		; CHECK-LABEL: vreduce_and_v64i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m1, ta, ma
; CHECK-NEXT: vmv.v.i v12, -1		; CHECK-NEXT: vmv.v.i v12, -1
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v12		; CHECK-NEXT: vredand.vs v8, v8, v12
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i8>, <64 x i8>* %x		%v = load <64 x i8>, <64 x i8>* %x
%red = call i8 @llvm.vector.reduce.and.v64i8(<64 x i8> %v)		%red = call i8 @llvm.vector.reduce.and.v64i8(<64 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.and.v128i8(<128 x i8>)		declare i8 @llvm.vector.reduce.and.v128i8(<128 x i8>)

define i8 @vreduce_and_v128i8(<128 x i8>* %x) {		define i8 @vreduce_and_v128i8(<128 x i8>* %x) {
; CHECK-LABEL: vreduce_and_v128i8:		; CHECK-LABEL: vreduce_and_v128i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 128		; CHECK-NEXT: li a1, 128
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m1, ta, ma
; CHECK-NEXT: vmv.v.i v16, -1		; CHECK-NEXT: vmv.v.i v16, -1
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v16		; CHECK-NEXT: vredand.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x i8>, <128 x i8>* %x		%v = load <128 x i8>, <128 x i8>* %x
%red = call i8 @llvm.vector.reduce.and.v128i8(<128 x i8> %v)		%red = call i8 @llvm.vector.reduce.and.v128i8(<128 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.and.v256i8(<256 x i8>)		declare i8 @llvm.vector.reduce.and.v256i8(<256 x i8>)

define i8 @vreduce_and_v256i8(<256 x i8>* %x) {		define i8 @vreduce_and_v256i8(<256 x i8>* %x) {
; CHECK-LABEL: vreduce_and_v256i8:		; CHECK-LABEL: vreduce_and_v256i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 128		; CHECK-NEXT: li a1, 128
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle8.v v16, (a0)		; CHECK-NEXT: vle8.v v16, (a0)
; CHECK-NEXT: vand.vv v8, v8, v16		; CHECK-NEXT: vand.vv v8, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m1, ta, ma
; CHECK-NEXT: vmv.v.i v16, -1		; CHECK-NEXT: vmv.v.i v16, -1
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v16		; CHECK-NEXT: vredand.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <256 x i8>, <256 x i8>* %x		%v = load <256 x i8>, <256 x i8>* %x
%red = call i8 @llvm.vector.reduce.and.v256i8(<256 x i8> %v)		%red = call i8 @llvm.vector.reduce.and.v256i8(<256 x i8> %v)
ret i8 %red		ret i8 %red
Show All 15 Lines

declare i16 @llvm.vector.reduce.and.v2i16(<2 x i16>)		declare i16 @llvm.vector.reduce.and.v2i16(<2 x i16>)

define i16 @vreduce_and_v2i16(<2 x i16>* %x) {		define i16 @vreduce_and_v2i16(<2 x i16>* %x) {
; CHECK-LABEL: vreduce_and_v2i16:		; CHECK-LABEL: vreduce_and_v2i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v9		; CHECK-NEXT: vredand.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x i16>, <2 x i16>* %x		%v = load <2 x i16>, <2 x i16>* %x
%red = call i16 @llvm.vector.reduce.and.v2i16(<2 x i16> %v)		%red = call i16 @llvm.vector.reduce.and.v2i16(<2 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.and.v4i16(<4 x i16>)		declare i16 @llvm.vector.reduce.and.v4i16(<4 x i16>)

define i16 @vreduce_and_v4i16(<4 x i16>* %x) {		define i16 @vreduce_and_v4i16(<4 x i16>* %x) {
; CHECK-LABEL: vreduce_and_v4i16:		; CHECK-LABEL: vreduce_and_v4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v9		; CHECK-NEXT: vredand.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x i16>, <4 x i16>* %x		%v = load <4 x i16>, <4 x i16>* %x
%red = call i16 @llvm.vector.reduce.and.v4i16(<4 x i16> %v)		%red = call i16 @llvm.vector.reduce.and.v4i16(<4 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.and.v8i16(<8 x i16>)		declare i16 @llvm.vector.reduce.and.v8i16(<8 x i16>)

define i16 @vreduce_and_v8i16(<8 x i16>* %x) {		define i16 @vreduce_and_v8i16(<8 x i16>* %x) {
; CHECK-LABEL: vreduce_and_v8i16:		; CHECK-LABEL: vreduce_and_v8i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v9		; CHECK-NEXT: vredand.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <8 x i16>, <8 x i16>* %x		%v = load <8 x i16>, <8 x i16>* %x
%red = call i16 @llvm.vector.reduce.and.v8i16(<8 x i16> %v)		%red = call i16 @llvm.vector.reduce.and.v8i16(<8 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.and.v16i16(<16 x i16>)		declare i16 @llvm.vector.reduce.and.v16i16(<16 x i16>)

define i16 @vreduce_and_v16i16(<16 x i16>* %x) {		define i16 @vreduce_and_v16i16(<16 x i16>* %x) {
; CHECK-LABEL: vreduce_and_v16i16:		; CHECK-LABEL: vreduce_and_v16i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e16, m1, ta, ma
; CHECK-NEXT: vmv.v.i v10, -1		; CHECK-NEXT: vmv.v.i v10, -1
; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v10		; CHECK-NEXT: vredand.vs v8, v8, v10
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <16 x i16>, <16 x i16>* %x		%v = load <16 x i16>, <16 x i16>* %x
%red = call i16 @llvm.vector.reduce.and.v16i16(<16 x i16> %v)		%red = call i16 @llvm.vector.reduce.and.v16i16(<16 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.and.v32i16(<32 x i16>)		declare i16 @llvm.vector.reduce.and.v32i16(<32 x i16>)

define i16 @vreduce_and_v32i16(<32 x i16>* %x) {		define i16 @vreduce_and_v32i16(<32 x i16>* %x) {
; CHECK-LABEL: vreduce_and_v32i16:		; CHECK-LABEL: vreduce_and_v32i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m1, ta, ma
; CHECK-NEXT: vmv.v.i v12, -1		; CHECK-NEXT: vmv.v.i v12, -1
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v12		; CHECK-NEXT: vredand.vs v8, v8, v12
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i16>, <32 x i16>* %x		%v = load <32 x i16>, <32 x i16>* %x
%red = call i16 @llvm.vector.reduce.and.v32i16(<32 x i16> %v)		%red = call i16 @llvm.vector.reduce.and.v32i16(<32 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.and.v64i16(<64 x i16>)		declare i16 @llvm.vector.reduce.and.v64i16(<64 x i16>)

define i16 @vreduce_and_v64i16(<64 x i16>* %x) {		define i16 @vreduce_and_v64i16(<64 x i16>* %x) {
; CHECK-LABEL: vreduce_and_v64i16:		; CHECK-LABEL: vreduce_and_v64i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m1, ta, ma
; CHECK-NEXT: vmv.v.i v16, -1		; CHECK-NEXT: vmv.v.i v16, -1
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v16		; CHECK-NEXT: vredand.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i16>, <64 x i16>* %x		%v = load <64 x i16>, <64 x i16>* %x
%red = call i16 @llvm.vector.reduce.and.v64i16(<64 x i16> %v)		%red = call i16 @llvm.vector.reduce.and.v64i16(<64 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.and.v128i16(<128 x i16>)		declare i16 @llvm.vector.reduce.and.v128i16(<128 x i16>)

define i16 @vreduce_and_v128i16(<128 x i16>* %x) {		define i16 @vreduce_and_v128i16(<128 x i16>* %x) {
; CHECK-LABEL: vreduce_and_v128i16:		; CHECK-LABEL: vreduce_and_v128i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle16.v v16, (a0)		; CHECK-NEXT: vle16.v v16, (a0)
; CHECK-NEXT: vand.vv v8, v8, v16		; CHECK-NEXT: vand.vv v8, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m1, ta, ma
; CHECK-NEXT: vmv.v.i v16, -1		; CHECK-NEXT: vmv.v.i v16, -1
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v16		; CHECK-NEXT: vredand.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x i16>, <128 x i16>* %x		%v = load <128 x i16>, <128 x i16>* %x
%red = call i16 @llvm.vector.reduce.and.v128i16(<128 x i16> %v)		%red = call i16 @llvm.vector.reduce.and.v128i16(<128 x i16> %v)
ret i16 %red		ret i16 %red
Show All 15 Lines

declare i32 @llvm.vector.reduce.and.v2i32(<2 x i32>)		declare i32 @llvm.vector.reduce.and.v2i32(<2 x i32>)

define i32 @vreduce_and_v2i32(<2 x i32>* %x) {		define i32 @vreduce_and_v2i32(<2 x i32>* %x) {
; CHECK-LABEL: vreduce_and_v2i32:		; CHECK-LABEL: vreduce_and_v2i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v9		; CHECK-NEXT: vredand.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x i32>, <2 x i32>* %x		%v = load <2 x i32>, <2 x i32>* %x
%red = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> %v)		%red = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.and.v4i32(<4 x i32>)		declare i32 @llvm.vector.reduce.and.v4i32(<4 x i32>)

define i32 @vreduce_and_v4i32(<4 x i32>* %x) {		define i32 @vreduce_and_v4i32(<4 x i32>* %x) {
; CHECK-LABEL: vreduce_and_v4i32:		; CHECK-LABEL: vreduce_and_v4i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v9		; CHECK-NEXT: vredand.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x i32>, <4 x i32>* %x		%v = load <4 x i32>, <4 x i32>* %x
%red = call i32 @llvm.vector.reduce.and.v4i32(<4 x i32> %v)		%red = call i32 @llvm.vector.reduce.and.v4i32(<4 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.and.v8i32(<8 x i32>)		declare i32 @llvm.vector.reduce.and.v8i32(<8 x i32>)

define i32 @vreduce_and_v8i32(<8 x i32>* %x) {		define i32 @vreduce_and_v8i32(<8 x i32>* %x) {
; CHECK-LABEL: vreduce_and_v8i32:		; CHECK-LABEL: vreduce_and_v8i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e32, m1, ta, ma
; CHECK-NEXT: vmv.v.i v10, -1		; CHECK-NEXT: vmv.v.i v10, -1
; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v10		; CHECK-NEXT: vredand.vs v8, v8, v10
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <8 x i32>, <8 x i32>* %x		%v = load <8 x i32>, <8 x i32>* %x
%red = call i32 @llvm.vector.reduce.and.v8i32(<8 x i32> %v)		%red = call i32 @llvm.vector.reduce.and.v8i32(<8 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.and.v16i32(<16 x i32>)		declare i32 @llvm.vector.reduce.and.v16i32(<16 x i32>)

define i32 @vreduce_and_v16i32(<16 x i32>* %x) {		define i32 @vreduce_and_v16i32(<16 x i32>* %x) {
; CHECK-LABEL: vreduce_and_v16i32:		; CHECK-LABEL: vreduce_and_v16i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e32, m1, ta, ma
; CHECK-NEXT: vmv.v.i v12, -1		; CHECK-NEXT: vmv.v.i v12, -1
; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v12		; CHECK-NEXT: vredand.vs v8, v8, v12
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <16 x i32>, <16 x i32>* %x		%v = load <16 x i32>, <16 x i32>* %x
%red = call i32 @llvm.vector.reduce.and.v16i32(<16 x i32> %v)		%red = call i32 @llvm.vector.reduce.and.v16i32(<16 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.and.v32i32(<32 x i32>)		declare i32 @llvm.vector.reduce.and.v32i32(<32 x i32>)

define i32 @vreduce_and_v32i32(<32 x i32>* %x) {		define i32 @vreduce_and_v32i32(<32 x i32>* %x) {
; CHECK-LABEL: vreduce_and_v32i32:		; CHECK-LABEL: vreduce_and_v32i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
; CHECK-NEXT: vmv.v.i v16, -1		; CHECK-NEXT: vmv.v.i v16, -1
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v16		; CHECK-NEXT: vredand.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i32>, <32 x i32>* %x		%v = load <32 x i32>, <32 x i32>* %x
%red = call i32 @llvm.vector.reduce.and.v32i32(<32 x i32> %v)		%red = call i32 @llvm.vector.reduce.and.v32i32(<32 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.and.v64i32(<64 x i32>)		declare i32 @llvm.vector.reduce.and.v64i32(<64 x i32>)

define i32 @vreduce_and_v64i32(<64 x i32>* %x) {		define i32 @vreduce_and_v64i32(<64 x i32>* %x) {
; CHECK-LABEL: vreduce_and_v64i32:		; CHECK-LABEL: vreduce_and_v64i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle32.v v16, (a0)		; CHECK-NEXT: vle32.v v16, (a0)
; CHECK-NEXT: vand.vv v8, v8, v16		; CHECK-NEXT: vand.vv v8, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
; CHECK-NEXT: vmv.v.i v16, -1		; CHECK-NEXT: vmv.v.i v16, -1
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vredand.vs v8, v8, v16		; CHECK-NEXT: vredand.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i32>, <64 x i32>* %x		%v = load <64 x i32>, <64 x i32>* %x
%red = call i32 @llvm.vector.reduce.and.v64i32(<64 x i32> %v)		%red = call i32 @llvm.vector.reduce.and.v64i32(<64 x i32> %v)
ret i32 %red		ret i32 %red
Show All 40 Lines
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_and_v2i64:		; RV64-LABEL: vreduce_and_v2i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; RV64-NEXT: vle64.v v8, (a0)		; RV64-NEXT: vle64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vmv.v.i v9, -1		; RV64-NEXT: vmv.v.i v9, -1
; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; RV64-NEXT: vredand.vs v8, v8, v9		; RV64-NEXT: vredand.vs v8, v8, v9
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <2 x i64>, <2 x i64>* %x		%v = load <2 x i64>, <2 x i64>* %x
%red = call i64 @llvm.vector.reduce.and.v2i64(<2 x i64> %v)		%red = call i64 @llvm.vector.reduce.and.v2i64(<2 x i64> %v)
ret i64 %red		ret i64 %red
}		}

Show All 14 Lines
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_and_v4i64:		; RV64-LABEL: vreduce_and_v4i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; RV64-NEXT: vle64.v v8, (a0)		; RV64-NEXT: vle64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 4, e64, m1, ta, ma
; RV64-NEXT: vmv.v.i v10, -1		; RV64-NEXT: vmv.v.i v10, -1
; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; RV64-NEXT: vredand.vs v8, v8, v10		; RV64-NEXT: vredand.vs v8, v8, v10
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <4 x i64>, <4 x i64>* %x		%v = load <4 x i64>, <4 x i64>* %x
%red = call i64 @llvm.vector.reduce.and.v4i64(<4 x i64> %v)		%red = call i64 @llvm.vector.reduce.and.v4i64(<4 x i64> %v)
ret i64 %red		ret i64 %red
Show All 16 Lines
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_and_v8i64:		; RV64-LABEL: vreduce_and_v8i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; RV64-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; RV64-NEXT: vle64.v v8, (a0)		; RV64-NEXT: vle64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 8, e64, m1, ta, ma
; RV64-NEXT: vmv.v.i v12, -1		; RV64-NEXT: vmv.v.i v12, -1
; RV64-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; RV64-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; RV64-NEXT: vredand.vs v8, v8, v12		; RV64-NEXT: vredand.vs v8, v8, v12
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <8 x i64>, <8 x i64>* %x		%v = load <8 x i64>, <8 x i64>* %x
%red = call i64 @llvm.vector.reduce.and.v8i64(<8 x i64> %v)		%red = call i64 @llvm.vector.reduce.and.v8i64(<8 x i64> %v)
ret i64 %red		ret i64 %red
Show All 16 Lines
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_and_v16i64:		; RV64-LABEL: vreduce_and_v16i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV64-NEXT: vle64.v v8, (a0)		; RV64-NEXT: vle64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m1, ta, ma
; RV64-NEXT: vmv.v.i v16, -1		; RV64-NEXT: vmv.v.i v16, -1
; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV64-NEXT: vredand.vs v8, v8, v16		; RV64-NEXT: vredand.vs v8, v8, v16
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <16 x i64>, <16 x i64>* %x		%v = load <16 x i64>, <16 x i64>* %x
%red = call i64 @llvm.vector.reduce.and.v16i64(<16 x i64> %v)		%red = call i64 @llvm.vector.reduce.and.v16i64(<16 x i64> %v)
ret i64 %red		ret i64 %red
Show All 22 Lines
;		;
; RV64-LABEL: vreduce_and_v32i64:		; RV64-LABEL: vreduce_and_v32i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV64-NEXT: vle64.v v8, (a0)		; RV64-NEXT: vle64.v v8, (a0)
; RV64-NEXT: addi a0, a0, 128		; RV64-NEXT: addi a0, a0, 128
; RV64-NEXT: vle64.v v16, (a0)		; RV64-NEXT: vle64.v v16, (a0)
; RV64-NEXT: vand.vv v8, v8, v16		; RV64-NEXT: vand.vv v8, v8, v16
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m1, ta, ma
; RV64-NEXT: vmv.v.i v16, -1		; RV64-NEXT: vmv.v.i v16, -1
; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV64-NEXT: vredand.vs v8, v8, v16		; RV64-NEXT: vredand.vs v8, v8, v16
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <32 x i64>, <32 x i64>* %x		%v = load <32 x i64>, <32 x i64>* %x
%red = call i64 @llvm.vector.reduce.and.v32i64(<32 x i64> %v)		%red = call i64 @llvm.vector.reduce.and.v32i64(<32 x i64> %v)
ret i64 %red		ret i64 %red
Show All 34 Lines
; RV64-NEXT: vle64.v v16, (a1)		; RV64-NEXT: vle64.v v16, (a1)
; RV64-NEXT: addi a1, a0, 256		; RV64-NEXT: addi a1, a0, 256
; RV64-NEXT: addi a0, a0, 128		; RV64-NEXT: addi a0, a0, 128
; RV64-NEXT: vle64.v v24, (a0)		; RV64-NEXT: vle64.v v24, (a0)
; RV64-NEXT: vle64.v v0, (a1)		; RV64-NEXT: vle64.v v0, (a1)
; RV64-NEXT: vand.vv v16, v24, v16		; RV64-NEXT: vand.vv v16, v24, v16
; RV64-NEXT: vand.vv v8, v8, v0		; RV64-NEXT: vand.vv v8, v8, v0
; RV64-NEXT: vand.vv v8, v8, v16		; RV64-NEXT: vand.vv v8, v8, v16
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m1, ta, ma
; RV64-NEXT: vmv.v.i v16, -1		; RV64-NEXT: vmv.v.i v16, -1
; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV64-NEXT: vredand.vs v8, v8, v16		; RV64-NEXT: vredand.vs v8, v8, v16
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <64 x i64>, <64 x i64>* %x		%v = load <64 x i64>, <64 x i64>* %x
%red = call i64 @llvm.vector.reduce.and.v64i64(<64 x i64> %v)		%red = call i64 @llvm.vector.reduce.and.v64i64(<64 x i64> %v)
ret i64 %red		ret i64 %red
▲ Show 20 Lines • Show All 80 Lines • ▼ Show 20 Lines
declare i8 @llvm.vector.reduce.or.v32i8(<32 x i8>)		declare i8 @llvm.vector.reduce.or.v32i8(<32 x i8>)

define i8 @vreduce_or_v32i8(<32 x i8>* %x) {		define i8 @vreduce_or_v32i8(<32 x i8>* %x) {
; CHECK-LABEL: vreduce_or_v32i8:		; CHECK-LABEL: vreduce_or_v32i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v10, zero		; CHECK-NEXT: vmv.s.x v10, zero
; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma
; CHECK-NEXT: vredor.vs v8, v8, v10		; CHECK-NEXT: vredor.vs v8, v8, v10
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i8>, <32 x i8>* %x		%v = load <32 x i8>, <32 x i8>* %x
%red = call i8 @llvm.vector.reduce.or.v32i8(<32 x i8> %v)		%red = call i8 @llvm.vector.reduce.or.v32i8(<32 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.or.v64i8(<64 x i8>)		declare i8 @llvm.vector.reduce.or.v64i8(<64 x i8>)

define i8 @vreduce_or_v64i8(<64 x i8>* %x) {		define i8 @vreduce_or_v64i8(<64 x i8>* %x) {
; CHECK-LABEL: vreduce_or_v64i8:		; CHECK-LABEL: vreduce_or_v64i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v12, zero		; CHECK-NEXT: vmv.s.x v12, zero
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vredor.vs v8, v8, v12		; CHECK-NEXT: vredor.vs v8, v8, v12
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i8>, <64 x i8>* %x		%v = load <64 x i8>, <64 x i8>* %x
%red = call i8 @llvm.vector.reduce.or.v64i8(<64 x i8> %v)		%red = call i8 @llvm.vector.reduce.or.v64i8(<64 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.or.v128i8(<128 x i8>)		declare i8 @llvm.vector.reduce.or.v128i8(<128 x i8>)

define i8 @vreduce_or_v128i8(<128 x i8>* %x) {		define i8 @vreduce_or_v128i8(<128 x i8>* %x) {
; CHECK-LABEL: vreduce_or_v128i8:		; CHECK-LABEL: vreduce_or_v128i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 128		; CHECK-NEXT: li a1, 128
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v16, zero		; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vredor.vs v8, v8, v16		; CHECK-NEXT: vredor.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x i8>, <128 x i8>* %x		%v = load <128 x i8>, <128 x i8>* %x
%red = call i8 @llvm.vector.reduce.or.v128i8(<128 x i8> %v)		%red = call i8 @llvm.vector.reduce.or.v128i8(<128 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.or.v256i8(<256 x i8>)		declare i8 @llvm.vector.reduce.or.v256i8(<256 x i8>)

define i8 @vreduce_or_v256i8(<256 x i8>* %x) {		define i8 @vreduce_or_v256i8(<256 x i8>* %x) {
; CHECK-LABEL: vreduce_or_v256i8:		; CHECK-LABEL: vreduce_or_v256i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 128		; CHECK-NEXT: li a1, 128
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle8.v v16, (a0)		; CHECK-NEXT: vle8.v v16, (a0)
		; CHECK-NEXT: vmv.s.x v24, zero
; CHECK-NEXT: vor.vv v8, v8, v16		; CHECK-NEXT: vor.vv v8, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma		; CHECK-NEXT: vredor.vs v8, v8, v24
; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vredor.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <256 x i8>, <256 x i8>* %x		%v = load <256 x i8>, <256 x i8>* %x
%red = call i8 @llvm.vector.reduce.or.v256i8(<256 x i8> %v)		%red = call i8 @llvm.vector.reduce.or.v256i8(<256 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i16 @llvm.vector.reduce.or.v1i16(<1 x i16>)		declare i16 @llvm.vector.reduce.or.v1i16(<1 x i16>)
▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
declare i16 @llvm.vector.reduce.or.v32i16(<32 x i16>)		declare i16 @llvm.vector.reduce.or.v32i16(<32 x i16>)

define i16 @vreduce_or_v32i16(<32 x i16>* %x) {		define i16 @vreduce_or_v32i16(<32 x i16>* %x) {
; CHECK-LABEL: vreduce_or_v32i16:		; CHECK-LABEL: vreduce_or_v32i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v12, zero		; CHECK-NEXT: vmv.s.x v12, zero
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vredor.vs v8, v8, v12		; CHECK-NEXT: vredor.vs v8, v8, v12
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i16>, <32 x i16>* %x		%v = load <32 x i16>, <32 x i16>* %x
%red = call i16 @llvm.vector.reduce.or.v32i16(<32 x i16> %v)		%red = call i16 @llvm.vector.reduce.or.v32i16(<32 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.or.v64i16(<64 x i16>)		declare i16 @llvm.vector.reduce.or.v64i16(<64 x i16>)

define i16 @vreduce_or_v64i16(<64 x i16>* %x) {		define i16 @vreduce_or_v64i16(<64 x i16>* %x) {
; CHECK-LABEL: vreduce_or_v64i16:		; CHECK-LABEL: vreduce_or_v64i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v16, zero		; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vredor.vs v8, v8, v16		; CHECK-NEXT: vredor.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i16>, <64 x i16>* %x		%v = load <64 x i16>, <64 x i16>* %x
%red = call i16 @llvm.vector.reduce.or.v64i16(<64 x i16> %v)		%red = call i16 @llvm.vector.reduce.or.v64i16(<64 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.or.v128i16(<128 x i16>)		declare i16 @llvm.vector.reduce.or.v128i16(<128 x i16>)

define i16 @vreduce_or_v128i16(<128 x i16>* %x) {		define i16 @vreduce_or_v128i16(<128 x i16>* %x) {
; CHECK-LABEL: vreduce_or_v128i16:		; CHECK-LABEL: vreduce_or_v128i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle16.v v16, (a0)		; CHECK-NEXT: vle16.v v16, (a0)
		; CHECK-NEXT: vmv.s.x v24, zero
; CHECK-NEXT: vor.vv v8, v8, v16		; CHECK-NEXT: vor.vv v8, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vredor.vs v8, v8, v24
; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vredor.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x i16>, <128 x i16>* %x		%v = load <128 x i16>, <128 x i16>* %x
%red = call i16 @llvm.vector.reduce.or.v128i16(<128 x i16> %v)		%red = call i16 @llvm.vector.reduce.or.v128i16(<128 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i32 @llvm.vector.reduce.or.v1i32(<1 x i32>)		declare i32 @llvm.vector.reduce.or.v1i32(<1 x i32>)
▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
declare i32 @llvm.vector.reduce.or.v32i32(<32 x i32>)		declare i32 @llvm.vector.reduce.or.v32i32(<32 x i32>)

define i32 @vreduce_or_v32i32(<32 x i32>* %x) {		define i32 @vreduce_or_v32i32(<32 x i32>* %x) {
; CHECK-LABEL: vreduce_or_v32i32:		; CHECK-LABEL: vreduce_or_v32i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v16, zero		; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vredor.vs v8, v8, v16		; CHECK-NEXT: vredor.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i32>, <32 x i32>* %x		%v = load <32 x i32>, <32 x i32>* %x
%red = call i32 @llvm.vector.reduce.or.v32i32(<32 x i32> %v)		%red = call i32 @llvm.vector.reduce.or.v32i32(<32 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.or.v64i32(<64 x i32>)		declare i32 @llvm.vector.reduce.or.v64i32(<64 x i32>)

define i32 @vreduce_or_v64i32(<64 x i32>* %x) {		define i32 @vreduce_or_v64i32(<64 x i32>* %x) {
; CHECK-LABEL: vreduce_or_v64i32:		; CHECK-LABEL: vreduce_or_v64i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle32.v v16, (a0)		; CHECK-NEXT: vle32.v v16, (a0)
		; CHECK-NEXT: vmv.s.x v24, zero
; CHECK-NEXT: vor.vv v8, v8, v16		; CHECK-NEXT: vor.vv v8, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vredor.vs v8, v8, v24
; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vredor.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i32>, <64 x i32>* %x		%v = load <64 x i32>, <64 x i32>* %x
%red = call i32 @llvm.vector.reduce.or.v64i32(<64 x i32> %v)		%red = call i32 @llvm.vector.reduce.or.v64i32(<64 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i64 @llvm.vector.reduce.or.v1i64(<1 x i64>)		declare i64 @llvm.vector.reduce.or.v1i64(<1 x i64>)
▲ Show 20 Lines • Show All 299 Lines • ▼ Show 20 Lines
declare i8 @llvm.vector.reduce.xor.v32i8(<32 x i8>)		declare i8 @llvm.vector.reduce.xor.v32i8(<32 x i8>)

define i8 @vreduce_xor_v32i8(<32 x i8>* %x) {		define i8 @vreduce_xor_v32i8(<32 x i8>* %x) {
; CHECK-LABEL: vreduce_xor_v32i8:		; CHECK-LABEL: vreduce_xor_v32i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v10, zero		; CHECK-NEXT: vmv.s.x v10, zero
; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma
; CHECK-NEXT: vredxor.vs v8, v8, v10		; CHECK-NEXT: vredxor.vs v8, v8, v10
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i8>, <32 x i8>* %x		%v = load <32 x i8>, <32 x i8>* %x
%red = call i8 @llvm.vector.reduce.xor.v32i8(<32 x i8> %v)		%red = call i8 @llvm.vector.reduce.xor.v32i8(<32 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.xor.v64i8(<64 x i8>)		declare i8 @llvm.vector.reduce.xor.v64i8(<64 x i8>)

define i8 @vreduce_xor_v64i8(<64 x i8>* %x) {		define i8 @vreduce_xor_v64i8(<64 x i8>* %x) {
; CHECK-LABEL: vreduce_xor_v64i8:		; CHECK-LABEL: vreduce_xor_v64i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v12, zero		; CHECK-NEXT: vmv.s.x v12, zero
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vredxor.vs v8, v8, v12		; CHECK-NEXT: vredxor.vs v8, v8, v12
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i8>, <64 x i8>* %x		%v = load <64 x i8>, <64 x i8>* %x
%red = call i8 @llvm.vector.reduce.xor.v64i8(<64 x i8> %v)		%red = call i8 @llvm.vector.reduce.xor.v64i8(<64 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.xor.v128i8(<128 x i8>)		declare i8 @llvm.vector.reduce.xor.v128i8(<128 x i8>)

define i8 @vreduce_xor_v128i8(<128 x i8>* %x) {		define i8 @vreduce_xor_v128i8(<128 x i8>* %x) {
; CHECK-LABEL: vreduce_xor_v128i8:		; CHECK-LABEL: vreduce_xor_v128i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 128		; CHECK-NEXT: li a1, 128
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v16, zero		; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vredxor.vs v8, v8, v16		; CHECK-NEXT: vredxor.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x i8>, <128 x i8>* %x		%v = load <128 x i8>, <128 x i8>* %x
%red = call i8 @llvm.vector.reduce.xor.v128i8(<128 x i8> %v)		%red = call i8 @llvm.vector.reduce.xor.v128i8(<128 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.xor.v256i8(<256 x i8>)		declare i8 @llvm.vector.reduce.xor.v256i8(<256 x i8>)

define i8 @vreduce_xor_v256i8(<256 x i8>* %x) {		define i8 @vreduce_xor_v256i8(<256 x i8>* %x) {
; CHECK-LABEL: vreduce_xor_v256i8:		; CHECK-LABEL: vreduce_xor_v256i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 128		; CHECK-NEXT: li a1, 128
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle8.v v16, (a0)		; CHECK-NEXT: vle8.v v16, (a0)
		; CHECK-NEXT: vmv.s.x v24, zero
; CHECK-NEXT: vxor.vv v8, v8, v16		; CHECK-NEXT: vxor.vv v8, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma		; CHECK-NEXT: vredxor.vs v8, v8, v24
; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vredxor.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <256 x i8>, <256 x i8>* %x		%v = load <256 x i8>, <256 x i8>* %x
%red = call i8 @llvm.vector.reduce.xor.v256i8(<256 x i8> %v)		%red = call i8 @llvm.vector.reduce.xor.v256i8(<256 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i16 @llvm.vector.reduce.xor.v1i16(<1 x i16>)		declare i16 @llvm.vector.reduce.xor.v1i16(<1 x i16>)
▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
declare i16 @llvm.vector.reduce.xor.v32i16(<32 x i16>)		declare i16 @llvm.vector.reduce.xor.v32i16(<32 x i16>)

define i16 @vreduce_xor_v32i16(<32 x i16>* %x) {		define i16 @vreduce_xor_v32i16(<32 x i16>* %x) {
; CHECK-LABEL: vreduce_xor_v32i16:		; CHECK-LABEL: vreduce_xor_v32i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v12, zero		; CHECK-NEXT: vmv.s.x v12, zero
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vredxor.vs v8, v8, v12		; CHECK-NEXT: vredxor.vs v8, v8, v12
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i16>, <32 x i16>* %x		%v = load <32 x i16>, <32 x i16>* %x
%red = call i16 @llvm.vector.reduce.xor.v32i16(<32 x i16> %v)		%red = call i16 @llvm.vector.reduce.xor.v32i16(<32 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.xor.v64i16(<64 x i16>)		declare i16 @llvm.vector.reduce.xor.v64i16(<64 x i16>)

define i16 @vreduce_xor_v64i16(<64 x i16>* %x) {		define i16 @vreduce_xor_v64i16(<64 x i16>* %x) {
; CHECK-LABEL: vreduce_xor_v64i16:		; CHECK-LABEL: vreduce_xor_v64i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v16, zero		; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vredxor.vs v8, v8, v16		; CHECK-NEXT: vredxor.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i16>, <64 x i16>* %x		%v = load <64 x i16>, <64 x i16>* %x
%red = call i16 @llvm.vector.reduce.xor.v64i16(<64 x i16> %v)		%red = call i16 @llvm.vector.reduce.xor.v64i16(<64 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.xor.v128i16(<128 x i16>)		declare i16 @llvm.vector.reduce.xor.v128i16(<128 x i16>)

define i16 @vreduce_xor_v128i16(<128 x i16>* %x) {		define i16 @vreduce_xor_v128i16(<128 x i16>* %x) {
; CHECK-LABEL: vreduce_xor_v128i16:		; CHECK-LABEL: vreduce_xor_v128i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle16.v v16, (a0)		; CHECK-NEXT: vle16.v v16, (a0)
		; CHECK-NEXT: vmv.s.x v24, zero
; CHECK-NEXT: vxor.vv v8, v8, v16		; CHECK-NEXT: vxor.vv v8, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vredxor.vs v8, v8, v24
; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vredxor.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x i16>, <128 x i16>* %x		%v = load <128 x i16>, <128 x i16>* %x
%red = call i16 @llvm.vector.reduce.xor.v128i16(<128 x i16> %v)		%red = call i16 @llvm.vector.reduce.xor.v128i16(<128 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i32 @llvm.vector.reduce.xor.v1i32(<1 x i32>)		declare i32 @llvm.vector.reduce.xor.v1i32(<1 x i32>)
▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
declare i32 @llvm.vector.reduce.xor.v32i32(<32 x i32>)		declare i32 @llvm.vector.reduce.xor.v32i32(<32 x i32>)

define i32 @vreduce_xor_v32i32(<32 x i32>* %x) {		define i32 @vreduce_xor_v32i32(<32 x i32>* %x) {
; CHECK-LABEL: vreduce_xor_v32i32:		; CHECK-LABEL: vreduce_xor_v32i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v16, zero		; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vredxor.vs v8, v8, v16		; CHECK-NEXT: vredxor.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i32>, <32 x i32>* %x		%v = load <32 x i32>, <32 x i32>* %x
%red = call i32 @llvm.vector.reduce.xor.v32i32(<32 x i32> %v)		%red = call i32 @llvm.vector.reduce.xor.v32i32(<32 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.xor.v64i32(<64 x i32>)		declare i32 @llvm.vector.reduce.xor.v64i32(<64 x i32>)

define i32 @vreduce_xor_v64i32(<64 x i32>* %x) {		define i32 @vreduce_xor_v64i32(<64 x i32>* %x) {
; CHECK-LABEL: vreduce_xor_v64i32:		; CHECK-LABEL: vreduce_xor_v64i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle32.v v16, (a0)		; CHECK-NEXT: vle32.v v16, (a0)
		; CHECK-NEXT: vmv.s.x v24, zero
; CHECK-NEXT: vxor.vv v8, v8, v16		; CHECK-NEXT: vxor.vv v8, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vredxor.vs v8, v8, v24
; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vredxor.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i32>, <64 x i32>* %x		%v = load <64 x i32>, <64 x i32>* %x
%red = call i32 @llvm.vector.reduce.xor.v64i32(<64 x i32> %v)		%red = call i32 @llvm.vector.reduce.xor.v64i32(<64 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i64 @llvm.vector.reduce.xor.v1i64(<1 x i64>)		declare i64 @llvm.vector.reduce.xor.v1i64(<1 x i64>)
▲ Show 20 Lines • Show All 304 Lines • ▼ Show 20 Lines

define i8 @vreduce_smin_v32i8(<32 x i8>* %x) {		define i8 @vreduce_smin_v32i8(<32 x i8>* %x) {
; CHECK-LABEL: vreduce_smin_v32i8:		; CHECK-LABEL: vreduce_smin_v32i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: li a0, 127		; CHECK-NEXT: li a0, 127
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v10, a0		; CHECK-NEXT: vmv.s.x v10, a0
; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma
; CHECK-NEXT: vredmin.vs v8, v8, v10		; CHECK-NEXT: vredmin.vs v8, v8, v10
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i8>, <32 x i8>* %x		%v = load <32 x i8>, <32 x i8>* %x
%red = call i8 @llvm.vector.reduce.smin.v32i8(<32 x i8> %v)		%red = call i8 @llvm.vector.reduce.smin.v32i8(<32 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.smin.v64i8(<64 x i8>)		declare i8 @llvm.vector.reduce.smin.v64i8(<64 x i8>)

define i8 @vreduce_smin_v64i8(<64 x i8>* %x) {		define i8 @vreduce_smin_v64i8(<64 x i8>* %x) {
; CHECK-LABEL: vreduce_smin_v64i8:		; CHECK-LABEL: vreduce_smin_v64i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: li a0, 127		; CHECK-NEXT: li a0, 127
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v12, a0		; CHECK-NEXT: vmv.s.x v12, a0
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vredmin.vs v8, v8, v12		; CHECK-NEXT: vredmin.vs v8, v8, v12
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i8>, <64 x i8>* %x		%v = load <64 x i8>, <64 x i8>* %x
%red = call i8 @llvm.vector.reduce.smin.v64i8(<64 x i8> %v)		%red = call i8 @llvm.vector.reduce.smin.v64i8(<64 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.smin.v128i8(<128 x i8>)		declare i8 @llvm.vector.reduce.smin.v128i8(<128 x i8>)

define i8 @vreduce_smin_v128i8(<128 x i8>* %x) {		define i8 @vreduce_smin_v128i8(<128 x i8>* %x) {
; CHECK-LABEL: vreduce_smin_v128i8:		; CHECK-LABEL: vreduce_smin_v128i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 128		; CHECK-NEXT: li a1, 128
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: li a0, 127		; CHECK-NEXT: li a0, 127
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v16, a0		; CHECK-NEXT: vmv.s.x v16, a0
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vredmin.vs v8, v8, v16		; CHECK-NEXT: vredmin.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x i8>, <128 x i8>* %x		%v = load <128 x i8>, <128 x i8>* %x
%red = call i8 @llvm.vector.reduce.smin.v128i8(<128 x i8> %v)		%red = call i8 @llvm.vector.reduce.smin.v128i8(<128 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.smin.v256i8(<256 x i8>)		declare i8 @llvm.vector.reduce.smin.v256i8(<256 x i8>)

define i8 @vreduce_smin_v256i8(<256 x i8>* %x) {		define i8 @vreduce_smin_v256i8(<256 x i8>* %x) {
; CHECK-LABEL: vreduce_smin_v256i8:		; CHECK-LABEL: vreduce_smin_v256i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 128		; CHECK-NEXT: li a1, 128
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle8.v v16, (a0)		; CHECK-NEXT: vle8.v v16, (a0)
; CHECK-NEXT: vmin.vv v8, v8, v16
; CHECK-NEXT: li a0, 127		; CHECK-NEXT: li a0, 127
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma		; CHECK-NEXT: vmv.s.x v24, a0
; CHECK-NEXT: vmv.s.x v16, a0		; CHECK-NEXT: vmin.vv v8, v8, v16
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vredmin.vs v8, v8, v24
; CHECK-NEXT: vredmin.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <256 x i8>, <256 x i8>* %x		%v = load <256 x i8>, <256 x i8>* %x
%red = call i8 @llvm.vector.reduce.smin.v256i8(<256 x i8> %v)		%red = call i8 @llvm.vector.reduce.smin.v256i8(<256 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i16 @llvm.vector.reduce.smin.v1i16(<1 x i16>)		declare i16 @llvm.vector.reduce.smin.v1i16(<1 x i16>)
▲ Show 20 Lines • Show All 131 Lines • ▼ Show 20 Lines
define i16 @vreduce_smin_v32i16(<32 x i16>* %x) {		define i16 @vreduce_smin_v32i16(<32 x i16>* %x) {
; RV32-LABEL: vreduce_smin_v32i16:		; RV32-LABEL: vreduce_smin_v32i16:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 32		; RV32-NEXT: li a1, 32
; RV32-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; RV32-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; RV32-NEXT: vle16.v v8, (a0)
; RV32-NEXT: lui a0, 8		; RV32-NEXT: lui a0, 8
; RV32-NEXT: addi a0, a0, -1		; RV32-NEXT: addi a0, a0, -1
; RV32-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; RV32-NEXT: vmv.s.x v12, a0		; RV32-NEXT: vmv.s.x v12, a0
; RV32-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; RV32-NEXT: vredmin.vs v8, v8, v12		; RV32-NEXT: vredmin.vs v8, v8, v12
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_smin_v32i16:		; RV64-LABEL: vreduce_smin_v32i16:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: li a1, 32		; RV64-NEXT: li a1, 32
; RV64-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; RV64-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; RV64-NEXT: vle16.v v8, (a0)		; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: lui a0, 8		; RV64-NEXT: lui a0, 8
; RV64-NEXT: addiw a0, a0, -1		; RV64-NEXT: addiw a0, a0, -1
; RV64-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; RV64-NEXT: vmv.s.x v12, a0		; RV64-NEXT: vmv.s.x v12, a0
; RV64-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; RV64-NEXT: vredmin.vs v8, v8, v12		; RV64-NEXT: vredmin.vs v8, v8, v12
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <32 x i16>, <32 x i16>* %x		%v = load <32 x i16>, <32 x i16>* %x
%red = call i16 @llvm.vector.reduce.smin.v32i16(<32 x i16> %v)		%red = call i16 @llvm.vector.reduce.smin.v32i16(<32 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.smin.v64i16(<64 x i16>)		declare i16 @llvm.vector.reduce.smin.v64i16(<64 x i16>)

define i16 @vreduce_smin_v64i16(<64 x i16>* %x) {		define i16 @vreduce_smin_v64i16(<64 x i16>* %x) {
; RV32-LABEL: vreduce_smin_v64i16:		; RV32-LABEL: vreduce_smin_v64i16:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 64		; RV32-NEXT: li a1, 64
; RV32-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; RV32-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; RV32-NEXT: vle16.v v8, (a0)
; RV32-NEXT: lui a0, 8		; RV32-NEXT: lui a0, 8
; RV32-NEXT: addi a0, a0, -1		; RV32-NEXT: addi a0, a0, -1
; RV32-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; RV32-NEXT: vmv.s.x v16, a0		; RV32-NEXT: vmv.s.x v16, a0
; RV32-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; RV32-NEXT: vredmin.vs v8, v8, v16		; RV32-NEXT: vredmin.vs v8, v8, v16
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_smin_v64i16:		; RV64-LABEL: vreduce_smin_v64i16:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: li a1, 64		; RV64-NEXT: li a1, 64
; RV64-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; RV64-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; RV64-NEXT: vle16.v v8, (a0)		; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: lui a0, 8		; RV64-NEXT: lui a0, 8
; RV64-NEXT: addiw a0, a0, -1		; RV64-NEXT: addiw a0, a0, -1
; RV64-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; RV64-NEXT: vmv.s.x v16, a0		; RV64-NEXT: vmv.s.x v16, a0
; RV64-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; RV64-NEXT: vredmin.vs v8, v8, v16		; RV64-NEXT: vredmin.vs v8, v8, v16
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <64 x i16>, <64 x i16>* %x		%v = load <64 x i16>, <64 x i16>* %x
%red = call i16 @llvm.vector.reduce.smin.v64i16(<64 x i16> %v)		%red = call i16 @llvm.vector.reduce.smin.v64i16(<64 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.smin.v128i16(<128 x i16>)		declare i16 @llvm.vector.reduce.smin.v128i16(<128 x i16>)

define i16 @vreduce_smin_v128i16(<128 x i16>* %x) {		define i16 @vreduce_smin_v128i16(<128 x i16>* %x) {
; RV32-LABEL: vreduce_smin_v128i16:		; RV32-LABEL: vreduce_smin_v128i16:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 64		; RV32-NEXT: li a1, 64
; RV32-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; RV32-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; RV32-NEXT: vle16.v v8, (a0)
; RV32-NEXT: addi a0, a0, 128		; RV32-NEXT: addi a0, a0, 128
; RV32-NEXT: vle16.v v16, (a0)		; RV32-NEXT: vle16.v v16, (a0)
; RV32-NEXT: vmin.vv v8, v8, v16
; RV32-NEXT: lui a0, 8		; RV32-NEXT: lui a0, 8
; RV32-NEXT: addi a0, a0, -1		; RV32-NEXT: addi a0, a0, -1
; RV32-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; RV32-NEXT: vmv.s.x v24, a0
; RV32-NEXT: vmv.s.x v16, a0		; RV32-NEXT: vmin.vv v8, v8, v16
; RV32-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; RV32-NEXT: vredmin.vs v8, v8, v24
; RV32-NEXT: vredmin.vs v8, v8, v16
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_smin_v128i16:		; RV64-LABEL: vreduce_smin_v128i16:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: li a1, 64		; RV64-NEXT: li a1, 64
; RV64-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; RV64-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; RV64-NEXT: vle16.v v8, (a0)		; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: addi a0, a0, 128		; RV64-NEXT: addi a0, a0, 128
; RV64-NEXT: vle16.v v16, (a0)		; RV64-NEXT: vle16.v v16, (a0)
; RV64-NEXT: vmin.vv v8, v8, v16
; RV64-NEXT: lui a0, 8		; RV64-NEXT: lui a0, 8
; RV64-NEXT: addiw a0, a0, -1		; RV64-NEXT: addiw a0, a0, -1
; RV64-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; RV64-NEXT: vmv.s.x v24, a0
; RV64-NEXT: vmv.s.x v16, a0		; RV64-NEXT: vmin.vv v8, v8, v16
; RV64-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; RV64-NEXT: vredmin.vs v8, v8, v24
; RV64-NEXT: vredmin.vs v8, v8, v16
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <128 x i16>, <128 x i16>* %x		%v = load <128 x i16>, <128 x i16>* %x
%red = call i16 @llvm.vector.reduce.smin.v128i16(<128 x i16> %v)		%red = call i16 @llvm.vector.reduce.smin.v128i16(<128 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i32 @llvm.vector.reduce.smin.v1i32(<1 x i32>)		declare i32 @llvm.vector.reduce.smin.v1i32(<1 x i32>)
▲ Show 20 Lines • Show All 131 Lines • ▼ Show 20 Lines
define i32 @vreduce_smin_v32i32(<32 x i32>* %x) {		define i32 @vreduce_smin_v32i32(<32 x i32>* %x) {
; RV32-LABEL: vreduce_smin_v32i32:		; RV32-LABEL: vreduce_smin_v32i32:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 32		; RV32-NEXT: li a1, 32
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; RV32-NEXT: vle32.v v8, (a0)		; RV32-NEXT: vle32.v v8, (a0)
; RV32-NEXT: lui a0, 524288		; RV32-NEXT: lui a0, 524288
; RV32-NEXT: addi a0, a0, -1		; RV32-NEXT: addi a0, a0, -1
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV32-NEXT: vmv.s.x v16, a0		; RV32-NEXT: vmv.s.x v16, a0
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; RV32-NEXT: vredmin.vs v8, v8, v16		; RV32-NEXT: vredmin.vs v8, v8, v16
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_smin_v32i32:		; RV64-LABEL: vreduce_smin_v32i32:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: li a1, 32		; RV64-NEXT: li a1, 32
; RV64-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV64-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; RV64-NEXT: vle32.v v8, (a0)		; RV64-NEXT: vle32.v v8, (a0)
; RV64-NEXT: lui a0, 524288		; RV64-NEXT: lui a0, 524288
; RV64-NEXT: addiw a0, a0, -1		; RV64-NEXT: addiw a0, a0, -1
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vmv.s.x v16, a0		; RV64-NEXT: vmv.s.x v16, a0
; RV64-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; RV64-NEXT: vredmin.vs v8, v8, v16		; RV64-NEXT: vredmin.vs v8, v8, v16
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <32 x i32>, <32 x i32>* %x		%v = load <32 x i32>, <32 x i32>* %x
%red = call i32 @llvm.vector.reduce.smin.v32i32(<32 x i32> %v)		%red = call i32 @llvm.vector.reduce.smin.v32i32(<32 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.smin.v64i32(<64 x i32>)		declare i32 @llvm.vector.reduce.smin.v64i32(<64 x i32>)

define i32 @vreduce_smin_v64i32(<64 x i32>* %x) {		define i32 @vreduce_smin_v64i32(<64 x i32>* %x) {
; RV32-LABEL: vreduce_smin_v64i32:		; RV32-LABEL: vreduce_smin_v64i32:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 32		; RV32-NEXT: li a1, 32
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; RV32-NEXT: vle32.v v8, (a0)		; RV32-NEXT: vle32.v v8, (a0)
; RV32-NEXT: addi a0, a0, 128		; RV32-NEXT: addi a0, a0, 128
; RV32-NEXT: vle32.v v16, (a0)		; RV32-NEXT: vle32.v v16, (a0)
; RV32-NEXT: vmin.vv v8, v8, v16
; RV32-NEXT: lui a0, 524288		; RV32-NEXT: lui a0, 524288
; RV32-NEXT: addi a0, a0, -1		; RV32-NEXT: addi a0, a0, -1
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; RV32-NEXT: vmv.s.x v24, a0
; RV32-NEXT: vmv.s.x v16, a0		; RV32-NEXT: vmin.vv v8, v8, v16
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vredmin.vs v8, v8, v24
; RV32-NEXT: vredmin.vs v8, v8, v16
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_smin_v64i32:		; RV64-LABEL: vreduce_smin_v64i32:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: li a1, 32		; RV64-NEXT: li a1, 32
; RV64-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV64-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; RV64-NEXT: vle32.v v8, (a0)		; RV64-NEXT: vle32.v v8, (a0)
; RV64-NEXT: addi a0, a0, 128		; RV64-NEXT: addi a0, a0, 128
; RV64-NEXT: vle32.v v16, (a0)		; RV64-NEXT: vle32.v v16, (a0)
; RV64-NEXT: vmin.vv v8, v8, v16
; RV64-NEXT: lui a0, 524288		; RV64-NEXT: lui a0, 524288
; RV64-NEXT: addiw a0, a0, -1		; RV64-NEXT: addiw a0, a0, -1
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; RV64-NEXT: vmv.s.x v24, a0
; RV64-NEXT: vmv.s.x v16, a0		; RV64-NEXT: vmin.vv v8, v8, v16
; RV64-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV64-NEXT: vredmin.vs v8, v8, v24
; RV64-NEXT: vredmin.vs v8, v8, v16
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <64 x i32>, <64 x i32>* %x		%v = load <64 x i32>, <64 x i32>* %x
%red = call i32 @llvm.vector.reduce.smin.v64i32(<64 x i32> %v)		%red = call i32 @llvm.vector.reduce.smin.v64i32(<64 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i64 @llvm.vector.reduce.smin.v1i64(<1 x i64>)		declare i64 @llvm.vector.reduce.smin.v1i64(<1 x i64>)
▲ Show 20 Lines • Show All 381 Lines • ▼ Show 20 Lines

define i8 @vreduce_smax_v32i8(<32 x i8>* %x) {		define i8 @vreduce_smax_v32i8(<32 x i8>* %x) {
; CHECK-LABEL: vreduce_smax_v32i8:		; CHECK-LABEL: vreduce_smax_v32i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: li a0, -128		; CHECK-NEXT: li a0, -128
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v10, a0		; CHECK-NEXT: vmv.s.x v10, a0
; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma
; CHECK-NEXT: vredmax.vs v8, v8, v10		; CHECK-NEXT: vredmax.vs v8, v8, v10
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i8>, <32 x i8>* %x		%v = load <32 x i8>, <32 x i8>* %x
%red = call i8 @llvm.vector.reduce.smax.v32i8(<32 x i8> %v)		%red = call i8 @llvm.vector.reduce.smax.v32i8(<32 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.smax.v64i8(<64 x i8>)		declare i8 @llvm.vector.reduce.smax.v64i8(<64 x i8>)

define i8 @vreduce_smax_v64i8(<64 x i8>* %x) {		define i8 @vreduce_smax_v64i8(<64 x i8>* %x) {
; CHECK-LABEL: vreduce_smax_v64i8:		; CHECK-LABEL: vreduce_smax_v64i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: li a0, -128		; CHECK-NEXT: li a0, -128
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v12, a0		; CHECK-NEXT: vmv.s.x v12, a0
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vredmax.vs v8, v8, v12		; CHECK-NEXT: vredmax.vs v8, v8, v12
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i8>, <64 x i8>* %x		%v = load <64 x i8>, <64 x i8>* %x
%red = call i8 @llvm.vector.reduce.smax.v64i8(<64 x i8> %v)		%red = call i8 @llvm.vector.reduce.smax.v64i8(<64 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.smax.v128i8(<128 x i8>)		declare i8 @llvm.vector.reduce.smax.v128i8(<128 x i8>)

define i8 @vreduce_smax_v128i8(<128 x i8>* %x) {		define i8 @vreduce_smax_v128i8(<128 x i8>* %x) {
; CHECK-LABEL: vreduce_smax_v128i8:		; CHECK-LABEL: vreduce_smax_v128i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 128		; CHECK-NEXT: li a1, 128
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: li a0, -128		; CHECK-NEXT: li a0, -128
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v16, a0		; CHECK-NEXT: vmv.s.x v16, a0
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vredmax.vs v8, v8, v16		; CHECK-NEXT: vredmax.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x i8>, <128 x i8>* %x		%v = load <128 x i8>, <128 x i8>* %x
%red = call i8 @llvm.vector.reduce.smax.v128i8(<128 x i8> %v)		%red = call i8 @llvm.vector.reduce.smax.v128i8(<128 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.smax.v256i8(<256 x i8>)		declare i8 @llvm.vector.reduce.smax.v256i8(<256 x i8>)

define i8 @vreduce_smax_v256i8(<256 x i8>* %x) {		define i8 @vreduce_smax_v256i8(<256 x i8>* %x) {
; CHECK-LABEL: vreduce_smax_v256i8:		; CHECK-LABEL: vreduce_smax_v256i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 128		; CHECK-NEXT: li a1, 128
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle8.v v16, (a0)		; CHECK-NEXT: vle8.v v16, (a0)
; CHECK-NEXT: vmax.vv v8, v8, v16
; CHECK-NEXT: li a0, -128		; CHECK-NEXT: li a0, -128
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma		; CHECK-NEXT: vmv.s.x v24, a0
; CHECK-NEXT: vmv.s.x v16, a0		; CHECK-NEXT: vmax.vv v8, v8, v16
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vredmax.vs v8, v8, v24
; CHECK-NEXT: vredmax.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <256 x i8>, <256 x i8>* %x		%v = load <256 x i8>, <256 x i8>* %x
%red = call i8 @llvm.vector.reduce.smax.v256i8(<256 x i8> %v)		%red = call i8 @llvm.vector.reduce.smax.v256i8(<256 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i16 @llvm.vector.reduce.smax.v1i16(<1 x i16>)		declare i16 @llvm.vector.reduce.smax.v1i16(<1 x i16>)
▲ Show 20 Lines • Show All 82 Lines • ▼ Show 20 Lines

define i16 @vreduce_smax_v32i16(<32 x i16>* %x) {		define i16 @vreduce_smax_v32i16(<32 x i16>* %x) {
; CHECK-LABEL: vreduce_smax_v32i16:		; CHECK-LABEL: vreduce_smax_v32i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: lui a0, 1048568		; CHECK-NEXT: lui a0, 1048568
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v12, a0		; CHECK-NEXT: vmv.s.x v12, a0
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vredmax.vs v8, v8, v12		; CHECK-NEXT: vredmax.vs v8, v8, v12
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i16>, <32 x i16>* %x		%v = load <32 x i16>, <32 x i16>* %x
%red = call i16 @llvm.vector.reduce.smax.v32i16(<32 x i16> %v)		%red = call i16 @llvm.vector.reduce.smax.v32i16(<32 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.smax.v64i16(<64 x i16>)		declare i16 @llvm.vector.reduce.smax.v64i16(<64 x i16>)

define i16 @vreduce_smax_v64i16(<64 x i16>* %x) {		define i16 @vreduce_smax_v64i16(<64 x i16>* %x) {
; CHECK-LABEL: vreduce_smax_v64i16:		; CHECK-LABEL: vreduce_smax_v64i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: lui a0, 1048568		; CHECK-NEXT: lui a0, 1048568
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v16, a0		; CHECK-NEXT: vmv.s.x v16, a0
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vredmax.vs v8, v8, v16		; CHECK-NEXT: vredmax.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i16>, <64 x i16>* %x		%v = load <64 x i16>, <64 x i16>* %x
%red = call i16 @llvm.vector.reduce.smax.v64i16(<64 x i16> %v)		%red = call i16 @llvm.vector.reduce.smax.v64i16(<64 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.smax.v128i16(<128 x i16>)		declare i16 @llvm.vector.reduce.smax.v128i16(<128 x i16>)

define i16 @vreduce_smax_v128i16(<128 x i16>* %x) {		define i16 @vreduce_smax_v128i16(<128 x i16>* %x) {
; CHECK-LABEL: vreduce_smax_v128i16:		; CHECK-LABEL: vreduce_smax_v128i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle16.v v16, (a0)		; CHECK-NEXT: vle16.v v16, (a0)
; CHECK-NEXT: vmax.vv v8, v8, v16
; CHECK-NEXT: lui a0, 1048568		; CHECK-NEXT: lui a0, 1048568
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vmv.s.x v24, a0
; CHECK-NEXT: vmv.s.x v16, a0		; CHECK-NEXT: vmax.vv v8, v8, v16
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vredmax.vs v8, v8, v24
; CHECK-NEXT: vredmax.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x i16>, <128 x i16>* %x		%v = load <128 x i16>, <128 x i16>* %x
%red = call i16 @llvm.vector.reduce.smax.v128i16(<128 x i16> %v)		%red = call i16 @llvm.vector.reduce.smax.v128i16(<128 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i32 @llvm.vector.reduce.smax.v1i32(<1 x i32>)		declare i32 @llvm.vector.reduce.smax.v1i32(<1 x i32>)
▲ Show 20 Lines • Show All 82 Lines • ▼ Show 20 Lines

define i32 @vreduce_smax_v32i32(<32 x i32>* %x) {		define i32 @vreduce_smax_v32i32(<32 x i32>* %x) {
; CHECK-LABEL: vreduce_smax_v32i32:		; CHECK-LABEL: vreduce_smax_v32i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: lui a0, 524288		; CHECK-NEXT: lui a0, 524288
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v16, a0		; CHECK-NEXT: vmv.s.x v16, a0
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vredmax.vs v8, v8, v16		; CHECK-NEXT: vredmax.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i32>, <32 x i32>* %x		%v = load <32 x i32>, <32 x i32>* %x
%red = call i32 @llvm.vector.reduce.smax.v32i32(<32 x i32> %v)		%red = call i32 @llvm.vector.reduce.smax.v32i32(<32 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.smax.v64i32(<64 x i32>)		declare i32 @llvm.vector.reduce.smax.v64i32(<64 x i32>)

define i32 @vreduce_smax_v64i32(<64 x i32>* %x) {		define i32 @vreduce_smax_v64i32(<64 x i32>* %x) {
; CHECK-LABEL: vreduce_smax_v64i32:		; CHECK-LABEL: vreduce_smax_v64i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle32.v v16, (a0)		; CHECK-NEXT: vle32.v v16, (a0)
; CHECK-NEXT: vmax.vv v8, v8, v16
; CHECK-NEXT: lui a0, 524288		; CHECK-NEXT: lui a0, 524288
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vmv.s.x v24, a0
; CHECK-NEXT: vmv.s.x v16, a0		; CHECK-NEXT: vmax.vv v8, v8, v16
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vredmax.vs v8, v8, v24
; CHECK-NEXT: vredmax.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i32>, <64 x i32>* %x		%v = load <64 x i32>, <64 x i32>* %x
%red = call i32 @llvm.vector.reduce.smax.v64i32(<64 x i32> %v)		%red = call i32 @llvm.vector.reduce.smax.v64i32(<64 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i64 @llvm.vector.reduce.smax.v1i64(<1 x i64>)		declare i64 @llvm.vector.reduce.smax.v1i64(<1 x i64>)
▲ Show 20 Lines • Show All 299 Lines • ▼ Show 20 Lines

declare i8 @llvm.vector.reduce.umin.v2i8(<2 x i8>)		declare i8 @llvm.vector.reduce.umin.v2i8(<2 x i8>)

define i8 @vreduce_umin_v2i8(<2 x i8>* %x) {		define i8 @vreduce_umin_v2i8(<2 x i8>* %x) {
; CHECK-LABEL: vreduce_umin_v2i8:		; CHECK-LABEL: vreduce_umin_v2i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v9		; CHECK-NEXT: vredminu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x i8>, <2 x i8>* %x		%v = load <2 x i8>, <2 x i8>* %x
%red = call i8 @llvm.vector.reduce.umin.v2i8(<2 x i8> %v)		%red = call i8 @llvm.vector.reduce.umin.v2i8(<2 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.umin.v4i8(<4 x i8>)		declare i8 @llvm.vector.reduce.umin.v4i8(<4 x i8>)

define i8 @vreduce_umin_v4i8(<4 x i8>* %x) {		define i8 @vreduce_umin_v4i8(<4 x i8>* %x) {
; CHECK-LABEL: vreduce_umin_v4i8:		; CHECK-LABEL: vreduce_umin_v4i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v9		; CHECK-NEXT: vredminu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x i8>, <4 x i8>* %x		%v = load <4 x i8>, <4 x i8>* %x
%red = call i8 @llvm.vector.reduce.umin.v4i8(<4 x i8> %v)		%red = call i8 @llvm.vector.reduce.umin.v4i8(<4 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.umin.v8i8(<8 x i8>)		declare i8 @llvm.vector.reduce.umin.v8i8(<8 x i8>)

define i8 @vreduce_umin_v8i8(<8 x i8>* %x) {		define i8 @vreduce_umin_v8i8(<8 x i8>* %x) {
; CHECK-LABEL: vreduce_umin_v8i8:		; CHECK-LABEL: vreduce_umin_v8i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, mf2, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v9		; CHECK-NEXT: vredminu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <8 x i8>, <8 x i8>* %x		%v = load <8 x i8>, <8 x i8>* %x
%red = call i8 @llvm.vector.reduce.umin.v8i8(<8 x i8> %v)		%red = call i8 @llvm.vector.reduce.umin.v8i8(<8 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.umin.v16i8(<16 x i8>)		declare i8 @llvm.vector.reduce.umin.v16i8(<16 x i8>)

define i8 @vreduce_umin_v16i8(<16 x i8>* %x) {		define i8 @vreduce_umin_v16i8(<16 x i8>* %x) {
; CHECK-LABEL: vreduce_umin_v16i8:		; CHECK-LABEL: vreduce_umin_v16i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v9		; CHECK-NEXT: vredminu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <16 x i8>, <16 x i8>* %x		%v = load <16 x i8>, <16 x i8>* %x
%red = call i8 @llvm.vector.reduce.umin.v16i8(<16 x i8> %v)		%red = call i8 @llvm.vector.reduce.umin.v16i8(<16 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.umin.v32i8(<32 x i8>)		declare i8 @llvm.vector.reduce.umin.v32i8(<32 x i8>)

define i8 @vreduce_umin_v32i8(<32 x i8>* %x) {		define i8 @vreduce_umin_v32i8(<32 x i8>* %x) {
; CHECK-LABEL: vreduce_umin_v32i8:		; CHECK-LABEL: vreduce_umin_v32i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m1, ta, ma
; CHECK-NEXT: vmv.v.i v10, -1		; CHECK-NEXT: vmv.v.i v10, -1
; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v10		; CHECK-NEXT: vredminu.vs v8, v8, v10
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i8>, <32 x i8>* %x		%v = load <32 x i8>, <32 x i8>* %x
%red = call i8 @llvm.vector.reduce.umin.v32i8(<32 x i8> %v)		%red = call i8 @llvm.vector.reduce.umin.v32i8(<32 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.umin.v64i8(<64 x i8>)		declare i8 @llvm.vector.reduce.umin.v64i8(<64 x i8>)

define i8 @vreduce_umin_v64i8(<64 x i8>* %x) {		define i8 @vreduce_umin_v64i8(<64 x i8>* %x) {
; CHECK-LABEL: vreduce_umin_v64i8:		; CHECK-LABEL: vreduce_umin_v64i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m1, ta, ma
; CHECK-NEXT: vmv.v.i v12, -1		; CHECK-NEXT: vmv.v.i v12, -1
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v12		; CHECK-NEXT: vredminu.vs v8, v8, v12
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i8>, <64 x i8>* %x		%v = load <64 x i8>, <64 x i8>* %x
%red = call i8 @llvm.vector.reduce.umin.v64i8(<64 x i8> %v)		%red = call i8 @llvm.vector.reduce.umin.v64i8(<64 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.umin.v128i8(<128 x i8>)		declare i8 @llvm.vector.reduce.umin.v128i8(<128 x i8>)

define i8 @vreduce_umin_v128i8(<128 x i8>* %x) {		define i8 @vreduce_umin_v128i8(<128 x i8>* %x) {
; CHECK-LABEL: vreduce_umin_v128i8:		; CHECK-LABEL: vreduce_umin_v128i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 128		; CHECK-NEXT: li a1, 128
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m1, ta, ma
; CHECK-NEXT: vmv.v.i v16, -1		; CHECK-NEXT: vmv.v.i v16, -1
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v16		; CHECK-NEXT: vredminu.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x i8>, <128 x i8>* %x		%v = load <128 x i8>, <128 x i8>* %x
%red = call i8 @llvm.vector.reduce.umin.v128i8(<128 x i8> %v)		%red = call i8 @llvm.vector.reduce.umin.v128i8(<128 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.umin.v256i8(<256 x i8>)		declare i8 @llvm.vector.reduce.umin.v256i8(<256 x i8>)

define i8 @vreduce_umin_v256i8(<256 x i8>* %x) {		define i8 @vreduce_umin_v256i8(<256 x i8>* %x) {
; CHECK-LABEL: vreduce_umin_v256i8:		; CHECK-LABEL: vreduce_umin_v256i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 128		; CHECK-NEXT: li a1, 128
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle8.v v16, (a0)		; CHECK-NEXT: vle8.v v16, (a0)
; CHECK-NEXT: vminu.vv v8, v8, v16		; CHECK-NEXT: vminu.vv v8, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m1, ta, ma
; CHECK-NEXT: vmv.v.i v16, -1		; CHECK-NEXT: vmv.v.i v16, -1
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v16		; CHECK-NEXT: vredminu.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <256 x i8>, <256 x i8>* %x		%v = load <256 x i8>, <256 x i8>* %x
%red = call i8 @llvm.vector.reduce.umin.v256i8(<256 x i8> %v)		%red = call i8 @llvm.vector.reduce.umin.v256i8(<256 x i8> %v)
ret i8 %red		ret i8 %red
Show All 15 Lines

declare i16 @llvm.vector.reduce.umin.v2i16(<2 x i16>)		declare i16 @llvm.vector.reduce.umin.v2i16(<2 x i16>)

define i16 @vreduce_umin_v2i16(<2 x i16>* %x) {		define i16 @vreduce_umin_v2i16(<2 x i16>* %x) {
; CHECK-LABEL: vreduce_umin_v2i16:		; CHECK-LABEL: vreduce_umin_v2i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v9		; CHECK-NEXT: vredminu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x i16>, <2 x i16>* %x		%v = load <2 x i16>, <2 x i16>* %x
%red = call i16 @llvm.vector.reduce.umin.v2i16(<2 x i16> %v)		%red = call i16 @llvm.vector.reduce.umin.v2i16(<2 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.umin.v4i16(<4 x i16>)		declare i16 @llvm.vector.reduce.umin.v4i16(<4 x i16>)

define i16 @vreduce_umin_v4i16(<4 x i16>* %x) {		define i16 @vreduce_umin_v4i16(<4 x i16>* %x) {
; CHECK-LABEL: vreduce_umin_v4i16:		; CHECK-LABEL: vreduce_umin_v4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v9		; CHECK-NEXT: vredminu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x i16>, <4 x i16>* %x		%v = load <4 x i16>, <4 x i16>* %x
%red = call i16 @llvm.vector.reduce.umin.v4i16(<4 x i16> %v)		%red = call i16 @llvm.vector.reduce.umin.v4i16(<4 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.umin.v8i16(<8 x i16>)		declare i16 @llvm.vector.reduce.umin.v8i16(<8 x i16>)

define i16 @vreduce_umin_v8i16(<8 x i16>* %x) {		define i16 @vreduce_umin_v8i16(<8 x i16>* %x) {
; CHECK-LABEL: vreduce_umin_v8i16:		; CHECK-LABEL: vreduce_umin_v8i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v9		; CHECK-NEXT: vredminu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <8 x i16>, <8 x i16>* %x		%v = load <8 x i16>, <8 x i16>* %x
%red = call i16 @llvm.vector.reduce.umin.v8i16(<8 x i16> %v)		%red = call i16 @llvm.vector.reduce.umin.v8i16(<8 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.umin.v16i16(<16 x i16>)		declare i16 @llvm.vector.reduce.umin.v16i16(<16 x i16>)

define i16 @vreduce_umin_v16i16(<16 x i16>* %x) {		define i16 @vreduce_umin_v16i16(<16 x i16>* %x) {
; CHECK-LABEL: vreduce_umin_v16i16:		; CHECK-LABEL: vreduce_umin_v16i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e16, m1, ta, ma
; CHECK-NEXT: vmv.v.i v10, -1		; CHECK-NEXT: vmv.v.i v10, -1
; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v10		; CHECK-NEXT: vredminu.vs v8, v8, v10
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <16 x i16>, <16 x i16>* %x		%v = load <16 x i16>, <16 x i16>* %x
%red = call i16 @llvm.vector.reduce.umin.v16i16(<16 x i16> %v)		%red = call i16 @llvm.vector.reduce.umin.v16i16(<16 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.umin.v32i16(<32 x i16>)		declare i16 @llvm.vector.reduce.umin.v32i16(<32 x i16>)

define i16 @vreduce_umin_v32i16(<32 x i16>* %x) {		define i16 @vreduce_umin_v32i16(<32 x i16>* %x) {
; CHECK-LABEL: vreduce_umin_v32i16:		; CHECK-LABEL: vreduce_umin_v32i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m1, ta, ma
; CHECK-NEXT: vmv.v.i v12, -1		; CHECK-NEXT: vmv.v.i v12, -1
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v12		; CHECK-NEXT: vredminu.vs v8, v8, v12
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i16>, <32 x i16>* %x		%v = load <32 x i16>, <32 x i16>* %x
%red = call i16 @llvm.vector.reduce.umin.v32i16(<32 x i16> %v)		%red = call i16 @llvm.vector.reduce.umin.v32i16(<32 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.umin.v64i16(<64 x i16>)		declare i16 @llvm.vector.reduce.umin.v64i16(<64 x i16>)

define i16 @vreduce_umin_v64i16(<64 x i16>* %x) {		define i16 @vreduce_umin_v64i16(<64 x i16>* %x) {
; CHECK-LABEL: vreduce_umin_v64i16:		; CHECK-LABEL: vreduce_umin_v64i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m1, ta, ma
; CHECK-NEXT: vmv.v.i v16, -1		; CHECK-NEXT: vmv.v.i v16, -1
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v16		; CHECK-NEXT: vredminu.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i16>, <64 x i16>* %x		%v = load <64 x i16>, <64 x i16>* %x
%red = call i16 @llvm.vector.reduce.umin.v64i16(<64 x i16> %v)		%red = call i16 @llvm.vector.reduce.umin.v64i16(<64 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.umin.v128i16(<128 x i16>)		declare i16 @llvm.vector.reduce.umin.v128i16(<128 x i16>)

define i16 @vreduce_umin_v128i16(<128 x i16>* %x) {		define i16 @vreduce_umin_v128i16(<128 x i16>* %x) {
; CHECK-LABEL: vreduce_umin_v128i16:		; CHECK-LABEL: vreduce_umin_v128i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle16.v v16, (a0)		; CHECK-NEXT: vle16.v v16, (a0)
; CHECK-NEXT: vminu.vv v8, v8, v16		; CHECK-NEXT: vminu.vv v8, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m1, ta, ma
; CHECK-NEXT: vmv.v.i v16, -1		; CHECK-NEXT: vmv.v.i v16, -1
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v16		; CHECK-NEXT: vredminu.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x i16>, <128 x i16>* %x		%v = load <128 x i16>, <128 x i16>* %x
%red = call i16 @llvm.vector.reduce.umin.v128i16(<128 x i16> %v)		%red = call i16 @llvm.vector.reduce.umin.v128i16(<128 x i16> %v)
ret i16 %red		ret i16 %red
Show All 15 Lines

declare i32 @llvm.vector.reduce.umin.v2i32(<2 x i32>)		declare i32 @llvm.vector.reduce.umin.v2i32(<2 x i32>)

define i32 @vreduce_umin_v2i32(<2 x i32>* %x) {		define i32 @vreduce_umin_v2i32(<2 x i32>* %x) {
; CHECK-LABEL: vreduce_umin_v2i32:		; CHECK-LABEL: vreduce_umin_v2i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v9		; CHECK-NEXT: vredminu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x i32>, <2 x i32>* %x		%v = load <2 x i32>, <2 x i32>* %x
%red = call i32 @llvm.vector.reduce.umin.v2i32(<2 x i32> %v)		%red = call i32 @llvm.vector.reduce.umin.v2i32(<2 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.umin.v4i32(<4 x i32>)		declare i32 @llvm.vector.reduce.umin.v4i32(<4 x i32>)

define i32 @vreduce_umin_v4i32(<4 x i32>* %x) {		define i32 @vreduce_umin_v4i32(<4 x i32>* %x) {
; CHECK-LABEL: vreduce_umin_v4i32:		; CHECK-LABEL: vreduce_umin_v4i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v9		; CHECK-NEXT: vredminu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x i32>, <4 x i32>* %x		%v = load <4 x i32>, <4 x i32>* %x
%red = call i32 @llvm.vector.reduce.umin.v4i32(<4 x i32> %v)		%red = call i32 @llvm.vector.reduce.umin.v4i32(<4 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.umin.v8i32(<8 x i32>)		declare i32 @llvm.vector.reduce.umin.v8i32(<8 x i32>)

define i32 @vreduce_umin_v8i32(<8 x i32>* %x) {		define i32 @vreduce_umin_v8i32(<8 x i32>* %x) {
; CHECK-LABEL: vreduce_umin_v8i32:		; CHECK-LABEL: vreduce_umin_v8i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e32, m1, ta, ma
; CHECK-NEXT: vmv.v.i v10, -1		; CHECK-NEXT: vmv.v.i v10, -1
; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v10		; CHECK-NEXT: vredminu.vs v8, v8, v10
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <8 x i32>, <8 x i32>* %x		%v = load <8 x i32>, <8 x i32>* %x
%red = call i32 @llvm.vector.reduce.umin.v8i32(<8 x i32> %v)		%red = call i32 @llvm.vector.reduce.umin.v8i32(<8 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.umin.v16i32(<16 x i32>)		declare i32 @llvm.vector.reduce.umin.v16i32(<16 x i32>)

define i32 @vreduce_umin_v16i32(<16 x i32>* %x) {		define i32 @vreduce_umin_v16i32(<16 x i32>* %x) {
; CHECK-LABEL: vreduce_umin_v16i32:		; CHECK-LABEL: vreduce_umin_v16i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e32, m1, ta, ma
; CHECK-NEXT: vmv.v.i v12, -1		; CHECK-NEXT: vmv.v.i v12, -1
; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v12		; CHECK-NEXT: vredminu.vs v8, v8, v12
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <16 x i32>, <16 x i32>* %x		%v = load <16 x i32>, <16 x i32>* %x
%red = call i32 @llvm.vector.reduce.umin.v16i32(<16 x i32> %v)		%red = call i32 @llvm.vector.reduce.umin.v16i32(<16 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.umin.v32i32(<32 x i32>)		declare i32 @llvm.vector.reduce.umin.v32i32(<32 x i32>)

define i32 @vreduce_umin_v32i32(<32 x i32>* %x) {		define i32 @vreduce_umin_v32i32(<32 x i32>* %x) {
; CHECK-LABEL: vreduce_umin_v32i32:		; CHECK-LABEL: vreduce_umin_v32i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
; CHECK-NEXT: vmv.v.i v16, -1		; CHECK-NEXT: vmv.v.i v16, -1
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v16		; CHECK-NEXT: vredminu.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i32>, <32 x i32>* %x		%v = load <32 x i32>, <32 x i32>* %x
%red = call i32 @llvm.vector.reduce.umin.v32i32(<32 x i32> %v)		%red = call i32 @llvm.vector.reduce.umin.v32i32(<32 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.umin.v64i32(<64 x i32>)		declare i32 @llvm.vector.reduce.umin.v64i32(<64 x i32>)

define i32 @vreduce_umin_v64i32(<64 x i32>* %x) {		define i32 @vreduce_umin_v64i32(<64 x i32>* %x) {
; CHECK-LABEL: vreduce_umin_v64i32:		; CHECK-LABEL: vreduce_umin_v64i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle32.v v16, (a0)		; CHECK-NEXT: vle32.v v16, (a0)
; CHECK-NEXT: vminu.vv v8, v8, v16		; CHECK-NEXT: vminu.vv v8, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
; CHECK-NEXT: vmv.v.i v16, -1		; CHECK-NEXT: vmv.v.i v16, -1
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vredminu.vs v8, v8, v16		; CHECK-NEXT: vredminu.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i32>, <64 x i32>* %x		%v = load <64 x i32>, <64 x i32>* %x
%red = call i32 @llvm.vector.reduce.umin.v64i32(<64 x i32> %v)		%red = call i32 @llvm.vector.reduce.umin.v64i32(<64 x i32> %v)
ret i32 %red		ret i32 %red
Show All 40 Lines
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_umin_v2i64:		; RV64-LABEL: vreduce_umin_v2i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; RV64-NEXT: vle64.v v8, (a0)		; RV64-NEXT: vle64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vmv.v.i v9, -1		; RV64-NEXT: vmv.v.i v9, -1
; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; RV64-NEXT: vredminu.vs v8, v8, v9		; RV64-NEXT: vredminu.vs v8, v8, v9
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <2 x i64>, <2 x i64>* %x		%v = load <2 x i64>, <2 x i64>* %x
%red = call i64 @llvm.vector.reduce.umin.v2i64(<2 x i64> %v)		%red = call i64 @llvm.vector.reduce.umin.v2i64(<2 x i64> %v)
ret i64 %red		ret i64 %red
}		}

Show All 14 Lines
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_umin_v4i64:		; RV64-LABEL: vreduce_umin_v4i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; RV64-NEXT: vle64.v v8, (a0)		; RV64-NEXT: vle64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 4, e64, m1, ta, ma
; RV64-NEXT: vmv.v.i v10, -1		; RV64-NEXT: vmv.v.i v10, -1
; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; RV64-NEXT: vredminu.vs v8, v8, v10		; RV64-NEXT: vredminu.vs v8, v8, v10
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <4 x i64>, <4 x i64>* %x		%v = load <4 x i64>, <4 x i64>* %x
%red = call i64 @llvm.vector.reduce.umin.v4i64(<4 x i64> %v)		%red = call i64 @llvm.vector.reduce.umin.v4i64(<4 x i64> %v)
ret i64 %red		ret i64 %red
Show All 16 Lines
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_umin_v8i64:		; RV64-LABEL: vreduce_umin_v8i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; RV64-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; RV64-NEXT: vle64.v v8, (a0)		; RV64-NEXT: vle64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 8, e64, m1, ta, ma
; RV64-NEXT: vmv.v.i v12, -1		; RV64-NEXT: vmv.v.i v12, -1
; RV64-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; RV64-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; RV64-NEXT: vredminu.vs v8, v8, v12		; RV64-NEXT: vredminu.vs v8, v8, v12
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <8 x i64>, <8 x i64>* %x		%v = load <8 x i64>, <8 x i64>* %x
%red = call i64 @llvm.vector.reduce.umin.v8i64(<8 x i64> %v)		%red = call i64 @llvm.vector.reduce.umin.v8i64(<8 x i64> %v)
ret i64 %red		ret i64 %red
Show All 16 Lines
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_umin_v16i64:		; RV64-LABEL: vreduce_umin_v16i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV64-NEXT: vle64.v v8, (a0)		; RV64-NEXT: vle64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m1, ta, ma
; RV64-NEXT: vmv.v.i v16, -1		; RV64-NEXT: vmv.v.i v16, -1
; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV64-NEXT: vredminu.vs v8, v8, v16		; RV64-NEXT: vredminu.vs v8, v8, v16
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <16 x i64>, <16 x i64>* %x		%v = load <16 x i64>, <16 x i64>* %x
%red = call i64 @llvm.vector.reduce.umin.v16i64(<16 x i64> %v)		%red = call i64 @llvm.vector.reduce.umin.v16i64(<16 x i64> %v)
ret i64 %red		ret i64 %red
Show All 22 Lines
;		;
; RV64-LABEL: vreduce_umin_v32i64:		; RV64-LABEL: vreduce_umin_v32i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV64-NEXT: vle64.v v8, (a0)		; RV64-NEXT: vle64.v v8, (a0)
; RV64-NEXT: addi a0, a0, 128		; RV64-NEXT: addi a0, a0, 128
; RV64-NEXT: vle64.v v16, (a0)		; RV64-NEXT: vle64.v v16, (a0)
; RV64-NEXT: vminu.vv v8, v8, v16		; RV64-NEXT: vminu.vv v8, v8, v16
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m1, ta, ma
; RV64-NEXT: vmv.v.i v16, -1		; RV64-NEXT: vmv.v.i v16, -1
; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV64-NEXT: vredminu.vs v8, v8, v16		; RV64-NEXT: vredminu.vs v8, v8, v16
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <32 x i64>, <32 x i64>* %x		%v = load <32 x i64>, <32 x i64>* %x
%red = call i64 @llvm.vector.reduce.umin.v32i64(<32 x i64> %v)		%red = call i64 @llvm.vector.reduce.umin.v32i64(<32 x i64> %v)
ret i64 %red		ret i64 %red
Show All 34 Lines
; RV64-NEXT: vle64.v v16, (a1)		; RV64-NEXT: vle64.v v16, (a1)
; RV64-NEXT: addi a1, a0, 256		; RV64-NEXT: addi a1, a0, 256
; RV64-NEXT: addi a0, a0, 128		; RV64-NEXT: addi a0, a0, 128
; RV64-NEXT: vle64.v v24, (a0)		; RV64-NEXT: vle64.v v24, (a0)
; RV64-NEXT: vle64.v v0, (a1)		; RV64-NEXT: vle64.v v0, (a1)
; RV64-NEXT: vminu.vv v16, v24, v16		; RV64-NEXT: vminu.vv v16, v24, v16
; RV64-NEXT: vminu.vv v8, v8, v0		; RV64-NEXT: vminu.vv v8, v8, v0
; RV64-NEXT: vminu.vv v8, v8, v16		; RV64-NEXT: vminu.vv v8, v8, v16
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m1, ta, ma
; RV64-NEXT: vmv.v.i v16, -1		; RV64-NEXT: vmv.v.i v16, -1
; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV64-NEXT: vredminu.vs v8, v8, v16		; RV64-NEXT: vredminu.vs v8, v8, v16
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <64 x i64>, <64 x i64>* %x		%v = load <64 x i64>, <64 x i64>* %x
%red = call i64 @llvm.vector.reduce.umin.v64i64(<64 x i64> %v)		%red = call i64 @llvm.vector.reduce.umin.v64i64(<64 x i64> %v)
ret i64 %red		ret i64 %red
▲ Show 20 Lines • Show All 80 Lines • ▼ Show 20 Lines
declare i8 @llvm.vector.reduce.umax.v32i8(<32 x i8>)		declare i8 @llvm.vector.reduce.umax.v32i8(<32 x i8>)

define i8 @vreduce_umax_v32i8(<32 x i8>* %x) {		define i8 @vreduce_umax_v32i8(<32 x i8>* %x) {
; CHECK-LABEL: vreduce_umax_v32i8:		; CHECK-LABEL: vreduce_umax_v32i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v10, zero		; CHECK-NEXT: vmv.s.x v10, zero
; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, ma
; CHECK-NEXT: vredmaxu.vs v8, v8, v10		; CHECK-NEXT: vredmaxu.vs v8, v8, v10
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i8>, <32 x i8>* %x		%v = load <32 x i8>, <32 x i8>* %x
%red = call i8 @llvm.vector.reduce.umax.v32i8(<32 x i8> %v)		%red = call i8 @llvm.vector.reduce.umax.v32i8(<32 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.umax.v64i8(<64 x i8>)		declare i8 @llvm.vector.reduce.umax.v64i8(<64 x i8>)

define i8 @vreduce_umax_v64i8(<64 x i8>* %x) {		define i8 @vreduce_umax_v64i8(<64 x i8>* %x) {
; CHECK-LABEL: vreduce_umax_v64i8:		; CHECK-LABEL: vreduce_umax_v64i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v12, zero		; CHECK-NEXT: vmv.s.x v12, zero
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vredmaxu.vs v8, v8, v12		; CHECK-NEXT: vredmaxu.vs v8, v8, v12
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i8>, <64 x i8>* %x		%v = load <64 x i8>, <64 x i8>* %x
%red = call i8 @llvm.vector.reduce.umax.v64i8(<64 x i8> %v)		%red = call i8 @llvm.vector.reduce.umax.v64i8(<64 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.umax.v128i8(<128 x i8>)		declare i8 @llvm.vector.reduce.umax.v128i8(<128 x i8>)

define i8 @vreduce_umax_v128i8(<128 x i8>* %x) {		define i8 @vreduce_umax_v128i8(<128 x i8>* %x) {
; CHECK-LABEL: vreduce_umax_v128i8:		; CHECK-LABEL: vreduce_umax_v128i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 128		; CHECK-NEXT: li a1, 128
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v16, zero		; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vredmaxu.vs v8, v8, v16		; CHECK-NEXT: vredmaxu.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x i8>, <128 x i8>* %x		%v = load <128 x i8>, <128 x i8>* %x
%red = call i8 @llvm.vector.reduce.umax.v128i8(<128 x i8> %v)		%red = call i8 @llvm.vector.reduce.umax.v128i8(<128 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.umax.v256i8(<256 x i8>)		declare i8 @llvm.vector.reduce.umax.v256i8(<256 x i8>)

define i8 @vreduce_umax_v256i8(<256 x i8>* %x) {		define i8 @vreduce_umax_v256i8(<256 x i8>* %x) {
; CHECK-LABEL: vreduce_umax_v256i8:		; CHECK-LABEL: vreduce_umax_v256i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 128		; CHECK-NEXT: li a1, 128
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle8.v v16, (a0)		; CHECK-NEXT: vle8.v v16, (a0)
		; CHECK-NEXT: vmv.s.x v24, zero
; CHECK-NEXT: vmaxu.vv v8, v8, v16		; CHECK-NEXT: vmaxu.vv v8, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma		; CHECK-NEXT: vredmaxu.vs v8, v8, v24
; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, ma
; CHECK-NEXT: vredmaxu.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <256 x i8>, <256 x i8>* %x		%v = load <256 x i8>, <256 x i8>* %x
%red = call i8 @llvm.vector.reduce.umax.v256i8(<256 x i8> %v)		%red = call i8 @llvm.vector.reduce.umax.v256i8(<256 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i16 @llvm.vector.reduce.umax.v1i16(<1 x i16>)		declare i16 @llvm.vector.reduce.umax.v1i16(<1 x i16>)
▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
declare i16 @llvm.vector.reduce.umax.v32i16(<32 x i16>)		declare i16 @llvm.vector.reduce.umax.v32i16(<32 x i16>)

define i16 @vreduce_umax_v32i16(<32 x i16>* %x) {		define i16 @vreduce_umax_v32i16(<32 x i16>* %x) {
; CHECK-LABEL: vreduce_umax_v32i16:		; CHECK-LABEL: vreduce_umax_v32i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v12, zero		; CHECK-NEXT: vmv.s.x v12, zero
; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, ma
; CHECK-NEXT: vredmaxu.vs v8, v8, v12		; CHECK-NEXT: vredmaxu.vs v8, v8, v12
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i16>, <32 x i16>* %x		%v = load <32 x i16>, <32 x i16>* %x
%red = call i16 @llvm.vector.reduce.umax.v32i16(<32 x i16> %v)		%red = call i16 @llvm.vector.reduce.umax.v32i16(<32 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.umax.v64i16(<64 x i16>)		declare i16 @llvm.vector.reduce.umax.v64i16(<64 x i16>)

define i16 @vreduce_umax_v64i16(<64 x i16>* %x) {		define i16 @vreduce_umax_v64i16(<64 x i16>* %x) {
; CHECK-LABEL: vreduce_umax_v64i16:		; CHECK-LABEL: vreduce_umax_v64i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v16, zero		; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vredmaxu.vs v8, v8, v16		; CHECK-NEXT: vredmaxu.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i16>, <64 x i16>* %x		%v = load <64 x i16>, <64 x i16>* %x
%red = call i16 @llvm.vector.reduce.umax.v64i16(<64 x i16> %v)		%red = call i16 @llvm.vector.reduce.umax.v64i16(<64 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.umax.v128i16(<128 x i16>)		declare i16 @llvm.vector.reduce.umax.v128i16(<128 x i16>)

define i16 @vreduce_umax_v128i16(<128 x i16>* %x) {		define i16 @vreduce_umax_v128i16(<128 x i16>* %x) {
; CHECK-LABEL: vreduce_umax_v128i16:		; CHECK-LABEL: vreduce_umax_v128i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 64		; CHECK-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle16.v v16, (a0)		; CHECK-NEXT: vle16.v v16, (a0)
		; CHECK-NEXT: vmv.s.x v24, zero
; CHECK-NEXT: vmaxu.vv v8, v8, v16		; CHECK-NEXT: vmaxu.vv v8, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vredmaxu.vs v8, v8, v24
; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, ma
; CHECK-NEXT: vredmaxu.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <128 x i16>, <128 x i16>* %x		%v = load <128 x i16>, <128 x i16>* %x
%red = call i16 @llvm.vector.reduce.umax.v128i16(<128 x i16> %v)		%red = call i16 @llvm.vector.reduce.umax.v128i16(<128 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i32 @llvm.vector.reduce.umax.v1i32(<1 x i32>)		declare i32 @llvm.vector.reduce.umax.v1i32(<1 x i32>)
▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
declare i32 @llvm.vector.reduce.umax.v32i32(<32 x i32>)		declare i32 @llvm.vector.reduce.umax.v32i32(<32 x i32>)

define i32 @vreduce_umax_v32i32(<32 x i32>* %x) {		define i32 @vreduce_umax_v32i32(<32 x i32>* %x) {
; CHECK-LABEL: vreduce_umax_v32i32:		; CHECK-LABEL: vreduce_umax_v32i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v16, zero		; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vredmaxu.vs v8, v8, v16		; CHECK-NEXT: vredmaxu.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <32 x i32>, <32 x i32>* %x		%v = load <32 x i32>, <32 x i32>* %x
%red = call i32 @llvm.vector.reduce.umax.v32i32(<32 x i32> %v)		%red = call i32 @llvm.vector.reduce.umax.v32i32(<32 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.umax.v64i32(<64 x i32>)		declare i32 @llvm.vector.reduce.umax.v64i32(<64 x i32>)

define i32 @vreduce_umax_v64i32(<64 x i32>* %x) {		define i32 @vreduce_umax_v64i32(<64 x i32>* %x) {
; CHECK-LABEL: vreduce_umax_v64i32:		; CHECK-LABEL: vreduce_umax_v64i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
; CHECK-NEXT: vle32.v v16, (a0)		; CHECK-NEXT: vle32.v v16, (a0)
		; CHECK-NEXT: vmv.s.x v24, zero
; CHECK-NEXT: vmaxu.vv v8, v8, v16		; CHECK-NEXT: vmaxu.vv v8, v8, v16
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vredmaxu.vs v8, v8, v24
; CHECK-NEXT: vmv.s.x v16, zero
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vredmaxu.vs v8, v8, v16
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <64 x i32>, <64 x i32>* %x		%v = load <64 x i32>, <64 x i32>* %x
%red = call i32 @llvm.vector.reduce.umax.v64i32(<64 x i32> %v)		%red = call i32 @llvm.vector.reduce.umax.v64i32(<64 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i64 @llvm.vector.reduce.umax.v1i64(<1 x i64>)		declare i64 @llvm.vector.reduce.umax.v1i64(<1 x i64>)
▲ Show 20 Lines • Show All 1,016 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fold-binary-reduce.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=riscv64 -mattr=+d,+zfh,+experimental-zvfh,+v,+zbb -riscv-v-vector-bits-min=128 -target-abi=lp64d -verify-machineinstrs < %s \| FileCheck %s			; RUN: llc -mtriple=riscv64 -mattr=+d,+zfh,+experimental-zvfh,+v,+zbb -riscv-v-vector-bits-min=128 -target-abi=lp64d -verify-machineinstrs < %s \| FileCheck %s

	define i64 @reduce_add(i64 %x, <4 x i64> %v) {			define i64 @reduce_add(i64 %x, <4 x i64> %v) {
	; CHECK-LABEL: reduce_add:			; CHECK-LABEL: reduce_add:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v10, a0			; CHECK-NEXT: vmv.s.x v10, a0
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; CHECK-NEXT: vredsum.vs v8, v8, v10			; CHECK-NEXT: vredsum.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%rdx = call i64 @llvm.vector.reduce.add.v4i64(<4 x i64> %v)			%rdx = call i64 @llvm.vector.reduce.add.v4i64(<4 x i64> %v)
	%res = add i64 %rdx, %x			%res = add i64 %rdx, %x
	ret i64 %res			ret i64 %res
	}			}

	define i64 @reduce_add2(<4 x i64> %v) {			define i64 @reduce_add2(<4 x i64> %v) {
	; CHECK-LABEL: reduce_add2:			; CHECK-LABEL: reduce_add2:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v10, 8			; CHECK-NEXT: vmv.v.i v10, 8
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; CHECK-NEXT: vredsum.vs v8, v8, v10			; CHECK-NEXT: vredsum.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%rdx = call i64 @llvm.vector.reduce.add.v4i64(<4 x i64> %v)			%rdx = call i64 @llvm.vector.reduce.add.v4i64(<4 x i64> %v)
	%res = add i64 %rdx, 8			%res = add i64 %rdx, 8
	ret i64 %res			ret i64 %res
	}			}

	define i64 @reduce_and(i64 %x, <4 x i64> %v) {			define i64 @reduce_and(i64 %x, <4 x i64> %v) {
	; CHECK-LABEL: reduce_and:			; CHECK-LABEL: reduce_and:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v10, a0			; CHECK-NEXT: vmv.s.x v10, a0
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; CHECK-NEXT: vredand.vs v8, v8, v10			; CHECK-NEXT: vredand.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%rdx = call i64 @llvm.vector.reduce.and.v4i64(<4 x i64> %v)			%rdx = call i64 @llvm.vector.reduce.and.v4i64(<4 x i64> %v)
	%res = and i64 %rdx, %x			%res = and i64 %rdx, %x
	ret i64 %res			ret i64 %res
	}			}

	define i64 @reduce_and2(<4 x i64> %v) {			define i64 @reduce_and2(<4 x i64> %v) {
	; CHECK-LABEL: reduce_and2:			; CHECK-LABEL: reduce_and2:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v10, 8			; CHECK-NEXT: vmv.v.i v10, 8
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; CHECK-NEXT: vredand.vs v8, v8, v10			; CHECK-NEXT: vredand.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%rdx = call i64 @llvm.vector.reduce.and.v4i64(<4 x i64> %v)			%rdx = call i64 @llvm.vector.reduce.and.v4i64(<4 x i64> %v)
	%res = and i64 %rdx, 8			%res = and i64 %rdx, 8
	ret i64 %res			ret i64 %res
	}			}

	define i64 @reduce_or(i64 %x, <4 x i64> %v) {			define i64 @reduce_or(i64 %x, <4 x i64> %v) {
	; CHECK-LABEL: reduce_or:			; CHECK-LABEL: reduce_or:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v10, a0			; CHECK-NEXT: vmv.s.x v10, a0
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; CHECK-NEXT: vredor.vs v8, v8, v10			; CHECK-NEXT: vredor.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%rdx = call i64 @llvm.vector.reduce.or.v4i64(<4 x i64> %v)			%rdx = call i64 @llvm.vector.reduce.or.v4i64(<4 x i64> %v)
	%res = or i64 %rdx, %x			%res = or i64 %rdx, %x
	ret i64 %res			ret i64 %res
	}			}

	define i64 @reduce_or2(<4 x i64> %v) {			define i64 @reduce_or2(<4 x i64> %v) {
	; CHECK-LABEL: reduce_or2:			; CHECK-LABEL: reduce_or2:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v10, 8			; CHECK-NEXT: vmv.v.i v10, 8
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; CHECK-NEXT: vredor.vs v8, v8, v10			; CHECK-NEXT: vredor.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%rdx = call i64 @llvm.vector.reduce.or.v4i64(<4 x i64> %v)			%rdx = call i64 @llvm.vector.reduce.or.v4i64(<4 x i64> %v)
	%res = or i64 %rdx, 8			%res = or i64 %rdx, 8
	ret i64 %res			ret i64 %res
	}			}

	define i64 @reduce_xor(i64 %x, <4 x i64> %v) {			define i64 @reduce_xor(i64 %x, <4 x i64> %v) {
	; CHECK-LABEL: reduce_xor:			; CHECK-LABEL: reduce_xor:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v10, a0			; CHECK-NEXT: vmv.s.x v10, a0
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; CHECK-NEXT: vredxor.vs v8, v8, v10			; CHECK-NEXT: vredxor.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%rdx = call i64 @llvm.vector.reduce.xor.v4i64(<4 x i64> %v)			%rdx = call i64 @llvm.vector.reduce.xor.v4i64(<4 x i64> %v)
	%res = xor i64 %rdx, %x			%res = xor i64 %rdx, %x
	ret i64 %res			ret i64 %res
	}			}

	define i64 @reduce_xor2(<4 x i64> %v) {			define i64 @reduce_xor2(<4 x i64> %v) {
	; CHECK-LABEL: reduce_xor2:			; CHECK-LABEL: reduce_xor2:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v10, zero			; CHECK-NEXT: vmv.s.x v10, zero
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; CHECK-NEXT: vredxor.vs v8, v8, v10			; CHECK-NEXT: vredxor.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: andi a0, a0, 8			; CHECK-NEXT: andi a0, a0, 8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%rdx = call i64 @llvm.vector.reduce.xor.v4i64(<4 x i64> %v)			%rdx = call i64 @llvm.vector.reduce.xor.v4i64(<4 x i64> %v)
	%res = and i64 %rdx, 8			%res = and i64 %rdx, 8
	ret i64 %res			ret i64 %res
	}			}

	define i64 @reduce_umax(i64 %x, <4 x i64> %v) {			define i64 @reduce_umax(i64 %x, <4 x i64> %v) {
	; CHECK-LABEL: reduce_umax:			; CHECK-LABEL: reduce_umax:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v10, a0			; CHECK-NEXT: vmv.s.x v10, a0
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; CHECK-NEXT: vredmaxu.vs v8, v8, v10			; CHECK-NEXT: vredmaxu.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%rdx = call i64 @llvm.vector.reduce.umax.v4i64(<4 x i64> %v)			%rdx = call i64 @llvm.vector.reduce.umax.v4i64(<4 x i64> %v)
	%res = call i64 @llvm.umax.i64(i64 %rdx, i64 %x)			%res = call i64 @llvm.umax.i64(i64 %rdx, i64 %x)
	ret i64 %res			ret i64 %res
	}			}

	define i64 @reduce_umax2(<4 x i64> %v) {			define i64 @reduce_umax2(<4 x i64> %v) {
	; CHECK-LABEL: reduce_umax2:			; CHECK-LABEL: reduce_umax2:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v10, 8			; CHECK-NEXT: vmv.v.i v10, 8
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; CHECK-NEXT: vredmaxu.vs v8, v8, v10			; CHECK-NEXT: vredmaxu.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%rdx = call i64 @llvm.vector.reduce.umax.v4i64(<4 x i64> %v)			%rdx = call i64 @llvm.vector.reduce.umax.v4i64(<4 x i64> %v)
	%res = call i64 @llvm.umax.i64(i64 %rdx, i64 8)			%res = call i64 @llvm.umax.i64(i64 %rdx, i64 8)
	ret i64 %res			ret i64 %res
	}			}

	define i64 @reduce_umin(i64 %x, <4 x i64> %v) {			define i64 @reduce_umin(i64 %x, <4 x i64> %v) {
	; CHECK-LABEL: reduce_umin:			; CHECK-LABEL: reduce_umin:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v10, a0			; CHECK-NEXT: vmv.s.x v10, a0
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; CHECK-NEXT: vredminu.vs v8, v8, v10			; CHECK-NEXT: vredminu.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%rdx = call i64 @llvm.vector.reduce.umin.v4i64(<4 x i64> %v)			%rdx = call i64 @llvm.vector.reduce.umin.v4i64(<4 x i64> %v)
	%res = call i64 @llvm.umin.i64(i64 %rdx, i64 %x)			%res = call i64 @llvm.umin.i64(i64 %rdx, i64 %x)
	ret i64 %res			ret i64 %res
	}			}

	define i64 @reduce_umin2(<4 x i64> %v) {			define i64 @reduce_umin2(<4 x i64> %v) {
	; CHECK-LABEL: reduce_umin2:			; CHECK-LABEL: reduce_umin2:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v10, 8			; CHECK-NEXT: vmv.v.i v10, 8
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; CHECK-NEXT: vredminu.vs v8, v8, v10			; CHECK-NEXT: vredminu.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%rdx = call i64 @llvm.vector.reduce.umin.v4i64(<4 x i64> %v)			%rdx = call i64 @llvm.vector.reduce.umin.v4i64(<4 x i64> %v)
	%res = call i64 @llvm.umin.i64(i64 %rdx, i64 8)			%res = call i64 @llvm.umin.i64(i64 %rdx, i64 8)
	ret i64 %res			ret i64 %res
	}			}

	define i64 @reduce_smax(i64 %x, <4 x i64> %v) {			define i64 @reduce_smax(i64 %x, <4 x i64> %v) {
	; CHECK-LABEL: reduce_smax:			; CHECK-LABEL: reduce_smax:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v10, a0			; CHECK-NEXT: vmv.s.x v10, a0
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; CHECK-NEXT: vredmax.vs v8, v8, v10			; CHECK-NEXT: vredmax.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%rdx = call i64 @llvm.vector.reduce.smax.v4i64(<4 x i64> %v)			%rdx = call i64 @llvm.vector.reduce.smax.v4i64(<4 x i64> %v)
	%res = call i64 @llvm.smax.i64(i64 %rdx, i64 %x)			%res = call i64 @llvm.smax.i64(i64 %rdx, i64 %x)
	ret i64 %res			ret i64 %res
	}			}

	define i64 @reduce_smax2(<4 x i64> %v) {			define i64 @reduce_smax2(<4 x i64> %v) {
	; CHECK-LABEL: reduce_smax2:			; CHECK-LABEL: reduce_smax2:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v10, 8			; CHECK-NEXT: vmv.v.i v10, 8
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; CHECK-NEXT: vredmax.vs v8, v8, v10			; CHECK-NEXT: vredmax.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%rdx = call i64 @llvm.vector.reduce.smax.v4i64(<4 x i64> %v)			%rdx = call i64 @llvm.vector.reduce.smax.v4i64(<4 x i64> %v)
	%res = call i64 @llvm.smax.i64(i64 %rdx, i64 8)			%res = call i64 @llvm.smax.i64(i64 %rdx, i64 8)
	ret i64 %res			ret i64 %res
	}			}

	define i64 @reduce_smin(i64 %x, <4 x i64> %v) {			define i64 @reduce_smin(i64 %x, <4 x i64> %v) {
	; CHECK-LABEL: reduce_smin:			; CHECK-LABEL: reduce_smin:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v10, a0			; CHECK-NEXT: vmv.s.x v10, a0
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; CHECK-NEXT: vredmin.vs v8, v8, v10			; CHECK-NEXT: vredmin.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%rdx = call i64 @llvm.vector.reduce.smin.v4i64(<4 x i64> %v)			%rdx = call i64 @llvm.vector.reduce.smin.v4i64(<4 x i64> %v)
	%res = call i64 @llvm.smin.i64(i64 %rdx, i64 %x)			%res = call i64 @llvm.smin.i64(i64 %rdx, i64 %x)
	ret i64 %res			ret i64 %res
	}			}

	define i64 @reduce_smin2(<4 x i64> %v) {			define i64 @reduce_smin2(<4 x i64> %v) {
	; CHECK-LABEL: reduce_smin2:			; CHECK-LABEL: reduce_smin2:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v10, 8			; CHECK-NEXT: vmv.v.i v10, 8
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; CHECK-NEXT: vredmin.vs v8, v8, v10			; CHECK-NEXT: vredmin.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%rdx = call i64 @llvm.vector.reduce.smin.v4i64(<4 x i64> %v)			%rdx = call i64 @llvm.vector.reduce.smin.v4i64(<4 x i64> %v)
	%res = call i64 @llvm.smin.i64(i64 %rdx, i64 8)			%res = call i64 @llvm.smin.i64(i64 %rdx, i64 8)
	ret i64 %res			ret i64 %res
	}			}

	define float @reduce_fadd(float %x, <4 x float> %v) {			define float @reduce_fadd(float %x, <4 x float> %v) {
	; CHECK-LABEL: reduce_fadd:			; CHECK-LABEL: reduce_fadd:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vfredusum.vs v8, v8, v9			; CHECK-NEXT: vfredusum.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%rdx = call fast float @llvm.vector.reduce.fadd.v4f32(float %x, <4 x float> %v)			%rdx = call fast float @llvm.vector.reduce.fadd.v4f32(float %x, <4 x float> %v)
	ret float %rdx			ret float %rdx
	}			}

	define float @reduce_fadd2(float %x, <4 x float> %v) {			define float @reduce_fadd2(float %x, <4 x float> %v) {
	; CHECK-LABEL: reduce_fadd2:			; CHECK-LABEL: reduce_fadd2:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vfredusum.vs v8, v8, v9			; CHECK-NEXT: vfredusum.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%rdx = call fast float @llvm.vector.reduce.fadd.v4f32(float 0.0, <4 x float> %v)			%rdx = call fast float @llvm.vector.reduce.fadd.v4f32(float 0.0, <4 x float> %v)
	%res = fadd fast float %rdx, %x			%res = fadd fast float %rdx, %x
	ret float %res			ret float %res
	}			}

	define float @reduce_fmax(float %x, <4 x float> %v) {			define float @reduce_fmax(float %x, <4 x float> %v) {
	; CHECK-LABEL: reduce_fmax:			; CHECK-LABEL: reduce_fmax:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vfredmax.vs v8, v8, v9			; CHECK-NEXT: vfredmax.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%rdx = call float @llvm.vector.reduce.fmax.v4f32(<4 x float> %v)			%rdx = call float @llvm.vector.reduce.fmax.v4f32(<4 x float> %v)
	%res = call float @llvm.maxnum.f32(float %x, float %rdx)			%res = call float @llvm.maxnum.f32(float %x, float %rdx)
	ret float %res			ret float %res
	}			}

	define float @reduce_fmin(float %x, <4 x float> %v) {			define float @reduce_fmin(float %x, <4 x float> %v) {
	; CHECK-LABEL: reduce_fmin:			; CHECK-LABEL: reduce_fmin:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vfredmin.vs v8, v8, v9			; CHECK-NEXT: vfredmin.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%rdx = call float @llvm.vector.reduce.fmin.v4f32(<4 x float> %v)			%rdx = call float @llvm.vector.reduce.fmin.v4f32(<4 x float> %v)
	%res = call float @llvm.minnum.f32(float %x, float %rdx)			%res = call float @llvm.minnum.f32(float %x, float %rdx)
	ret float %res			ret float %res
	}			}
	Show All 19 Lines

llvm/test/CodeGen/RISCV/rvv/vreductions-fp-sdnode.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=riscv32 -mattr=+d,+zfh,+experimental-zvfh,+v,+m -target-abi=ilp32d \			; RUN: llc -mtriple=riscv32 -mattr=+d,+zfh,+experimental-zvfh,+v,+m -target-abi=ilp32d \
	; RUN: -verify-machineinstrs < %s \| FileCheck %s			; RUN: -verify-machineinstrs < %s \| FileCheck %s
	; RUN: llc -mtriple=riscv64 -mattr=+d,+zfh,+experimental-zvfh,+v,+m -target-abi=lp64d \			; RUN: llc -mtriple=riscv64 -mattr=+d,+zfh,+experimental-zvfh,+v,+m -target-abi=lp64d \
	; RUN: -verify-machineinstrs < %s \| FileCheck %s			; RUN: -verify-machineinstrs < %s \| FileCheck %s

	declare half @llvm.vector.reduce.fadd.nxv1f16(half, <vscale x 1 x half>)			declare half @llvm.vector.reduce.fadd.nxv1f16(half, <vscale x 1 x half>)

	define half @vreduce_fadd_nxv1f16(<vscale x 1 x half> %v, half %s) {			define half @vreduce_fadd_nxv1f16(<vscale x 1 x half> %v, half %s) {
	; CHECK-LABEL: vreduce_fadd_nxv1f16:			; CHECK-LABEL: vreduce_fadd_nxv1f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vfredusum.vs v8, v8, v9			; CHECK-NEXT: vfredusum.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call reassoc half @llvm.vector.reduce.fadd.nxv1f16(half %s, <vscale x 1 x half> %v)			%red = call reassoc half @llvm.vector.reduce.fadd.nxv1f16(half %s, <vscale x 1 x half> %v)
	ret half %red			ret half %red
	}			}

	define half @vreduce_ord_fadd_nxv1f16(<vscale x 1 x half> %v, half %s) {			define half @vreduce_ord_fadd_nxv1f16(<vscale x 1 x half> %v, half %s) {
	; CHECK-LABEL: vreduce_ord_fadd_nxv1f16:			; CHECK-LABEL: vreduce_ord_fadd_nxv1f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vfredosum.vs v8, v8, v9			; CHECK-NEXT: vfredosum.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call half @llvm.vector.reduce.fadd.nxv1f16(half %s, <vscale x 1 x half> %v)			%red = call half @llvm.vector.reduce.fadd.nxv1f16(half %s, <vscale x 1 x half> %v)
	ret half %red			ret half %red
	}			}

	declare half @llvm.vector.reduce.fadd.nxv2f16(half, <vscale x 2 x half>)			declare half @llvm.vector.reduce.fadd.nxv2f16(half, <vscale x 2 x half>)

	define half @vreduce_fadd_nxv2f16(<vscale x 2 x half> %v, half %s) {			define half @vreduce_fadd_nxv2f16(<vscale x 2 x half> %v, half %s) {
	; CHECK-LABEL: vreduce_fadd_nxv2f16:			; CHECK-LABEL: vreduce_fadd_nxv2f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vfredusum.vs v8, v8, v9			; CHECK-NEXT: vfredusum.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call reassoc half @llvm.vector.reduce.fadd.nxv2f16(half %s, <vscale x 2 x half> %v)			%red = call reassoc half @llvm.vector.reduce.fadd.nxv2f16(half %s, <vscale x 2 x half> %v)
	ret half %red			ret half %red
	}			}

	define half @vreduce_ord_fadd_nxv2f16(<vscale x 2 x half> %v, half %s) {			define half @vreduce_ord_fadd_nxv2f16(<vscale x 2 x half> %v, half %s) {
	; CHECK-LABEL: vreduce_ord_fadd_nxv2f16:			; CHECK-LABEL: vreduce_ord_fadd_nxv2f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vfredosum.vs v8, v8, v9			; CHECK-NEXT: vfredosum.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call half @llvm.vector.reduce.fadd.nxv2f16(half %s, <vscale x 2 x half> %v)			%red = call half @llvm.vector.reduce.fadd.nxv2f16(half %s, <vscale x 2 x half> %v)
	ret half %red			ret half %red
	}			}

	declare half @llvm.vector.reduce.fadd.nxv4f16(half, <vscale x 4 x half>)			declare half @llvm.vector.reduce.fadd.nxv4f16(half, <vscale x 4 x half>)

	define half @vreduce_fadd_nxv4f16(<vscale x 4 x half> %v, half %s) {			define half @vreduce_fadd_nxv4f16(<vscale x 4 x half> %v, half %s) {
	; CHECK-LABEL: vreduce_fadd_nxv4f16:			; CHECK-LABEL: vreduce_fadd_nxv4f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vfredusum.vs v8, v8, v9			; CHECK-NEXT: vfredusum.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call reassoc half @llvm.vector.reduce.fadd.nxv4f16(half %s, <vscale x 4 x half> %v)			%red = call reassoc half @llvm.vector.reduce.fadd.nxv4f16(half %s, <vscale x 4 x half> %v)
	ret half %red			ret half %red
	}			}

	define half @vreduce_ord_fadd_nxv4f16(<vscale x 4 x half> %v, half %s) {			define half @vreduce_ord_fadd_nxv4f16(<vscale x 4 x half> %v, half %s) {
	; CHECK-LABEL: vreduce_ord_fadd_nxv4f16:			; CHECK-LABEL: vreduce_ord_fadd_nxv4f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vfredosum.vs v8, v8, v9			; CHECK-NEXT: vfredosum.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call half @llvm.vector.reduce.fadd.nxv4f16(half %s, <vscale x 4 x half> %v)			%red = call half @llvm.vector.reduce.fadd.nxv4f16(half %s, <vscale x 4 x half> %v)
	ret half %red			ret half %red
	}			}

	declare float @llvm.vector.reduce.fadd.nxv1f32(float, <vscale x 1 x float>)			declare float @llvm.vector.reduce.fadd.nxv1f32(float, <vscale x 1 x float>)

	define float @vreduce_fadd_nxv1f32(<vscale x 1 x float> %v, float %s) {			define float @vreduce_fadd_nxv1f32(<vscale x 1 x float> %v, float %s) {
	; CHECK-LABEL: vreduce_fadd_nxv1f32:			; CHECK-LABEL: vreduce_fadd_nxv1f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vfredusum.vs v8, v8, v9			; CHECK-NEXT: vfredusum.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call reassoc float @llvm.vector.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %v)			%red = call reassoc float @llvm.vector.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %v)
	ret float %red			ret float %red
	}			}

	define float @vreduce_ord_fadd_nxv1f32(<vscale x 1 x float> %v, float %s) {			define float @vreduce_ord_fadd_nxv1f32(<vscale x 1 x float> %v, float %s) {
	; CHECK-LABEL: vreduce_ord_fadd_nxv1f32:			; CHECK-LABEL: vreduce_ord_fadd_nxv1f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vfredosum.vs v8, v8, v9			; CHECK-NEXT: vfredosum.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call float @llvm.vector.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %v)			%red = call float @llvm.vector.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %v)
	ret float %red			ret float %red
	}			}

	define float @vreduce_fwadd_nxv1f32(<vscale x 1 x half> %v, float %s) {			define float @vreduce_fwadd_nxv1f32(<vscale x 1 x half> %v, float %s) {
	; CHECK-LABEL: vreduce_fwadd_nxv1f32:			; CHECK-LABEL: vreduce_fwadd_nxv1f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0			; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, ma
	; CHECK-NEXT: vfwredusum.vs v8, v8, v9			; CHECK-NEXT: vfwredusum.vs v8, v8, v9
	; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = fpext <vscale x 1 x half> %v to <vscale x 1 x float>			%e = fpext <vscale x 1 x half> %v to <vscale x 1 x float>
	%red = call reassoc float @llvm.vector.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %e)			%red = call reassoc float @llvm.vector.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %e)
	ret float %red			ret float %red
	}			}

	define float @vreduce_ord_fwadd_nxv1f32(<vscale x 1 x half> %v, float %s) {			define float @vreduce_ord_fwadd_nxv1f32(<vscale x 1 x half> %v, float %s) {
	; CHECK-LABEL: vreduce_ord_fwadd_nxv1f32:			; CHECK-LABEL: vreduce_ord_fwadd_nxv1f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0			; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, ma
	; CHECK-NEXT: vfwredosum.vs v8, v8, v9			; CHECK-NEXT: vfwredosum.vs v8, v8, v9
	; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = fpext <vscale x 1 x half> %v to <vscale x 1 x float>			%e = fpext <vscale x 1 x half> %v to <vscale x 1 x float>
	%red = call float @llvm.vector.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %e)			%red = call float @llvm.vector.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %e)
	ret float %red			ret float %red
	}			}

	declare float @llvm.vector.reduce.fadd.nxv2f32(float, <vscale x 2 x float>)			declare float @llvm.vector.reduce.fadd.nxv2f32(float, <vscale x 2 x float>)

	define float @vreduce_fadd_nxv2f32(<vscale x 2 x float> %v, float %s) {			define float @vreduce_fadd_nxv2f32(<vscale x 2 x float> %v, float %s) {
	; CHECK-LABEL: vreduce_fadd_nxv2f32:			; CHECK-LABEL: vreduce_fadd_nxv2f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vfredusum.vs v8, v8, v9			; CHECK-NEXT: vfredusum.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call reassoc float @llvm.vector.reduce.fadd.nxv2f32(float %s, <vscale x 2 x float> %v)			%red = call reassoc float @llvm.vector.reduce.fadd.nxv2f32(float %s, <vscale x 2 x float> %v)
	ret float %red			ret float %red
	}			}

	define float @vreduce_ord_fadd_nxv2f32(<vscale x 2 x float> %v, float %s) {			define float @vreduce_ord_fadd_nxv2f32(<vscale x 2 x float> %v, float %s) {
	; CHECK-LABEL: vreduce_ord_fadd_nxv2f32:			; CHECK-LABEL: vreduce_ord_fadd_nxv2f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vfredosum.vs v8, v8, v9			; CHECK-NEXT: vfredosum.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call float @llvm.vector.reduce.fadd.nxv2f32(float %s, <vscale x 2 x float> %v)			%red = call float @llvm.vector.reduce.fadd.nxv2f32(float %s, <vscale x 2 x float> %v)
	ret float %red			ret float %red
	}			}

	define float @vreduce_fwadd_nxv2f32(<vscale x 2 x half> %v, float %s) {			define float @vreduce_fwadd_nxv2f32(<vscale x 2 x half> %v, float %s) {
	; CHECK-LABEL: vreduce_fwadd_nxv2f32:			; CHECK-LABEL: vreduce_fwadd_nxv2f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0			; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, ma
	; CHECK-NEXT: vfwredusum.vs v8, v8, v9			; CHECK-NEXT: vfwredusum.vs v8, v8, v9
	; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = fpext <vscale x 2 x half> %v to <vscale x 2 x float>			%e = fpext <vscale x 2 x half> %v to <vscale x 2 x float>
	%red = call reassoc float @llvm.vector.reduce.fadd.nxv2f32(float %s, <vscale x 2 x float> %e)			%red = call reassoc float @llvm.vector.reduce.fadd.nxv2f32(float %s, <vscale x 2 x float> %e)
	ret float %red			ret float %red
	}			}

	define float @vreduce_ord_fwadd_nxv2f32(<vscale x 2 x half> %v, float %s) {			define float @vreduce_ord_fwadd_nxv2f32(<vscale x 2 x half> %v, float %s) {
	; CHECK-LABEL: vreduce_ord_fwadd_nxv2f32:			; CHECK-LABEL: vreduce_ord_fwadd_nxv2f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0			; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, ma
	; CHECK-NEXT: vfwredosum.vs v8, v8, v9			; CHECK-NEXT: vfwredosum.vs v8, v8, v9
	; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = fpext <vscale x 2 x half> %v to <vscale x 2 x float>			%e = fpext <vscale x 2 x half> %v to <vscale x 2 x float>
	%red = call float @llvm.vector.reduce.fadd.nxv2f32(float %s, <vscale x 2 x float> %e)			%red = call float @llvm.vector.reduce.fadd.nxv2f32(float %s, <vscale x 2 x float> %e)
	ret float %red			ret float %red
	}			}

	declare float @llvm.vector.reduce.fadd.nxv4f32(float, <vscale x 4 x float>)			declare float @llvm.vector.reduce.fadd.nxv4f32(float, <vscale x 4 x float>)

	define float @vreduce_fadd_nxv4f32(<vscale x 4 x float> %v, float %s) {			define float @vreduce_fadd_nxv4f32(<vscale x 4 x float> %v, float %s) {
	; CHECK-LABEL: vreduce_fadd_nxv4f32:			; CHECK-LABEL: vreduce_fadd_nxv4f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v10, fa0			; CHECK-NEXT: vfmv.s.f v10, fa0
	; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma
	; CHECK-NEXT: vfredusum.vs v8, v8, v10			; CHECK-NEXT: vfredusum.vs v8, v8, v10
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call reassoc float @llvm.vector.reduce.fadd.nxv4f32(float %s, <vscale x 4 x float> %v)			%red = call reassoc float @llvm.vector.reduce.fadd.nxv4f32(float %s, <vscale x 4 x float> %v)
	ret float %red			ret float %red
	}			}

	define float @vreduce_ord_fadd_nxv4f32(<vscale x 4 x float> %v, float %s) {			define float @vreduce_ord_fadd_nxv4f32(<vscale x 4 x float> %v, float %s) {
	; CHECK-LABEL: vreduce_ord_fadd_nxv4f32:			; CHECK-LABEL: vreduce_ord_fadd_nxv4f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v10, fa0			; CHECK-NEXT: vfmv.s.f v10, fa0
	; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma
	; CHECK-NEXT: vfredosum.vs v8, v8, v10			; CHECK-NEXT: vfredosum.vs v8, v8, v10
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call float @llvm.vector.reduce.fadd.nxv4f32(float %s, <vscale x 4 x float> %v)			%red = call float @llvm.vector.reduce.fadd.nxv4f32(float %s, <vscale x 4 x float> %v)
	ret float %red			ret float %red
	}			}

	define float @vreduce_fwadd_nxv4f32(<vscale x 4 x half> %v, float %s) {			define float @vreduce_fwadd_nxv4f32(<vscale x 4 x half> %v, float %s) {
	; CHECK-LABEL: vreduce_fwadd_nxv4f32:			; CHECK-LABEL: vreduce_fwadd_nxv4f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0			; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
	; CHECK-NEXT: vfwredusum.vs v8, v8, v9			; CHECK-NEXT: vfwredusum.vs v8, v8, v9
	; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = fpext <vscale x 4 x half> %v to <vscale x 4 x float>			%e = fpext <vscale x 4 x half> %v to <vscale x 4 x float>
	%red = call reassoc float @llvm.vector.reduce.fadd.nxv4f32(float %s, <vscale x 4 x float> %e)			%red = call reassoc float @llvm.vector.reduce.fadd.nxv4f32(float %s, <vscale x 4 x float> %e)
	ret float %red			ret float %red
	}			}

	define float @vreduce_ord_fwadd_nxv4f32(<vscale x 4 x half> %v, float %s) {			define float @vreduce_ord_fwadd_nxv4f32(<vscale x 4 x half> %v, float %s) {
	; CHECK-LABEL: vreduce_ord_fwadd_nxv4f32:			; CHECK-LABEL: vreduce_ord_fwadd_nxv4f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0			; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
	; CHECK-NEXT: vfwredosum.vs v8, v8, v9			; CHECK-NEXT: vfwredosum.vs v8, v8, v9
	; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = fpext <vscale x 4 x half> %v to <vscale x 4 x float>			%e = fpext <vscale x 4 x half> %v to <vscale x 4 x float>
	%red = call float @llvm.vector.reduce.fadd.nxv4f32(float %s, <vscale x 4 x float> %e)			%red = call float @llvm.vector.reduce.fadd.nxv4f32(float %s, <vscale x 4 x float> %e)
	ret float %red			ret float %red
	}			}

	declare double @llvm.vector.reduce.fadd.nxv1f64(double, <vscale x 1 x double>)			declare double @llvm.vector.reduce.fadd.nxv1f64(double, <vscale x 1 x double>)

	define double @vreduce_fadd_nxv1f64(<vscale x 1 x double> %v, double %s) {			define double @vreduce_fadd_nxv1f64(<vscale x 1 x double> %v, double %s) {
	; CHECK-LABEL: vreduce_fadd_nxv1f64:			; CHECK-LABEL: vreduce_fadd_nxv1f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vfredusum.vs v8, v8, v9			; CHECK-NEXT: vfredusum.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call reassoc double @llvm.vector.reduce.fadd.nxv1f64(double %s, <vscale x 1 x double> %v)			%red = call reassoc double @llvm.vector.reduce.fadd.nxv1f64(double %s, <vscale x 1 x double> %v)
	ret double %red			ret double %red
	}			}

	define double @vreduce_ord_fadd_nxv1f64(<vscale x 1 x double> %v, double %s) {			define double @vreduce_ord_fadd_nxv1f64(<vscale x 1 x double> %v, double %s) {
	; CHECK-LABEL: vreduce_ord_fadd_nxv1f64:			; CHECK-LABEL: vreduce_ord_fadd_nxv1f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vfredosum.vs v8, v8, v9			; CHECK-NEXT: vfredosum.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call double @llvm.vector.reduce.fadd.nxv1f64(double %s, <vscale x 1 x double> %v)			%red = call double @llvm.vector.reduce.fadd.nxv1f64(double %s, <vscale x 1 x double> %v)
	ret double %red			ret double %red
	}			}

	define double @vreduce_fwadd_nxv1f64(<vscale x 1 x float> %v, double %s) {			define double @vreduce_fwadd_nxv1f64(<vscale x 1 x float> %v, double %s) {
	; CHECK-LABEL: vreduce_fwadd_nxv1f64:			; CHECK-LABEL: vreduce_fwadd_nxv1f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0			; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, ma
	; CHECK-NEXT: vfwredusum.vs v8, v8, v9			; CHECK-NEXT: vfwredusum.vs v8, v8, v9
	; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, ma
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = fpext <vscale x 1 x float> %v to <vscale x 1 x double>			%e = fpext <vscale x 1 x float> %v to <vscale x 1 x double>
	%red = call reassoc double @llvm.vector.reduce.fadd.nxv1f64(double %s, <vscale x 1 x double> %e)			%red = call reassoc double @llvm.vector.reduce.fadd.nxv1f64(double %s, <vscale x 1 x double> %e)
	ret double %red			ret double %red
	}			}

	define double @vreduce_ord_fwadd_nxv1f64(<vscale x 1 x float> %v, double %s) {			define double @vreduce_ord_fwadd_nxv1f64(<vscale x 1 x float> %v, double %s) {
	; CHECK-LABEL: vreduce_ord_fwadd_nxv1f64:			; CHECK-LABEL: vreduce_ord_fwadd_nxv1f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0			; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, ma
	; CHECK-NEXT: vfwredosum.vs v8, v8, v9			; CHECK-NEXT: vfwredosum.vs v8, v8, v9
	; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, ma
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = fpext <vscale x 1 x float> %v to <vscale x 1 x double>			%e = fpext <vscale x 1 x float> %v to <vscale x 1 x double>
	%red = call double @llvm.vector.reduce.fadd.nxv1f64(double %s, <vscale x 1 x double> %e)			%red = call double @llvm.vector.reduce.fadd.nxv1f64(double %s, <vscale x 1 x double> %e)
	ret double %red			ret double %red
	}			}

	declare double @llvm.vector.reduce.fadd.nxv2f64(double, <vscale x 2 x double>)			declare double @llvm.vector.reduce.fadd.nxv2f64(double, <vscale x 2 x double>)

	define double @vreduce_fadd_nxv2f64(<vscale x 2 x double> %v, double %s) {			define double @vreduce_fadd_nxv2f64(<vscale x 2 x double> %v, double %s) {
	; CHECK-LABEL: vreduce_fadd_nxv2f64:			; CHECK-LABEL: vreduce_fadd_nxv2f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v10, fa0			; CHECK-NEXT: vfmv.s.f v10, fa0
	; CHECK-NEXT: vsetvli a0, zero, e64, m2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m2, ta, ma
	; CHECK-NEXT: vfredusum.vs v8, v8, v10			; CHECK-NEXT: vfredusum.vs v8, v8, v10
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call reassoc double @llvm.vector.reduce.fadd.nxv2f64(double %s, <vscale x 2 x double> %v)			%red = call reassoc double @llvm.vector.reduce.fadd.nxv2f64(double %s, <vscale x 2 x double> %v)
	ret double %red			ret double %red
	}			}

	define double @vreduce_ord_fadd_nxv2f64(<vscale x 2 x double> %v, double %s) {			define double @vreduce_ord_fadd_nxv2f64(<vscale x 2 x double> %v, double %s) {
	; CHECK-LABEL: vreduce_ord_fadd_nxv2f64:			; CHECK-LABEL: vreduce_ord_fadd_nxv2f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v10, fa0			; CHECK-NEXT: vfmv.s.f v10, fa0
	; CHECK-NEXT: vsetvli a0, zero, e64, m2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m2, ta, ma
	; CHECK-NEXT: vfredosum.vs v8, v8, v10			; CHECK-NEXT: vfredosum.vs v8, v8, v10
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call double @llvm.vector.reduce.fadd.nxv2f64(double %s, <vscale x 2 x double> %v)			%red = call double @llvm.vector.reduce.fadd.nxv2f64(double %s, <vscale x 2 x double> %v)
	ret double %red			ret double %red
	}			}

	define double @vreduce_fwadd_nxv2f64(<vscale x 2 x float> %v, double %s) {			define double @vreduce_fwadd_nxv2f64(<vscale x 2 x float> %v, double %s) {
	; CHECK-LABEL: vreduce_fwadd_nxv2f64:			; CHECK-LABEL: vreduce_fwadd_nxv2f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0			; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vfwredusum.vs v8, v8, v9			; CHECK-NEXT: vfwredusum.vs v8, v8, v9
	; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = fpext <vscale x 2 x float> %v to <vscale x 2 x double>			%e = fpext <vscale x 2 x float> %v to <vscale x 2 x double>
	%red = call reassoc double @llvm.vector.reduce.fadd.nxv2f64(double %s, <vscale x 2 x double> %e)			%red = call reassoc double @llvm.vector.reduce.fadd.nxv2f64(double %s, <vscale x 2 x double> %e)
	ret double %red			ret double %red
	}			}

	define double @vreduce_ord_fwadd_nxv2f64(<vscale x 2 x float> %v, double %s) {			define double @vreduce_ord_fwadd_nxv2f64(<vscale x 2 x float> %v, double %s) {
	; CHECK-LABEL: vreduce_ord_fwadd_nxv2f64:			; CHECK-LABEL: vreduce_ord_fwadd_nxv2f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0			; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vfwredosum.vs v8, v8, v9			; CHECK-NEXT: vfwredosum.vs v8, v8, v9
	; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = fpext <vscale x 2 x float> %v to <vscale x 2 x double>			%e = fpext <vscale x 2 x float> %v to <vscale x 2 x double>
	%red = call double @llvm.vector.reduce.fadd.nxv2f64(double %s, <vscale x 2 x double> %e)			%red = call double @llvm.vector.reduce.fadd.nxv2f64(double %s, <vscale x 2 x double> %e)
	ret double %red			ret double %red
	}			}

	declare double @llvm.vector.reduce.fadd.nxv4f64(double, <vscale x 4 x double>)			declare double @llvm.vector.reduce.fadd.nxv4f64(double, <vscale x 4 x double>)

	define double @vreduce_fadd_nxv4f64(<vscale x 4 x double> %v, double %s) {			define double @vreduce_fadd_nxv4f64(<vscale x 4 x double> %v, double %s) {
	; CHECK-LABEL: vreduce_fadd_nxv4f64:			; CHECK-LABEL: vreduce_fadd_nxv4f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v12, fa0			; CHECK-NEXT: vfmv.s.f v12, fa0
	; CHECK-NEXT: vsetvli a0, zero, e64, m4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m4, ta, ma
	; CHECK-NEXT: vfredusum.vs v8, v8, v12			; CHECK-NEXT: vfredusum.vs v8, v8, v12
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call reassoc double @llvm.vector.reduce.fadd.nxv4f64(double %s, <vscale x 4 x double> %v)			%red = call reassoc double @llvm.vector.reduce.fadd.nxv4f64(double %s, <vscale x 4 x double> %v)
	ret double %red			ret double %red
	}			}

	define double @vreduce_ord_fadd_nxv4f64(<vscale x 4 x double> %v, double %s) {			define double @vreduce_ord_fadd_nxv4f64(<vscale x 4 x double> %v, double %s) {
	; CHECK-LABEL: vreduce_ord_fadd_nxv4f64:			; CHECK-LABEL: vreduce_ord_fadd_nxv4f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v12, fa0			; CHECK-NEXT: vfmv.s.f v12, fa0
	; CHECK-NEXT: vsetvli a0, zero, e64, m4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m4, ta, ma
	; CHECK-NEXT: vfredosum.vs v8, v8, v12			; CHECK-NEXT: vfredosum.vs v8, v8, v12
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call double @llvm.vector.reduce.fadd.nxv4f64(double %s, <vscale x 4 x double> %v)			%red = call double @llvm.vector.reduce.fadd.nxv4f64(double %s, <vscale x 4 x double> %v)
	ret double %red			ret double %red
	}			}

	define double @vreduce_fwadd_nxv4f64(<vscale x 4 x float> %v, double %s) {			define double @vreduce_fwadd_nxv4f64(<vscale x 4 x float> %v, double %s) {
	; CHECK-LABEL: vreduce_fwadd_nxv4f64:			; CHECK-LABEL: vreduce_fwadd_nxv4f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v10, fa0			; CHECK-NEXT: vfmv.s.f v10, fa0
	; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma
	; CHECK-NEXT: vfwredusum.vs v8, v8, v10			; CHECK-NEXT: vfwredusum.vs v8, v8, v10
	; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = fpext <vscale x 4 x float> %v to <vscale x 4 x double>			%e = fpext <vscale x 4 x float> %v to <vscale x 4 x double>
	%red = call reassoc double @llvm.vector.reduce.fadd.nxv4f64(double %s, <vscale x 4 x double> %e)			%red = call reassoc double @llvm.vector.reduce.fadd.nxv4f64(double %s, <vscale x 4 x double> %e)
	ret double %red			ret double %red
	}			}

	define double @vreduce_ord_fwadd_nxv4f64(<vscale x 4 x float> %v, double %s) {			define double @vreduce_ord_fwadd_nxv4f64(<vscale x 4 x float> %v, double %s) {
	; CHECK-LABEL: vreduce_ord_fwadd_nxv4f64:			; CHECK-LABEL: vreduce_ord_fwadd_nxv4f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v10, fa0			; CHECK-NEXT: vfmv.s.f v10, fa0
	; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma
	; CHECK-NEXT: vfwredosum.vs v8, v8, v10			; CHECK-NEXT: vfwredosum.vs v8, v8, v10
	; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e64, m1, ta, ma
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = fpext <vscale x 4 x float> %v to <vscale x 4 x double>			%e = fpext <vscale x 4 x float> %v to <vscale x 4 x double>
	%red = call double @llvm.vector.reduce.fadd.nxv4f64(double %s, <vscale x 4 x double> %e)			%red = call double @llvm.vector.reduce.fadd.nxv4f64(double %s, <vscale x 4 x double> %e)
	ret double %red			ret double %red
	}			}

	declare half @llvm.vector.reduce.fmin.nxv1f16(<vscale x 1 x half>)			declare half @llvm.vector.reduce.fmin.nxv1f16(<vscale x 1 x half>)

	define half @vreduce_fmin_nxv1f16(<vscale x 1 x half> %v) {			define half @vreduce_fmin_nxv1f16(<vscale x 1 x half> %v) {
	; CHECK-LABEL: vreduce_fmin_nxv1f16:			; CHECK-LABEL: vreduce_fmin_nxv1f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI30_0)			; CHECK-NEXT: lui a0, %hi(.LCPI30_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI30_0)			; CHECK-NEXT: flh ft0, %lo(.LCPI30_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma
	; CHECK-NEXT: vlse16.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmin.vs v8, v8, v9			; CHECK-NEXT: vfredmin.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call half @llvm.vector.reduce.fmin.nxv1f16(<vscale x 1 x half> %v)			%red = call half @llvm.vector.reduce.fmin.nxv1f16(<vscale x 1 x half> %v)
	ret half %red			ret half %red
	}			}

	define half @vreduce_fmin_nxv1f16_nonans(<vscale x 1 x half> %v) #0 {			define half @vreduce_fmin_nxv1f16_nonans(<vscale x 1 x half> %v) #0 {
	; CHECK-LABEL: vreduce_fmin_nxv1f16_nonans:			; CHECK-LABEL: vreduce_fmin_nxv1f16_nonans:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI31_0)			; CHECK-NEXT: lui a0, %hi(.LCPI31_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI31_0)			; CHECK-NEXT: flh ft0, %lo(.LCPI31_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma
	; CHECK-NEXT: vlse16.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmin.vs v8, v8, v9			; CHECK-NEXT: vfredmin.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call nnan half @llvm.vector.reduce.fmin.nxv1f16(<vscale x 1 x half> %v)			%red = call nnan half @llvm.vector.reduce.fmin.nxv1f16(<vscale x 1 x half> %v)
	ret half %red			ret half %red
	}			}

	define half @vreduce_fmin_nxv1f16_nonans_noinfs(<vscale x 1 x half> %v) #1 {			define half @vreduce_fmin_nxv1f16_nonans_noinfs(<vscale x 1 x half> %v) #1 {
	; CHECK-LABEL: vreduce_fmin_nxv1f16_nonans_noinfs:			; CHECK-LABEL: vreduce_fmin_nxv1f16_nonans_noinfs:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI32_0)			; CHECK-NEXT: lui a0, %hi(.LCPI32_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI32_0)			; CHECK-NEXT: flh ft0, %lo(.LCPI32_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma
	; CHECK-NEXT: vlse16.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmin.vs v8, v8, v9			; CHECK-NEXT: vfredmin.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call nnan ninf half @llvm.vector.reduce.fmin.nxv1f16(<vscale x 1 x half> %v)			%red = call nnan ninf half @llvm.vector.reduce.fmin.nxv1f16(<vscale x 1 x half> %v)
	ret half %red			ret half %red
	}			}

	declare half @llvm.vector.reduce.fmin.nxv2f16(<vscale x 2 x half>)			declare half @llvm.vector.reduce.fmin.nxv2f16(<vscale x 2 x half>)

	define half @vreduce_fmin_nxv2f16(<vscale x 2 x half> %v) {			define half @vreduce_fmin_nxv2f16(<vscale x 2 x half> %v) {
	; CHECK-LABEL: vreduce_fmin_nxv2f16:			; CHECK-LABEL: vreduce_fmin_nxv2f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI33_0)			; CHECK-NEXT: lui a0, %hi(.LCPI33_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI33_0)			; CHECK-NEXT: flh ft0, %lo(.LCPI33_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; CHECK-NEXT: vlse16.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmin.vs v8, v8, v9			; CHECK-NEXT: vfredmin.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call half @llvm.vector.reduce.fmin.nxv2f16(<vscale x 2 x half> %v)			%red = call half @llvm.vector.reduce.fmin.nxv2f16(<vscale x 2 x half> %v)
	ret half %red			ret half %red
	}			}

	declare half @llvm.vector.reduce.fmin.nxv4f16(<vscale x 4 x half>)			declare half @llvm.vector.reduce.fmin.nxv4f16(<vscale x 4 x half>)

	define half @vreduce_fmin_nxv4f16(<vscale x 4 x half> %v) {			define half @vreduce_fmin_nxv4f16(<vscale x 4 x half> %v) {
	; CHECK-LABEL: vreduce_fmin_nxv4f16:			; CHECK-LABEL: vreduce_fmin_nxv4f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI34_0)			; CHECK-NEXT: lui a0, %hi(.LCPI34_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI34_0)			; CHECK-NEXT: flh ft0, %lo(.LCPI34_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vlse16.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmin.vs v8, v8, v9			; CHECK-NEXT: vfredmin.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call half @llvm.vector.reduce.fmin.nxv4f16(<vscale x 4 x half> %v)			%red = call half @llvm.vector.reduce.fmin.nxv4f16(<vscale x 4 x half> %v)
	ret half %red			ret half %red
	}			}

	declare half @llvm.vector.reduce.fmin.nxv64f16(<vscale x 64 x half>)			declare half @llvm.vector.reduce.fmin.nxv64f16(<vscale x 64 x half>)

	define half @vreduce_fmin_nxv64f16(<vscale x 64 x half> %v) {			define half @vreduce_fmin_nxv64f16(<vscale x 64 x half> %v) {
	; CHECK-LABEL: vreduce_fmin_nxv64f16:			; CHECK-LABEL: vreduce_fmin_nxv64f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetvli a0, zero, e16, m8, ta, ma
	; CHECK-NEXT: vfmin.vv v8, v8, v16
	; CHECK-NEXT: lui a0, %hi(.LCPI35_0)			; CHECK-NEXT: lui a0, %hi(.LCPI35_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI35_0)			; CHECK-NEXT: flh ft0, %lo(.LCPI35_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vlse16.v v16, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e16, m8, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m8, ta, ma
				; CHECK-NEXT: vfmin.vv v8, v8, v16
				; CHECK-NEXT: vfmv.s.f v16, ft0
	; CHECK-NEXT: vfredmin.vs v8, v8, v16			; CHECK-NEXT: vfredmin.vs v8, v8, v16
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call half @llvm.vector.reduce.fmin.nxv64f16(<vscale x 64 x half> %v)			%red = call half @llvm.vector.reduce.fmin.nxv64f16(<vscale x 64 x half> %v)
	ret half %red			ret half %red
	}			}

	declare float @llvm.vector.reduce.fmin.nxv1f32(<vscale x 1 x float>)			declare float @llvm.vector.reduce.fmin.nxv1f32(<vscale x 1 x float>)

	define float @vreduce_fmin_nxv1f32(<vscale x 1 x float> %v) {			define float @vreduce_fmin_nxv1f32(<vscale x 1 x float> %v) {
	; CHECK-LABEL: vreduce_fmin_nxv1f32:			; CHECK-LABEL: vreduce_fmin_nxv1f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI36_0)			; CHECK-NEXT: lui a0, %hi(.LCPI36_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI36_0)			; CHECK-NEXT: flw ft0, %lo(.LCPI36_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
	; CHECK-NEXT: vlse32.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmin.vs v8, v8, v9			; CHECK-NEXT: vfredmin.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call float @llvm.vector.reduce.fmin.nxv1f32(<vscale x 1 x float> %v)			%red = call float @llvm.vector.reduce.fmin.nxv1f32(<vscale x 1 x float> %v)
	ret float %red			ret float %red
	}			}

	define float @vreduce_fmin_nxv1f32_nonans(<vscale x 1 x float> %v) {			define float @vreduce_fmin_nxv1f32_nonans(<vscale x 1 x float> %v) {
	; CHECK-LABEL: vreduce_fmin_nxv1f32_nonans:			; CHECK-LABEL: vreduce_fmin_nxv1f32_nonans:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI37_0)			; CHECK-NEXT: lui a0, %hi(.LCPI37_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI37_0)			; CHECK-NEXT: flw ft0, %lo(.LCPI37_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
	; CHECK-NEXT: vlse32.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmin.vs v8, v8, v9			; CHECK-NEXT: vfredmin.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call nnan float @llvm.vector.reduce.fmin.nxv1f32(<vscale x 1 x float> %v)			%red = call nnan float @llvm.vector.reduce.fmin.nxv1f32(<vscale x 1 x float> %v)
	ret float %red			ret float %red
	}			}

	define float @vreduce_fmin_nxv1f32_nonans_noinfs(<vscale x 1 x float> %v) {			define float @vreduce_fmin_nxv1f32_nonans_noinfs(<vscale x 1 x float> %v) {
	; CHECK-LABEL: vreduce_fmin_nxv1f32_nonans_noinfs:			; CHECK-LABEL: vreduce_fmin_nxv1f32_nonans_noinfs:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI38_0)			; CHECK-NEXT: lui a0, %hi(.LCPI38_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI38_0)			; CHECK-NEXT: flw ft0, %lo(.LCPI38_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
	; CHECK-NEXT: vlse32.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmin.vs v8, v8, v9			; CHECK-NEXT: vfredmin.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call nnan ninf float @llvm.vector.reduce.fmin.nxv1f32(<vscale x 1 x float> %v)			%red = call nnan ninf float @llvm.vector.reduce.fmin.nxv1f32(<vscale x 1 x float> %v)
	ret float %red			ret float %red
	}			}

	declare float @llvm.vector.reduce.fmin.nxv2f32(<vscale x 2 x float>)			declare float @llvm.vector.reduce.fmin.nxv2f32(<vscale x 2 x float>)

	define float @vreduce_fmin_nxv2f32(<vscale x 2 x float> %v) {			define float @vreduce_fmin_nxv2f32(<vscale x 2 x float> %v) {
	; CHECK-LABEL: vreduce_fmin_nxv2f32:			; CHECK-LABEL: vreduce_fmin_nxv2f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI39_0)			; CHECK-NEXT: lui a0, %hi(.LCPI39_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI39_0)			; CHECK-NEXT: flw ft0, %lo(.LCPI39_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; CHECK-NEXT: vlse32.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmin.vs v8, v8, v9			; CHECK-NEXT: vfredmin.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call float @llvm.vector.reduce.fmin.nxv2f32(<vscale x 2 x float> %v)			%red = call float @llvm.vector.reduce.fmin.nxv2f32(<vscale x 2 x float> %v)
	ret float %red			ret float %red
	}			}

	declare float @llvm.vector.reduce.fmin.nxv4f32(<vscale x 4 x float>)			declare float @llvm.vector.reduce.fmin.nxv4f32(<vscale x 4 x float>)

	define float @vreduce_fmin_nxv4f32(<vscale x 4 x float> %v) {			define float @vreduce_fmin_nxv4f32(<vscale x 4 x float> %v) {
	; CHECK-LABEL: vreduce_fmin_nxv4f32:			; CHECK-LABEL: vreduce_fmin_nxv4f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI40_0)			; CHECK-NEXT: lui a0, %hi(.LCPI40_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI40_0)			; CHECK-NEXT: flw ft0, %lo(.LCPI40_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vlse32.v v10, (a0), zero			; CHECK-NEXT: vfmv.s.f v10, ft0
	; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma
	; CHECK-NEXT: vfredmin.vs v8, v8, v10			; CHECK-NEXT: vfredmin.vs v8, v8, v10
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call float @llvm.vector.reduce.fmin.nxv4f32(<vscale x 4 x float> %v)			%red = call float @llvm.vector.reduce.fmin.nxv4f32(<vscale x 4 x float> %v)
	ret float %red			ret float %red
	}			}

	declare float @llvm.vector.reduce.fmin.nxv32f32(<vscale x 32 x float>)			declare float @llvm.vector.reduce.fmin.nxv32f32(<vscale x 32 x float>)

	define float @vreduce_fmin_nxv32f32(<vscale x 32 x float> %v) {			define float @vreduce_fmin_nxv32f32(<vscale x 32 x float> %v) {
	; CHECK-LABEL: vreduce_fmin_nxv32f32:			; CHECK-LABEL: vreduce_fmin_nxv32f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetvli a0, zero, e32, m8, ta, ma
	; CHECK-NEXT: vfmin.vv v8, v8, v16
	; CHECK-NEXT: lui a0, %hi(.LCPI41_0)			; CHECK-NEXT: lui a0, %hi(.LCPI41_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI41_0)			; CHECK-NEXT: flw ft0, %lo(.LCPI41_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; CHECK-NEXT: vlse32.v v16, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e32, m8, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m8, ta, ma
				; CHECK-NEXT: vfmin.vv v8, v8, v16
				; CHECK-NEXT: vfmv.s.f v16, ft0
	; CHECK-NEXT: vfredmin.vs v8, v8, v16			; CHECK-NEXT: vfredmin.vs v8, v8, v16
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call float @llvm.vector.reduce.fmin.nxv32f32(<vscale x 32 x float> %v)			%red = call float @llvm.vector.reduce.fmin.nxv32f32(<vscale x 32 x float> %v)
	ret float %red			ret float %red
	}			}

	declare double @llvm.vector.reduce.fmin.nxv1f64(<vscale x 1 x double>)			declare double @llvm.vector.reduce.fmin.nxv1f64(<vscale x 1 x double>)

	define double @vreduce_fmin_nxv1f64(<vscale x 1 x double> %v) {			define double @vreduce_fmin_nxv1f64(<vscale x 1 x double> %v) {
	; CHECK-LABEL: vreduce_fmin_nxv1f64:			; CHECK-LABEL: vreduce_fmin_nxv1f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI42_0)			; CHECK-NEXT: lui a0, %hi(.LCPI42_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI42_0)			; CHECK-NEXT: fld ft0, %lo(.LCPI42_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; CHECK-NEXT: vlse64.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmin.vs v8, v8, v9			; CHECK-NEXT: vfredmin.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call double @llvm.vector.reduce.fmin.nxv1f64(<vscale x 1 x double> %v)			%red = call double @llvm.vector.reduce.fmin.nxv1f64(<vscale x 1 x double> %v)
	ret double %red			ret double %red
	}			}

	define double @vreduce_fmin_nxv1f64_nonans(<vscale x 1 x double> %v) {			define double @vreduce_fmin_nxv1f64_nonans(<vscale x 1 x double> %v) {
	; CHECK-LABEL: vreduce_fmin_nxv1f64_nonans:			; CHECK-LABEL: vreduce_fmin_nxv1f64_nonans:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI43_0)			; CHECK-NEXT: lui a0, %hi(.LCPI43_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI43_0)			; CHECK-NEXT: fld ft0, %lo(.LCPI43_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; CHECK-NEXT: vlse64.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmin.vs v8, v8, v9			; CHECK-NEXT: vfredmin.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call nnan double @llvm.vector.reduce.fmin.nxv1f64(<vscale x 1 x double> %v)			%red = call nnan double @llvm.vector.reduce.fmin.nxv1f64(<vscale x 1 x double> %v)
	ret double %red			ret double %red
	}			}

	define double @vreduce_fmin_nxv1f64_nonans_noinfs(<vscale x 1 x double> %v) {			define double @vreduce_fmin_nxv1f64_nonans_noinfs(<vscale x 1 x double> %v) {
	; CHECK-LABEL: vreduce_fmin_nxv1f64_nonans_noinfs:			; CHECK-LABEL: vreduce_fmin_nxv1f64_nonans_noinfs:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI44_0)			; CHECK-NEXT: lui a0, %hi(.LCPI44_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI44_0)			; CHECK-NEXT: fld ft0, %lo(.LCPI44_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; CHECK-NEXT: vlse64.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmin.vs v8, v8, v9			; CHECK-NEXT: vfredmin.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call nnan ninf double @llvm.vector.reduce.fmin.nxv1f64(<vscale x 1 x double> %v)			%red = call nnan ninf double @llvm.vector.reduce.fmin.nxv1f64(<vscale x 1 x double> %v)
	ret double %red			ret double %red
	}			}

	declare double @llvm.vector.reduce.fmin.nxv2f64(<vscale x 2 x double>)			declare double @llvm.vector.reduce.fmin.nxv2f64(<vscale x 2 x double>)

	define double @vreduce_fmin_nxv2f64(<vscale x 2 x double> %v) {			define double @vreduce_fmin_nxv2f64(<vscale x 2 x double> %v) {
	; CHECK-LABEL: vreduce_fmin_nxv2f64:			; CHECK-LABEL: vreduce_fmin_nxv2f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI45_0)			; CHECK-NEXT: lui a0, %hi(.LCPI45_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI45_0)			; CHECK-NEXT: fld ft0, %lo(.LCPI45_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; CHECK-NEXT: vlse64.v v10, (a0), zero			; CHECK-NEXT: vfmv.s.f v10, ft0
	; CHECK-NEXT: vsetvli a0, zero, e64, m2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m2, ta, ma
	; CHECK-NEXT: vfredmin.vs v8, v8, v10			; CHECK-NEXT: vfredmin.vs v8, v8, v10
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call double @llvm.vector.reduce.fmin.nxv2f64(<vscale x 2 x double> %v)			%red = call double @llvm.vector.reduce.fmin.nxv2f64(<vscale x 2 x double> %v)
	ret double %red			ret double %red
	}			}

	declare double @llvm.vector.reduce.fmin.nxv4f64(<vscale x 4 x double>)			declare double @llvm.vector.reduce.fmin.nxv4f64(<vscale x 4 x double>)

	define double @vreduce_fmin_nxv4f64(<vscale x 4 x double> %v) {			define double @vreduce_fmin_nxv4f64(<vscale x 4 x double> %v) {
	; CHECK-LABEL: vreduce_fmin_nxv4f64:			; CHECK-LABEL: vreduce_fmin_nxv4f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI46_0)			; CHECK-NEXT: lui a0, %hi(.LCPI46_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI46_0)			; CHECK-NEXT: fld ft0, %lo(.LCPI46_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; CHECK-NEXT: vlse64.v v12, (a0), zero			; CHECK-NEXT: vfmv.s.f v12, ft0
	; CHECK-NEXT: vsetvli a0, zero, e64, m4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m4, ta, ma
	; CHECK-NEXT: vfredmin.vs v8, v8, v12			; CHECK-NEXT: vfredmin.vs v8, v8, v12
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call double @llvm.vector.reduce.fmin.nxv4f64(<vscale x 4 x double> %v)			%red = call double @llvm.vector.reduce.fmin.nxv4f64(<vscale x 4 x double> %v)
	ret double %red			ret double %red
	}			}

	declare double @llvm.vector.reduce.fmin.nxv16f64(<vscale x 16 x double>)			declare double @llvm.vector.reduce.fmin.nxv16f64(<vscale x 16 x double>)

	define double @vreduce_fmin_nxv16f64(<vscale x 16 x double> %v) {			define double @vreduce_fmin_nxv16f64(<vscale x 16 x double> %v) {
	; CHECK-LABEL: vreduce_fmin_nxv16f64:			; CHECK-LABEL: vreduce_fmin_nxv16f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetvli a0, zero, e64, m8, ta, ma
	; CHECK-NEXT: vfmin.vv v8, v8, v16
	; CHECK-NEXT: lui a0, %hi(.LCPI47_0)			; CHECK-NEXT: lui a0, %hi(.LCPI47_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI47_0)			; CHECK-NEXT: fld ft0, %lo(.LCPI47_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; CHECK-NEXT: vlse64.v v16, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e64, m8, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m8, ta, ma
				; CHECK-NEXT: vfmin.vv v8, v8, v16
				; CHECK-NEXT: vfmv.s.f v16, ft0
	; CHECK-NEXT: vfredmin.vs v8, v8, v16			; CHECK-NEXT: vfredmin.vs v8, v8, v16
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call double @llvm.vector.reduce.fmin.nxv16f64(<vscale x 16 x double> %v)			%red = call double @llvm.vector.reduce.fmin.nxv16f64(<vscale x 16 x double> %v)
	ret double %red			ret double %red
	}			}

	declare half @llvm.vector.reduce.fmax.nxv1f16(<vscale x 1 x half>)			declare half @llvm.vector.reduce.fmax.nxv1f16(<vscale x 1 x half>)

	define half @vreduce_fmax_nxv1f16(<vscale x 1 x half> %v) {			define half @vreduce_fmax_nxv1f16(<vscale x 1 x half> %v) {
	; CHECK-LABEL: vreduce_fmax_nxv1f16:			; CHECK-LABEL: vreduce_fmax_nxv1f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI48_0)			; CHECK-NEXT: lui a0, %hi(.LCPI48_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI48_0)			; CHECK-NEXT: flh ft0, %lo(.LCPI48_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma
	; CHECK-NEXT: vlse16.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmax.vs v8, v8, v9			; CHECK-NEXT: vfredmax.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call half @llvm.vector.reduce.fmax.nxv1f16(<vscale x 1 x half> %v)			%red = call half @llvm.vector.reduce.fmax.nxv1f16(<vscale x 1 x half> %v)
	ret half %red			ret half %red
	}			}

	define half @vreduce_fmax_nxv1f16_nonans(<vscale x 1 x half> %v) #0 {			define half @vreduce_fmax_nxv1f16_nonans(<vscale x 1 x half> %v) #0 {
	; CHECK-LABEL: vreduce_fmax_nxv1f16_nonans:			; CHECK-LABEL: vreduce_fmax_nxv1f16_nonans:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI49_0)			; CHECK-NEXT: lui a0, %hi(.LCPI49_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI49_0)			; CHECK-NEXT: flh ft0, %lo(.LCPI49_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma
	; CHECK-NEXT: vlse16.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmax.vs v8, v8, v9			; CHECK-NEXT: vfredmax.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call nnan half @llvm.vector.reduce.fmax.nxv1f16(<vscale x 1 x half> %v)			%red = call nnan half @llvm.vector.reduce.fmax.nxv1f16(<vscale x 1 x half> %v)
	ret half %red			ret half %red
	}			}

	define half @vreduce_fmax_nxv1f16_nonans_noinfs(<vscale x 1 x half> %v) #1 {			define half @vreduce_fmax_nxv1f16_nonans_noinfs(<vscale x 1 x half> %v) #1 {
	; CHECK-LABEL: vreduce_fmax_nxv1f16_nonans_noinfs:			; CHECK-LABEL: vreduce_fmax_nxv1f16_nonans_noinfs:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI50_0)			; CHECK-NEXT: lui a0, %hi(.LCPI50_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI50_0)			; CHECK-NEXT: flh ft0, %lo(.LCPI50_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma
	; CHECK-NEXT: vlse16.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmax.vs v8, v8, v9			; CHECK-NEXT: vfredmax.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call nnan ninf half @llvm.vector.reduce.fmax.nxv1f16(<vscale x 1 x half> %v)			%red = call nnan ninf half @llvm.vector.reduce.fmax.nxv1f16(<vscale x 1 x half> %v)
	ret half %red			ret half %red
	}			}

	declare half @llvm.vector.reduce.fmax.nxv2f16(<vscale x 2 x half>)			declare half @llvm.vector.reduce.fmax.nxv2f16(<vscale x 2 x half>)

	define half @vreduce_fmax_nxv2f16(<vscale x 2 x half> %v) {			define half @vreduce_fmax_nxv2f16(<vscale x 2 x half> %v) {
	; CHECK-LABEL: vreduce_fmax_nxv2f16:			; CHECK-LABEL: vreduce_fmax_nxv2f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI51_0)			; CHECK-NEXT: lui a0, %hi(.LCPI51_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI51_0)			; CHECK-NEXT: flh ft0, %lo(.LCPI51_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; CHECK-NEXT: vlse16.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmax.vs v8, v8, v9			; CHECK-NEXT: vfredmax.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call half @llvm.vector.reduce.fmax.nxv2f16(<vscale x 2 x half> %v)			%red = call half @llvm.vector.reduce.fmax.nxv2f16(<vscale x 2 x half> %v)
	ret half %red			ret half %red
	}			}

	declare half @llvm.vector.reduce.fmax.nxv4f16(<vscale x 4 x half>)			declare half @llvm.vector.reduce.fmax.nxv4f16(<vscale x 4 x half>)

	define half @vreduce_fmax_nxv4f16(<vscale x 4 x half> %v) {			define half @vreduce_fmax_nxv4f16(<vscale x 4 x half> %v) {
	; CHECK-LABEL: vreduce_fmax_nxv4f16:			; CHECK-LABEL: vreduce_fmax_nxv4f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI52_0)			; CHECK-NEXT: lui a0, %hi(.LCPI52_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI52_0)			; CHECK-NEXT: flh ft0, %lo(.LCPI52_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vlse16.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmax.vs v8, v8, v9			; CHECK-NEXT: vfredmax.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call half @llvm.vector.reduce.fmax.nxv4f16(<vscale x 4 x half> %v)			%red = call half @llvm.vector.reduce.fmax.nxv4f16(<vscale x 4 x half> %v)
	ret half %red			ret half %red
	}			}

	declare half @llvm.vector.reduce.fmax.nxv64f16(<vscale x 64 x half>)			declare half @llvm.vector.reduce.fmax.nxv64f16(<vscale x 64 x half>)

	define half @vreduce_fmax_nxv64f16(<vscale x 64 x half> %v) {			define half @vreduce_fmax_nxv64f16(<vscale x 64 x half> %v) {
	; CHECK-LABEL: vreduce_fmax_nxv64f16:			; CHECK-LABEL: vreduce_fmax_nxv64f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetvli a0, zero, e16, m8, ta, ma
	; CHECK-NEXT: vfmax.vv v8, v8, v16
	; CHECK-NEXT: lui a0, %hi(.LCPI53_0)			; CHECK-NEXT: lui a0, %hi(.LCPI53_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI53_0)			; CHECK-NEXT: flh ft0, %lo(.LCPI53_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vlse16.v v16, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e16, m8, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m8, ta, ma
				; CHECK-NEXT: vfmax.vv v8, v8, v16
				; CHECK-NEXT: vfmv.s.f v16, ft0
	; CHECK-NEXT: vfredmax.vs v8, v8, v16			; CHECK-NEXT: vfredmax.vs v8, v8, v16
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call half @llvm.vector.reduce.fmax.nxv64f16(<vscale x 64 x half> %v)			%red = call half @llvm.vector.reduce.fmax.nxv64f16(<vscale x 64 x half> %v)
	ret half %red			ret half %red
	}			}

	declare float @llvm.vector.reduce.fmax.nxv1f32(<vscale x 1 x float>)			declare float @llvm.vector.reduce.fmax.nxv1f32(<vscale x 1 x float>)

	define float @vreduce_fmax_nxv1f32(<vscale x 1 x float> %v) {			define float @vreduce_fmax_nxv1f32(<vscale x 1 x float> %v) {
	; CHECK-LABEL: vreduce_fmax_nxv1f32:			; CHECK-LABEL: vreduce_fmax_nxv1f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI54_0)			; CHECK-NEXT: lui a0, %hi(.LCPI54_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI54_0)			; CHECK-NEXT: flw ft0, %lo(.LCPI54_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
	; CHECK-NEXT: vlse32.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmax.vs v8, v8, v9			; CHECK-NEXT: vfredmax.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call float @llvm.vector.reduce.fmax.nxv1f32(<vscale x 1 x float> %v)			%red = call float @llvm.vector.reduce.fmax.nxv1f32(<vscale x 1 x float> %v)
	ret float %red			ret float %red
	}			}

	define float @vreduce_fmax_nxv1f32_nonans(<vscale x 1 x float> %v) {			define float @vreduce_fmax_nxv1f32_nonans(<vscale x 1 x float> %v) {
	; CHECK-LABEL: vreduce_fmax_nxv1f32_nonans:			; CHECK-LABEL: vreduce_fmax_nxv1f32_nonans:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI55_0)			; CHECK-NEXT: lui a0, %hi(.LCPI55_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI55_0)			; CHECK-NEXT: flw ft0, %lo(.LCPI55_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
	; CHECK-NEXT: vlse32.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmax.vs v8, v8, v9			; CHECK-NEXT: vfredmax.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call nnan float @llvm.vector.reduce.fmax.nxv1f32(<vscale x 1 x float> %v)			%red = call nnan float @llvm.vector.reduce.fmax.nxv1f32(<vscale x 1 x float> %v)
	ret float %red			ret float %red
	}			}

	define float @vreduce_fmax_nxv1f32_nonans_noinfs(<vscale x 1 x float> %v) {			define float @vreduce_fmax_nxv1f32_nonans_noinfs(<vscale x 1 x float> %v) {
	; CHECK-LABEL: vreduce_fmax_nxv1f32_nonans_noinfs:			; CHECK-LABEL: vreduce_fmax_nxv1f32_nonans_noinfs:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI56_0)			; CHECK-NEXT: lui a0, %hi(.LCPI56_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI56_0)			; CHECK-NEXT: flw ft0, %lo(.LCPI56_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
	; CHECK-NEXT: vlse32.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmax.vs v8, v8, v9			; CHECK-NEXT: vfredmax.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call nnan ninf float @llvm.vector.reduce.fmax.nxv1f32(<vscale x 1 x float> %v)			%red = call nnan ninf float @llvm.vector.reduce.fmax.nxv1f32(<vscale x 1 x float> %v)
	ret float %red			ret float %red
	}			}

	declare float @llvm.vector.reduce.fmax.nxv2f32(<vscale x 2 x float>)			declare float @llvm.vector.reduce.fmax.nxv2f32(<vscale x 2 x float>)

	define float @vreduce_fmax_nxv2f32(<vscale x 2 x float> %v) {			define float @vreduce_fmax_nxv2f32(<vscale x 2 x float> %v) {
	; CHECK-LABEL: vreduce_fmax_nxv2f32:			; CHECK-LABEL: vreduce_fmax_nxv2f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI57_0)			; CHECK-NEXT: lui a0, %hi(.LCPI57_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI57_0)			; CHECK-NEXT: flw ft0, %lo(.LCPI57_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; CHECK-NEXT: vlse32.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmax.vs v8, v8, v9			; CHECK-NEXT: vfredmax.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call float @llvm.vector.reduce.fmax.nxv2f32(<vscale x 2 x float> %v)			%red = call float @llvm.vector.reduce.fmax.nxv2f32(<vscale x 2 x float> %v)
	ret float %red			ret float %red
	}			}

	declare float @llvm.vector.reduce.fmax.nxv4f32(<vscale x 4 x float>)			declare float @llvm.vector.reduce.fmax.nxv4f32(<vscale x 4 x float>)

	define float @vreduce_fmax_nxv4f32(<vscale x 4 x float> %v) {			define float @vreduce_fmax_nxv4f32(<vscale x 4 x float> %v) {
	; CHECK-LABEL: vreduce_fmax_nxv4f32:			; CHECK-LABEL: vreduce_fmax_nxv4f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI58_0)			; CHECK-NEXT: lui a0, %hi(.LCPI58_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI58_0)			; CHECK-NEXT: flw ft0, %lo(.LCPI58_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vlse32.v v10, (a0), zero			; CHECK-NEXT: vfmv.s.f v10, ft0
	; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma
	; CHECK-NEXT: vfredmax.vs v8, v8, v10			; CHECK-NEXT: vfredmax.vs v8, v8, v10
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call float @llvm.vector.reduce.fmax.nxv4f32(<vscale x 4 x float> %v)			%red = call float @llvm.vector.reduce.fmax.nxv4f32(<vscale x 4 x float> %v)
	ret float %red			ret float %red
	}			}

	declare float @llvm.vector.reduce.fmax.nxv32f32(<vscale x 32 x float>)			declare float @llvm.vector.reduce.fmax.nxv32f32(<vscale x 32 x float>)

	define float @vreduce_fmax_nxv32f32(<vscale x 32 x float> %v) {			define float @vreduce_fmax_nxv32f32(<vscale x 32 x float> %v) {
	; CHECK-LABEL: vreduce_fmax_nxv32f32:			; CHECK-LABEL: vreduce_fmax_nxv32f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetvli a0, zero, e32, m8, ta, ma
	; CHECK-NEXT: vfmax.vv v8, v8, v16
	; CHECK-NEXT: lui a0, %hi(.LCPI59_0)			; CHECK-NEXT: lui a0, %hi(.LCPI59_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI59_0)			; CHECK-NEXT: flw ft0, %lo(.LCPI59_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; CHECK-NEXT: vlse32.v v16, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e32, m8, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m8, ta, ma
				; CHECK-NEXT: vfmax.vv v8, v8, v16
				; CHECK-NEXT: vfmv.s.f v16, ft0
	; CHECK-NEXT: vfredmax.vs v8, v8, v16			; CHECK-NEXT: vfredmax.vs v8, v8, v16
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call float @llvm.vector.reduce.fmax.nxv32f32(<vscale x 32 x float> %v)			%red = call float @llvm.vector.reduce.fmax.nxv32f32(<vscale x 32 x float> %v)
	ret float %red			ret float %red
	}			}

	declare double @llvm.vector.reduce.fmax.nxv1f64(<vscale x 1 x double>)			declare double @llvm.vector.reduce.fmax.nxv1f64(<vscale x 1 x double>)

	define double @vreduce_fmax_nxv1f64(<vscale x 1 x double> %v) {			define double @vreduce_fmax_nxv1f64(<vscale x 1 x double> %v) {
	; CHECK-LABEL: vreduce_fmax_nxv1f64:			; CHECK-LABEL: vreduce_fmax_nxv1f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI60_0)			; CHECK-NEXT: lui a0, %hi(.LCPI60_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI60_0)			; CHECK-NEXT: fld ft0, %lo(.LCPI60_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; CHECK-NEXT: vlse64.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmax.vs v8, v8, v9			; CHECK-NEXT: vfredmax.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call double @llvm.vector.reduce.fmax.nxv1f64(<vscale x 1 x double> %v)			%red = call double @llvm.vector.reduce.fmax.nxv1f64(<vscale x 1 x double> %v)
	ret double %red			ret double %red
	}			}

	define double @vreduce_fmax_nxv1f64_nonans(<vscale x 1 x double> %v) {			define double @vreduce_fmax_nxv1f64_nonans(<vscale x 1 x double> %v) {
	; CHECK-LABEL: vreduce_fmax_nxv1f64_nonans:			; CHECK-LABEL: vreduce_fmax_nxv1f64_nonans:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI61_0)			; CHECK-NEXT: lui a0, %hi(.LCPI61_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI61_0)			; CHECK-NEXT: fld ft0, %lo(.LCPI61_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; CHECK-NEXT: vlse64.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmax.vs v8, v8, v9			; CHECK-NEXT: vfredmax.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call nnan double @llvm.vector.reduce.fmax.nxv1f64(<vscale x 1 x double> %v)			%red = call nnan double @llvm.vector.reduce.fmax.nxv1f64(<vscale x 1 x double> %v)
	ret double %red			ret double %red
	}			}

	define double @vreduce_fmax_nxv1f64_nonans_noinfs(<vscale x 1 x double> %v) {			define double @vreduce_fmax_nxv1f64_nonans_noinfs(<vscale x 1 x double> %v) {
	; CHECK-LABEL: vreduce_fmax_nxv1f64_nonans_noinfs:			; CHECK-LABEL: vreduce_fmax_nxv1f64_nonans_noinfs:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI62_0)			; CHECK-NEXT: lui a0, %hi(.LCPI62_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI62_0)			; CHECK-NEXT: fld ft0, %lo(.LCPI62_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; CHECK-NEXT: vlse64.v v9, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, ft0
	; CHECK-NEXT: vfredmax.vs v8, v8, v9			; CHECK-NEXT: vfredmax.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call nnan ninf double @llvm.vector.reduce.fmax.nxv1f64(<vscale x 1 x double> %v)			%red = call nnan ninf double @llvm.vector.reduce.fmax.nxv1f64(<vscale x 1 x double> %v)
	ret double %red			ret double %red
	}			}

	declare double @llvm.vector.reduce.fmax.nxv2f64(<vscale x 2 x double>)			declare double @llvm.vector.reduce.fmax.nxv2f64(<vscale x 2 x double>)

	define double @vreduce_fmax_nxv2f64(<vscale x 2 x double> %v) {			define double @vreduce_fmax_nxv2f64(<vscale x 2 x double> %v) {
	; CHECK-LABEL: vreduce_fmax_nxv2f64:			; CHECK-LABEL: vreduce_fmax_nxv2f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI63_0)			; CHECK-NEXT: lui a0, %hi(.LCPI63_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI63_0)			; CHECK-NEXT: fld ft0, %lo(.LCPI63_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; CHECK-NEXT: vlse64.v v10, (a0), zero			; CHECK-NEXT: vfmv.s.f v10, ft0
	; CHECK-NEXT: vsetvli a0, zero, e64, m2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m2, ta, ma
	; CHECK-NEXT: vfredmax.vs v8, v8, v10			; CHECK-NEXT: vfredmax.vs v8, v8, v10
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call double @llvm.vector.reduce.fmax.nxv2f64(<vscale x 2 x double> %v)			%red = call double @llvm.vector.reduce.fmax.nxv2f64(<vscale x 2 x double> %v)
	ret double %red			ret double %red
	}			}

	declare double @llvm.vector.reduce.fmax.nxv4f64(<vscale x 4 x double>)			declare double @llvm.vector.reduce.fmax.nxv4f64(<vscale x 4 x double>)

	define double @vreduce_fmax_nxv4f64(<vscale x 4 x double> %v) {			define double @vreduce_fmax_nxv4f64(<vscale x 4 x double> %v) {
	; CHECK-LABEL: vreduce_fmax_nxv4f64:			; CHECK-LABEL: vreduce_fmax_nxv4f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI64_0)			; CHECK-NEXT: lui a0, %hi(.LCPI64_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI64_0)			; CHECK-NEXT: fld ft0, %lo(.LCPI64_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; CHECK-NEXT: vlse64.v v12, (a0), zero			; CHECK-NEXT: vfmv.s.f v12, ft0
	; CHECK-NEXT: vsetvli a0, zero, e64, m4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m4, ta, ma
	; CHECK-NEXT: vfredmax.vs v8, v8, v12			; CHECK-NEXT: vfredmax.vs v8, v8, v12
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call double @llvm.vector.reduce.fmax.nxv4f64(<vscale x 4 x double> %v)			%red = call double @llvm.vector.reduce.fmax.nxv4f64(<vscale x 4 x double> %v)
	ret double %red			ret double %red
	}			}

	declare double @llvm.vector.reduce.fmax.nxv16f64(<vscale x 16 x double>)			declare double @llvm.vector.reduce.fmax.nxv16f64(<vscale x 16 x double>)

	define double @vreduce_fmax_nxv16f64(<vscale x 16 x double> %v) {			define double @vreduce_fmax_nxv16f64(<vscale x 16 x double> %v) {
	; CHECK-LABEL: vreduce_fmax_nxv16f64:			; CHECK-LABEL: vreduce_fmax_nxv16f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetvli a0, zero, e64, m8, ta, ma
	; CHECK-NEXT: vfmax.vv v8, v8, v16
	; CHECK-NEXT: lui a0, %hi(.LCPI65_0)			; CHECK-NEXT: lui a0, %hi(.LCPI65_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI65_0)			; CHECK-NEXT: fld ft0, %lo(.LCPI65_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; CHECK-NEXT: vlse64.v v16, (a0), zero
	; CHECK-NEXT: vsetvli a0, zero, e64, m8, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e64, m8, ta, ma
				; CHECK-NEXT: vfmax.vv v8, v8, v16
				; CHECK-NEXT: vfmv.s.f v16, ft0
	; CHECK-NEXT: vfredmax.vs v8, v8, v16			; CHECK-NEXT: vfredmax.vs v8, v8, v16
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call double @llvm.vector.reduce.fmax.nxv16f64(<vscale x 16 x double> %v)			%red = call double @llvm.vector.reduce.fmax.nxv16f64(<vscale x 16 x double> %v)
	ret double %red			ret double %red
	}			}

	define float @vreduce_nsz_fadd_nxv1f32(<vscale x 1 x float> %v, float %s) {			define float @vreduce_nsz_fadd_nxv1f32(<vscale x 1 x float> %v, float %s) {
	; CHECK-LABEL: vreduce_nsz_fadd_nxv1f32:			; CHECK-LABEL: vreduce_nsz_fadd_nxv1f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vfredusum.vs v8, v8, v9			; CHECK-NEXT: vfredusum.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call reassoc nsz float @llvm.vector.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %v)			%red = call reassoc nsz float @llvm.vector.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %v)
	ret float %red			ret float %red
	}			}

	; Test Widen VECREDUCE_SEQ_FADD			; Test Widen VECREDUCE_SEQ_FADD
	declare half @llvm.vector.reduce.fadd.nxv3f16(half, <vscale x 3 x half>)			declare half @llvm.vector.reduce.fadd.nxv3f16(half, <vscale x 3 x half>)

	define half @vreduce_ord_fadd_nxv3f16(<vscale x 3 x half> %v, half %s) {			define half @vreduce_ord_fadd_nxv3f16(<vscale x 3 x half> %v, half %s) {
	; CHECK-LABEL: vreduce_ord_fadd_nxv3f16:			; CHECK-LABEL: vreduce_ord_fadd_nxv3f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: csrr a0, vlenb			; CHECK-NEXT: csrr a0, vlenb
	; CHECK-NEXT: srli a0, a0, 3			; CHECK-NEXT: srli a0, a0, 3
	; CHECK-NEXT: slli a1, a0, 1			; CHECK-NEXT: slli a1, a0, 1
	; CHECK-NEXT: add a1, a1, a0			; CHECK-NEXT: add a1, a1, a0
	; CHECK-NEXT: add a0, a1, a0			; CHECK-NEXT: add a0, a1, a0
	; CHECK-NEXT: fmv.h.x ft0, zero			; CHECK-NEXT: fmv.h.x ft0, zero
	; CHECK-NEXT: fneg.h ft0, ft0			; CHECK-NEXT: fneg.h ft0, ft0
	; CHECK-NEXT: vsetvli a2, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a2, zero, e16, m1, ta, ma
	; CHECK-NEXT: vfmv.v.f v9, ft0			; CHECK-NEXT: vfmv.v.f v9, ft0
	; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, ma			; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, ma
	; CHECK-NEXT: vslideup.vx v8, v9, a1			; CHECK-NEXT: vslideup.vx v8, v9, a1
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vfredosum.vs v8, v8, v9			; CHECK-NEXT: vfredosum.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call half @llvm.vector.reduce.fadd.nxv3f16(half %s, <vscale x 3 x half> %v)			%red = call half @llvm.vector.reduce.fadd.nxv3f16(half %s, <vscale x 3 x half> %v)
	ret half %red			ret half %red
	}			}

	declare half @llvm.vector.reduce.fadd.nxv6f16(half, <vscale x 6 x half>)			declare half @llvm.vector.reduce.fadd.nxv6f16(half, <vscale x 6 x half>)

	define half @vreduce_ord_fadd_nxv6f16(<vscale x 6 x half> %v, half %s) {			define half @vreduce_ord_fadd_nxv6f16(<vscale x 6 x half> %v, half %s) {
	; CHECK-LABEL: vreduce_ord_fadd_nxv6f16:			; CHECK-LABEL: vreduce_ord_fadd_nxv6f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: csrr a0, vlenb			; CHECK-NEXT: csrr a0, vlenb
	; CHECK-NEXT: srli a0, a0, 2			; CHECK-NEXT: srli a0, a0, 2
	; CHECK-NEXT: add a1, a0, a0			; CHECK-NEXT: add a1, a0, a0
	; CHECK-NEXT: fmv.h.x ft0, zero			; CHECK-NEXT: fmv.h.x ft0, zero
	; CHECK-NEXT: fneg.h ft0, ft0			; CHECK-NEXT: fneg.h ft0, ft0
	; CHECK-NEXT: vsetvli a2, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a2, zero, e16, m1, ta, ma
	; CHECK-NEXT: vfmv.v.f v10, ft0			; CHECK-NEXT: vfmv.v.f v10, ft0
	; CHECK-NEXT: vsetvli zero, a1, e16, m1, tu, ma			; CHECK-NEXT: vsetvli zero, a1, e16, m1, tu, ma
	; CHECK-NEXT: vslideup.vx v9, v10, a0			; CHECK-NEXT: vslideup.vx v9, v10, a0
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v10, fa0			; CHECK-NEXT: vfmv.s.f v10, fa0
	; CHECK-NEXT: vsetvli a0, zero, e16, m2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m2, ta, ma
	; CHECK-NEXT: vfredosum.vs v8, v8, v10			; CHECK-NEXT: vfredosum.vs v8, v8, v10
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call half @llvm.vector.reduce.fadd.nxv6f16(half %s, <vscale x 6 x half> %v)			%red = call half @llvm.vector.reduce.fadd.nxv6f16(half %s, <vscale x 6 x half> %v)
	ret half %red			ret half %red
	}			}
	Show All 11 Lines
	; CHECK-NEXT: vsetvli a2, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a2, zero, e16, m1, ta, ma
	; CHECK-NEXT: vfmv.v.f v12, ft0			; CHECK-NEXT: vfmv.v.f v12, ft0
	; CHECK-NEXT: vsetvli zero, a1, e16, m1, tu, ma			; CHECK-NEXT: vsetvli zero, a1, e16, m1, tu, ma
	; CHECK-NEXT: vslideup.vx v10, v12, a0			; CHECK-NEXT: vslideup.vx v10, v12, a0
	; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, ma			; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, ma
	; CHECK-NEXT: vslideup.vi v11, v12, 0			; CHECK-NEXT: vslideup.vi v11, v12, 0
	; CHECK-NEXT: vsetvli zero, a1, e16, m1, tu, ma			; CHECK-NEXT: vsetvli zero, a1, e16, m1, tu, ma
	; CHECK-NEXT: vslideup.vx v11, v12, a0			; CHECK-NEXT: vslideup.vx v11, v12, a0
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v12, fa0			; CHECK-NEXT: vfmv.s.f v12, fa0
	; CHECK-NEXT: vsetvli a0, zero, e16, m4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m4, ta, ma
	; CHECK-NEXT: vfredosum.vs v8, v8, v12			; CHECK-NEXT: vfredosum.vs v8, v8, v12
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call half @llvm.vector.reduce.fadd.nxv10f16(half %s, <vscale x 10 x half> %v)			%red = call half @llvm.vector.reduce.fadd.nxv10f16(half %s, <vscale x 10 x half> %v)
	ret half %red			ret half %red
	}			}

	declare half @llvm.vector.reduce.fadd.nxv12f16(half, <vscale x 12 x half>)			declare half @llvm.vector.reduce.fadd.nxv12f16(half, <vscale x 12 x half>)

	define half @vreduce_ord_fadd_nxv12f16(<vscale x 12 x half> %v, half %s) {			define half @vreduce_ord_fadd_nxv12f16(<vscale x 12 x half> %v, half %s) {
	; CHECK-LABEL: vreduce_ord_fadd_nxv12f16:			; CHECK-LABEL: vreduce_ord_fadd_nxv12f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v12, fa0			; CHECK-NEXT: vfmv.s.f v12, fa0
	; CHECK-NEXT: fmv.h.x ft0, zero			; CHECK-NEXT: fmv.h.x ft0, zero
	; CHECK-NEXT: fneg.h ft0, ft0			; CHECK-NEXT: fneg.h ft0, ft0
	; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
	; CHECK-NEXT: vfmv.v.f v11, ft0			; CHECK-NEXT: vfmv.v.f v11, ft0
	; CHECK-NEXT: vsetvli a0, zero, e16, m4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m4, ta, ma
	; CHECK-NEXT: vfredosum.vs v8, v8, v12			; CHECK-NEXT: vfredosum.vs v8, v8, v12
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call half @llvm.vector.reduce.fadd.nxv12f16(half %s, <vscale x 12 x half> %v)			%red = call half @llvm.vector.reduce.fadd.nxv12f16(half %s, <vscale x 12 x half> %v)
	ret half %red			ret half %red
	}			}

	; Test Widen vector reduce type (fadd/fmin/fmax)			; Test Widen vector reduce type (fadd/fmin/fmax)
	define half @vreduce_fadd_nxv3f16(<vscale x 3 x half> %v, half %s) {			define half @vreduce_fadd_nxv3f16(<vscale x 3 x half> %v, half %s) {
	; CHECK-LABEL: vreduce_fadd_nxv3f16:			; CHECK-LABEL: vreduce_fadd_nxv3f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: csrr a0, vlenb			; CHECK-NEXT: csrr a0, vlenb
	; CHECK-NEXT: srli a0, a0, 3			; CHECK-NEXT: srli a0, a0, 3
	; CHECK-NEXT: slli a1, a0, 1			; CHECK-NEXT: slli a1, a0, 1
	; CHECK-NEXT: add a1, a1, a0			; CHECK-NEXT: add a1, a1, a0
	; CHECK-NEXT: add a0, a1, a0			; CHECK-NEXT: add a0, a1, a0
	; CHECK-NEXT: fmv.h.x ft0, zero			; CHECK-NEXT: fmv.h.x ft0, zero
	; CHECK-NEXT: fneg.h ft0, ft0			; CHECK-NEXT: fneg.h ft0, ft0
	; CHECK-NEXT: vsetvli a2, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a2, zero, e16, m1, ta, ma
	; CHECK-NEXT: vfmv.v.f v9, ft0			; CHECK-NEXT: vfmv.v.f v9, ft0
	; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, ma			; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, ma
	; CHECK-NEXT: vslideup.vx v8, v9, a1			; CHECK-NEXT: vslideup.vx v8, v9, a1
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v9, fa0
	; CHECK-NEXT: vfredusum.vs v8, v8, v9			; CHECK-NEXT: vfredusum.vs v8, v8, v9
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call reassoc half @llvm.vector.reduce.fadd.nxv3f16(half %s, <vscale x 3 x half> %v)			%red = call reassoc half @llvm.vector.reduce.fadd.nxv3f16(half %s, <vscale x 3 x half> %v)
	ret half %red			ret half %red
	}			}

	define half @vreduce_fadd_nxv6f16(<vscale x 6 x half> %v, half %s) {			define half @vreduce_fadd_nxv6f16(<vscale x 6 x half> %v, half %s) {
	; CHECK-LABEL: vreduce_fadd_nxv6f16:			; CHECK-LABEL: vreduce_fadd_nxv6f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: csrr a0, vlenb			; CHECK-NEXT: csrr a0, vlenb
	; CHECK-NEXT: srli a0, a0, 2			; CHECK-NEXT: srli a0, a0, 2
	; CHECK-NEXT: add a1, a0, a0			; CHECK-NEXT: add a1, a0, a0
	; CHECK-NEXT: fmv.h.x ft0, zero			; CHECK-NEXT: fmv.h.x ft0, zero
	; CHECK-NEXT: fneg.h ft0, ft0			; CHECK-NEXT: fneg.h ft0, ft0
	; CHECK-NEXT: vsetvli a2, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a2, zero, e16, m1, ta, ma
	; CHECK-NEXT: vfmv.v.f v10, ft0			; CHECK-NEXT: vfmv.v.f v10, ft0
	; CHECK-NEXT: vsetvli zero, a1, e16, m1, tu, ma			; CHECK-NEXT: vsetvli zero, a1, e16, m1, tu, ma
	; CHECK-NEXT: vslideup.vx v9, v10, a0			; CHECK-NEXT: vslideup.vx v9, v10, a0
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v10, fa0			; CHECK-NEXT: vfmv.s.f v10, fa0
	; CHECK-NEXT: vsetvli a0, zero, e16, m2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m2, ta, ma
	; CHECK-NEXT: vfredusum.vs v8, v8, v10			; CHECK-NEXT: vfredusum.vs v8, v8, v10
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call reassoc half @llvm.vector.reduce.fadd.nxv6f16(half %s, <vscale x 6 x half> %v)			%red = call reassoc half @llvm.vector.reduce.fadd.nxv6f16(half %s, <vscale x 6 x half> %v)
	ret half %red			ret half %red
	}			}
	Show All 11 Lines
	; CHECK-NEXT: vsetvli a2, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a2, zero, e16, m1, ta, ma
	; CHECK-NEXT: vfmv.v.f v12, ft0			; CHECK-NEXT: vfmv.v.f v12, ft0
	; CHECK-NEXT: vsetvli zero, a1, e16, m1, tu, ma			; CHECK-NEXT: vsetvli zero, a1, e16, m1, tu, ma
	; CHECK-NEXT: vslideup.vx v10, v12, a0			; CHECK-NEXT: vslideup.vx v10, v12, a0
	; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, ma			; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, ma
	; CHECK-NEXT: vslideup.vi v11, v12, 0			; CHECK-NEXT: vslideup.vi v11, v12, 0
	; CHECK-NEXT: vsetvli zero, a1, e16, m1, tu, ma			; CHECK-NEXT: vsetvli zero, a1, e16, m1, tu, ma
	; CHECK-NEXT: vslideup.vx v11, v12, a0			; CHECK-NEXT: vslideup.vx v11, v12, a0
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v12, ft0			; CHECK-NEXT: vfmv.s.f v12, ft0
	; CHECK-NEXT: vsetvli a0, zero, e16, m4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m4, ta, ma
	; CHECK-NEXT: vfredmin.vs v8, v8, v12			; CHECK-NEXT: vfredmin.vs v8, v8, v12
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call half @llvm.vector.reduce.fmin.nxv10f16(<vscale x 10 x half> %v)			%red = call half @llvm.vector.reduce.fmin.nxv10f16(<vscale x 10 x half> %v)
	ret half %red			ret half %red
	}			}

	declare half @llvm.vector.reduce.fmax.nxv12f16(<vscale x 12 x half>)			declare half @llvm.vector.reduce.fmax.nxv12f16(<vscale x 12 x half>)

	define half @vreduce_fmax_nxv12f16(<vscale x 12 x half> %v) {			define half @vreduce_fmax_nxv12f16(<vscale x 12 x half> %v) {
	; CHECK-LABEL: vreduce_fmax_nxv12f16:			; CHECK-LABEL: vreduce_fmax_nxv12f16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI74_0)			; CHECK-NEXT: lui a0, %hi(.LCPI74_0)
	; CHECK-NEXT: flh ft0, %lo(.LCPI74_0)(a0)			; CHECK-NEXT: flh ft0, %lo(.LCPI74_0)(a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vfmv.s.f v12, ft0
	; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
				; CHECK-NEXT: vfmv.s.f v12, ft0
	; CHECK-NEXT: vfmv.v.f v11, ft0			; CHECK-NEXT: vfmv.v.f v11, ft0
	; CHECK-NEXT: vsetvli a0, zero, e16, m4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m4, ta, ma
	; CHECK-NEXT: vfredmax.vs v8, v8, v12			; CHECK-NEXT: vfredmax.vs v8, v8, v12
	; CHECK-NEXT: vfmv.f.s fa0, v8			; CHECK-NEXT: vfmv.f.s fa0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call half @llvm.vector.reduce.fmax.nxv12f16(<vscale x 12 x half> %v)			%red = call half @llvm.vector.reduce.fmax.nxv12f16(<vscale x 12 x half> %v)
	ret half %red			ret half %red
	}			}

llvm/test/CodeGen/RISCV/rvv/vreductions-int.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: sed 's/iXLen/i32/g' %s \| llc -mtriple=riscv32 -mattr=+v \			; RUN: sed 's/iXLen/i32/g' %s \| llc -mtriple=riscv32 -mattr=+v \
	; RUN: -verify-machineinstrs \| FileCheck %s --check-prefixes=CHECK,RV32			; RUN: -verify-machineinstrs \| FileCheck %s --check-prefixes=CHECK,RV32
	; RUN: sed 's/iXLen/i64/g' %s \| llc -mtriple=riscv64 -mattr=+v \			; RUN: sed 's/iXLen/i64/g' %s \| llc -mtriple=riscv64 -mattr=+v \
	; RUN: -verify-machineinstrs \| FileCheck %s --check-prefixes=CHECK,RV64			; RUN: -verify-machineinstrs \| FileCheck %s --check-prefixes=CHECK,RV64

	declare i8 @llvm.vector.reduce.add.nxv1i8(<vscale x 1 x i8>)			declare i8 @llvm.vector.reduce.add.nxv1i8(<vscale x 1 x i8>)

	define signext i8 @vreduce_add_nxv1i8(<vscale x 1 x i8> %v) {			define signext i8 @vreduce_add_nxv1i8(<vscale x 1 x i8> %v) {
	; CHECK-LABEL: vreduce_add_nxv1i8:			; CHECK-LABEL: vreduce_add_nxv1i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredsum.vs v8, v8, v9			; CHECK-NEXT: vredsum.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.add.nxv1i8(<vscale x 1 x i8> %v)			%red = call i8 @llvm.vector.reduce.add.nxv1i8(<vscale x 1 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.umax.nxv1i8(<vscale x 1 x i8>)			declare i8 @llvm.vector.reduce.umax.nxv1i8(<vscale x 1 x i8>)

	define signext i8 @vreduce_umax_nxv1i8(<vscale x 1 x i8> %v) {			define signext i8 @vreduce_umax_nxv1i8(<vscale x 1 x i8> %v) {
	; CHECK-LABEL: vreduce_umax_nxv1i8:			; CHECK-LABEL: vreduce_umax_nxv1i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredmaxu.vs v8, v8, v9			; CHECK-NEXT: vredmaxu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.umax.nxv1i8(<vscale x 1 x i8> %v)			%red = call i8 @llvm.vector.reduce.umax.nxv1i8(<vscale x 1 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.smax.nxv1i8(<vscale x 1 x i8>)			declare i8 @llvm.vector.reduce.smax.nxv1i8(<vscale x 1 x i8>)

	define signext i8 @vreduce_smax_nxv1i8(<vscale x 1 x i8> %v) {			define signext i8 @vreduce_smax_nxv1i8(<vscale x 1 x i8> %v) {
	; CHECK-LABEL: vreduce_smax_nxv1i8:			; CHECK-LABEL: vreduce_smax_nxv1i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: li a0, -128			; CHECK-NEXT: li a0, -128
	; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, ma			; CHECK-NEXT: vsetvli a1, zero, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.s.x v9, a0
	; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma
	; CHECK-NEXT: vredmax.vs v8, v8, v9			; CHECK-NEXT: vredmax.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.smax.nxv1i8(<vscale x 1 x i8> %v)			%red = call i8 @llvm.vector.reduce.smax.nxv1i8(<vscale x 1 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.umin.nxv1i8(<vscale x 1 x i8>)			declare i8 @llvm.vector.reduce.umin.nxv1i8(<vscale x 1 x i8>)

	define signext i8 @vreduce_umin_nxv1i8(<vscale x 1 x i8> %v) {			define signext i8 @vreduce_umin_nxv1i8(<vscale x 1 x i8> %v) {
	; CHECK-LABEL: vreduce_umin_nxv1i8:			; CHECK-LABEL: vreduce_umin_nxv1i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma
				; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vredminu.vs v8, v8, v9			; CHECK-NEXT: vredminu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.umin.nxv1i8(<vscale x 1 x i8> %v)			%red = call i8 @llvm.vector.reduce.umin.nxv1i8(<vscale x 1 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.smin.nxv1i8(<vscale x 1 x i8>)			declare i8 @llvm.vector.reduce.smin.nxv1i8(<vscale x 1 x i8>)

	define signext i8 @vreduce_smin_nxv1i8(<vscale x 1 x i8> %v) {			define signext i8 @vreduce_smin_nxv1i8(<vscale x 1 x i8> %v) {
	; CHECK-LABEL: vreduce_smin_nxv1i8:			; CHECK-LABEL: vreduce_smin_nxv1i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: li a0, 127			; CHECK-NEXT: li a0, 127
	; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, ma			; CHECK-NEXT: vsetvli a1, zero, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.s.x v9, a0
	; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma
	; CHECK-NEXT: vredmin.vs v8, v8, v9			; CHECK-NEXT: vredmin.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.smin.nxv1i8(<vscale x 1 x i8> %v)			%red = call i8 @llvm.vector.reduce.smin.nxv1i8(<vscale x 1 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.and.nxv1i8(<vscale x 1 x i8>)			declare i8 @llvm.vector.reduce.and.nxv1i8(<vscale x 1 x i8>)

	define signext i8 @vreduce_and_nxv1i8(<vscale x 1 x i8> %v) {			define signext i8 @vreduce_and_nxv1i8(<vscale x 1 x i8> %v) {
	; CHECK-LABEL: vreduce_and_nxv1i8:			; CHECK-LABEL: vreduce_and_nxv1i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma
				; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vredand.vs v8, v8, v9			; CHECK-NEXT: vredand.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.and.nxv1i8(<vscale x 1 x i8> %v)			%red = call i8 @llvm.vector.reduce.and.nxv1i8(<vscale x 1 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.or.nxv1i8(<vscale x 1 x i8>)			declare i8 @llvm.vector.reduce.or.nxv1i8(<vscale x 1 x i8>)

	define signext i8 @vreduce_or_nxv1i8(<vscale x 1 x i8> %v) {			define signext i8 @vreduce_or_nxv1i8(<vscale x 1 x i8> %v) {
	; CHECK-LABEL: vreduce_or_nxv1i8:			; CHECK-LABEL: vreduce_or_nxv1i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredor.vs v8, v8, v9			; CHECK-NEXT: vredor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.or.nxv1i8(<vscale x 1 x i8> %v)			%red = call i8 @llvm.vector.reduce.or.nxv1i8(<vscale x 1 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.xor.nxv1i8(<vscale x 1 x i8>)			declare i8 @llvm.vector.reduce.xor.nxv1i8(<vscale x 1 x i8>)

	define signext i8 @vreduce_xor_nxv1i8(<vscale x 1 x i8> %v) {			define signext i8 @vreduce_xor_nxv1i8(<vscale x 1 x i8> %v) {
	; CHECK-LABEL: vreduce_xor_nxv1i8:			; CHECK-LABEL: vreduce_xor_nxv1i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredxor.vs v8, v8, v9			; CHECK-NEXT: vredxor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.xor.nxv1i8(<vscale x 1 x i8> %v)			%red = call i8 @llvm.vector.reduce.xor.nxv1i8(<vscale x 1 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.add.nxv2i8(<vscale x 2 x i8>)			declare i8 @llvm.vector.reduce.add.nxv2i8(<vscale x 2 x i8>)

	define signext i8 @vreduce_add_nxv2i8(<vscale x 2 x i8> %v) {			define signext i8 @vreduce_add_nxv2i8(<vscale x 2 x i8> %v) {
	; CHECK-LABEL: vreduce_add_nxv2i8:			; CHECK-LABEL: vreduce_add_nxv2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredsum.vs v8, v8, v9			; CHECK-NEXT: vredsum.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.add.nxv2i8(<vscale x 2 x i8> %v)			%red = call i8 @llvm.vector.reduce.add.nxv2i8(<vscale x 2 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.umax.nxv2i8(<vscale x 2 x i8>)			declare i8 @llvm.vector.reduce.umax.nxv2i8(<vscale x 2 x i8>)

	define signext i8 @vreduce_umax_nxv2i8(<vscale x 2 x i8> %v) {			define signext i8 @vreduce_umax_nxv2i8(<vscale x 2 x i8> %v) {
	; CHECK-LABEL: vreduce_umax_nxv2i8:			; CHECK-LABEL: vreduce_umax_nxv2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredmaxu.vs v8, v8, v9			; CHECK-NEXT: vredmaxu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.umax.nxv2i8(<vscale x 2 x i8> %v)			%red = call i8 @llvm.vector.reduce.umax.nxv2i8(<vscale x 2 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.smax.nxv2i8(<vscale x 2 x i8>)			declare i8 @llvm.vector.reduce.smax.nxv2i8(<vscale x 2 x i8>)

	define signext i8 @vreduce_smax_nxv2i8(<vscale x 2 x i8> %v) {			define signext i8 @vreduce_smax_nxv2i8(<vscale x 2 x i8> %v) {
	; CHECK-LABEL: vreduce_smax_nxv2i8:			; CHECK-LABEL: vreduce_smax_nxv2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: li a0, -128			; CHECK-NEXT: li a0, -128
	; CHECK-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; CHECK-NEXT: vsetvli a1, zero, e8, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.s.x v9, a0
	; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma
	; CHECK-NEXT: vredmax.vs v8, v8, v9			; CHECK-NEXT: vredmax.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.smax.nxv2i8(<vscale x 2 x i8> %v)			%red = call i8 @llvm.vector.reduce.smax.nxv2i8(<vscale x 2 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.umin.nxv2i8(<vscale x 2 x i8>)			declare i8 @llvm.vector.reduce.umin.nxv2i8(<vscale x 2 x i8>)

	define signext i8 @vreduce_umin_nxv2i8(<vscale x 2 x i8> %v) {			define signext i8 @vreduce_umin_nxv2i8(<vscale x 2 x i8> %v) {
	; CHECK-LABEL: vreduce_umin_nxv2i8:			; CHECK-LABEL: vreduce_umin_nxv2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma
				; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vredminu.vs v8, v8, v9			; CHECK-NEXT: vredminu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.umin.nxv2i8(<vscale x 2 x i8> %v)			%red = call i8 @llvm.vector.reduce.umin.nxv2i8(<vscale x 2 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.smin.nxv2i8(<vscale x 2 x i8>)			declare i8 @llvm.vector.reduce.smin.nxv2i8(<vscale x 2 x i8>)

	define signext i8 @vreduce_smin_nxv2i8(<vscale x 2 x i8> %v) {			define signext i8 @vreduce_smin_nxv2i8(<vscale x 2 x i8> %v) {
	; CHECK-LABEL: vreduce_smin_nxv2i8:			; CHECK-LABEL: vreduce_smin_nxv2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: li a0, 127			; CHECK-NEXT: li a0, 127
	; CHECK-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; CHECK-NEXT: vsetvli a1, zero, e8, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.s.x v9, a0
	; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma
	; CHECK-NEXT: vredmin.vs v8, v8, v9			; CHECK-NEXT: vredmin.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.smin.nxv2i8(<vscale x 2 x i8> %v)			%red = call i8 @llvm.vector.reduce.smin.nxv2i8(<vscale x 2 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.and.nxv2i8(<vscale x 2 x i8>)			declare i8 @llvm.vector.reduce.and.nxv2i8(<vscale x 2 x i8>)

	define signext i8 @vreduce_and_nxv2i8(<vscale x 2 x i8> %v) {			define signext i8 @vreduce_and_nxv2i8(<vscale x 2 x i8> %v) {
	; CHECK-LABEL: vreduce_and_nxv2i8:			; CHECK-LABEL: vreduce_and_nxv2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma
				; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vredand.vs v8, v8, v9			; CHECK-NEXT: vredand.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.and.nxv2i8(<vscale x 2 x i8> %v)			%red = call i8 @llvm.vector.reduce.and.nxv2i8(<vscale x 2 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.or.nxv2i8(<vscale x 2 x i8>)			declare i8 @llvm.vector.reduce.or.nxv2i8(<vscale x 2 x i8>)

	define signext i8 @vreduce_or_nxv2i8(<vscale x 2 x i8> %v) {			define signext i8 @vreduce_or_nxv2i8(<vscale x 2 x i8> %v) {
	; CHECK-LABEL: vreduce_or_nxv2i8:			; CHECK-LABEL: vreduce_or_nxv2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredor.vs v8, v8, v9			; CHECK-NEXT: vredor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.or.nxv2i8(<vscale x 2 x i8> %v)			%red = call i8 @llvm.vector.reduce.or.nxv2i8(<vscale x 2 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.xor.nxv2i8(<vscale x 2 x i8>)			declare i8 @llvm.vector.reduce.xor.nxv2i8(<vscale x 2 x i8>)

	define signext i8 @vreduce_xor_nxv2i8(<vscale x 2 x i8> %v) {			define signext i8 @vreduce_xor_nxv2i8(<vscale x 2 x i8> %v) {
	; CHECK-LABEL: vreduce_xor_nxv2i8:			; CHECK-LABEL: vreduce_xor_nxv2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredxor.vs v8, v8, v9			; CHECK-NEXT: vredxor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.xor.nxv2i8(<vscale x 2 x i8> %v)			%red = call i8 @llvm.vector.reduce.xor.nxv2i8(<vscale x 2 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.add.nxv4i8(<vscale x 4 x i8>)			declare i8 @llvm.vector.reduce.add.nxv4i8(<vscale x 4 x i8>)

	define signext i8 @vreduce_add_nxv4i8(<vscale x 4 x i8> %v) {			define signext i8 @vreduce_add_nxv4i8(<vscale x 4 x i8> %v) {
	; CHECK-LABEL: vreduce_add_nxv4i8:			; CHECK-LABEL: vreduce_add_nxv4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredsum.vs v8, v8, v9			; CHECK-NEXT: vredsum.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.add.nxv4i8(<vscale x 4 x i8> %v)			%red = call i8 @llvm.vector.reduce.add.nxv4i8(<vscale x 4 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.umax.nxv4i8(<vscale x 4 x i8>)			declare i8 @llvm.vector.reduce.umax.nxv4i8(<vscale x 4 x i8>)

	define signext i8 @vreduce_umax_nxv4i8(<vscale x 4 x i8> %v) {			define signext i8 @vreduce_umax_nxv4i8(<vscale x 4 x i8> %v) {
	; CHECK-LABEL: vreduce_umax_nxv4i8:			; CHECK-LABEL: vreduce_umax_nxv4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredmaxu.vs v8, v8, v9			; CHECK-NEXT: vredmaxu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.umax.nxv4i8(<vscale x 4 x i8> %v)			%red = call i8 @llvm.vector.reduce.umax.nxv4i8(<vscale x 4 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.smax.nxv4i8(<vscale x 4 x i8>)			declare i8 @llvm.vector.reduce.smax.nxv4i8(<vscale x 4 x i8>)

	define signext i8 @vreduce_smax_nxv4i8(<vscale x 4 x i8> %v) {			define signext i8 @vreduce_smax_nxv4i8(<vscale x 4 x i8> %v) {
	; CHECK-LABEL: vreduce_smax_nxv4i8:			; CHECK-LABEL: vreduce_smax_nxv4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: li a0, -128			; CHECK-NEXT: li a0, -128
	; CHECK-NEXT: vsetivli zero, 1, e8, mf2, ta, ma			; CHECK-NEXT: vsetvli a1, zero, e8, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.s.x v9, a0
	; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma
	; CHECK-NEXT: vredmax.vs v8, v8, v9			; CHECK-NEXT: vredmax.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.smax.nxv4i8(<vscale x 4 x i8> %v)			%red = call i8 @llvm.vector.reduce.smax.nxv4i8(<vscale x 4 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.umin.nxv4i8(<vscale x 4 x i8>)			declare i8 @llvm.vector.reduce.umin.nxv4i8(<vscale x 4 x i8>)

	define signext i8 @vreduce_umin_nxv4i8(<vscale x 4 x i8> %v) {			define signext i8 @vreduce_umin_nxv4i8(<vscale x 4 x i8> %v) {
	; CHECK-LABEL: vreduce_umin_nxv4i8:			; CHECK-LABEL: vreduce_umin_nxv4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, mf2, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma
				; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vredminu.vs v8, v8, v9			; CHECK-NEXT: vredminu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.umin.nxv4i8(<vscale x 4 x i8> %v)			%red = call i8 @llvm.vector.reduce.umin.nxv4i8(<vscale x 4 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.smin.nxv4i8(<vscale x 4 x i8>)			declare i8 @llvm.vector.reduce.smin.nxv4i8(<vscale x 4 x i8>)

	define signext i8 @vreduce_smin_nxv4i8(<vscale x 4 x i8> %v) {			define signext i8 @vreduce_smin_nxv4i8(<vscale x 4 x i8> %v) {
	; CHECK-LABEL: vreduce_smin_nxv4i8:			; CHECK-LABEL: vreduce_smin_nxv4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: li a0, 127			; CHECK-NEXT: li a0, 127
	; CHECK-NEXT: vsetivli zero, 1, e8, mf2, ta, ma			; CHECK-NEXT: vsetvli a1, zero, e8, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.s.x v9, a0
	; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma
	; CHECK-NEXT: vredmin.vs v8, v8, v9			; CHECK-NEXT: vredmin.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.smin.nxv4i8(<vscale x 4 x i8> %v)			%red = call i8 @llvm.vector.reduce.smin.nxv4i8(<vscale x 4 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.and.nxv4i8(<vscale x 4 x i8>)			declare i8 @llvm.vector.reduce.and.nxv4i8(<vscale x 4 x i8>)

	define signext i8 @vreduce_and_nxv4i8(<vscale x 4 x i8> %v) {			define signext i8 @vreduce_and_nxv4i8(<vscale x 4 x i8> %v) {
	; CHECK-LABEL: vreduce_and_nxv4i8:			; CHECK-LABEL: vreduce_and_nxv4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, mf2, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma
				; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vredand.vs v8, v8, v9			; CHECK-NEXT: vredand.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.and.nxv4i8(<vscale x 4 x i8> %v)			%red = call i8 @llvm.vector.reduce.and.nxv4i8(<vscale x 4 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.or.nxv4i8(<vscale x 4 x i8>)			declare i8 @llvm.vector.reduce.or.nxv4i8(<vscale x 4 x i8>)

	define signext i8 @vreduce_or_nxv4i8(<vscale x 4 x i8> %v) {			define signext i8 @vreduce_or_nxv4i8(<vscale x 4 x i8> %v) {
	; CHECK-LABEL: vreduce_or_nxv4i8:			; CHECK-LABEL: vreduce_or_nxv4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredor.vs v8, v8, v9			; CHECK-NEXT: vredor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.or.nxv4i8(<vscale x 4 x i8> %v)			%red = call i8 @llvm.vector.reduce.or.nxv4i8(<vscale x 4 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.xor.nxv4i8(<vscale x 4 x i8>)			declare i8 @llvm.vector.reduce.xor.nxv4i8(<vscale x 4 x i8>)

	define signext i8 @vreduce_xor_nxv4i8(<vscale x 4 x i8> %v) {			define signext i8 @vreduce_xor_nxv4i8(<vscale x 4 x i8> %v) {
	; CHECK-LABEL: vreduce_xor_nxv4i8:			; CHECK-LABEL: vreduce_xor_nxv4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredxor.vs v8, v8, v9			; CHECK-NEXT: vredxor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i8 @llvm.vector.reduce.xor.nxv4i8(<vscale x 4 x i8> %v)			%red = call i8 @llvm.vector.reduce.xor.nxv4i8(<vscale x 4 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i16 @llvm.vector.reduce.add.nxv1i16(<vscale x 1 x i16>)			declare i16 @llvm.vector.reduce.add.nxv1i16(<vscale x 1 x i16>)

	define signext i16 @vreduce_add_nxv1i16(<vscale x 1 x i16> %v) {			define signext i16 @vreduce_add_nxv1i16(<vscale x 1 x i16> %v) {
	; CHECK-LABEL: vreduce_add_nxv1i16:			; CHECK-LABEL: vreduce_add_nxv1i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredsum.vs v8, v8, v9			; CHECK-NEXT: vredsum.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.add.nxv1i16(<vscale x 1 x i16> %v)			%red = call i16 @llvm.vector.reduce.add.nxv1i16(<vscale x 1 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	define signext i16 @vwreduce_add_nxv1i8(<vscale x 1 x i8> %v) {			define signext i16 @vwreduce_add_nxv1i8(<vscale x 1 x i8> %v) {
	; CHECK-LABEL: vwreduce_add_nxv1i8:			; CHECK-LABEL: vwreduce_add_nxv1i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, ma
	; CHECK-NEXT: vwredsum.vs v8, v8, v9			; CHECK-NEXT: vwredsum.vs v8, v8, v9
	; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = sext <vscale x 1 x i8> %v to <vscale x 1 x i16>			%e = sext <vscale x 1 x i8> %v to <vscale x 1 x i16>
	%red = call i16 @llvm.vector.reduce.add.nxv1i16(<vscale x 1 x i16> %e)			%red = call i16 @llvm.vector.reduce.add.nxv1i16(<vscale x 1 x i16> %e)
	ret i16 %red			ret i16 %red
	}			}

	define signext i16 @vwreduce_uadd_nxv1i8(<vscale x 1 x i8> %v) {			define signext i16 @vwreduce_uadd_nxv1i8(<vscale x 1 x i8> %v) {
	; CHECK-LABEL: vwreduce_uadd_nxv1i8:			; CHECK-LABEL: vwreduce_uadd_nxv1i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, ma
	; CHECK-NEXT: vwredsum.vs v8, v8, v9			; CHECK-NEXT: vwredsum.vs v8, v8, v9
	; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = sext <vscale x 1 x i8> %v to <vscale x 1 x i16>			%e = sext <vscale x 1 x i8> %v to <vscale x 1 x i16>
	%red = call i16 @llvm.vector.reduce.add.nxv1i16(<vscale x 1 x i16> %e)			%red = call i16 @llvm.vector.reduce.add.nxv1i16(<vscale x 1 x i16> %e)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.umax.nxv1i16(<vscale x 1 x i16>)			declare i16 @llvm.vector.reduce.umax.nxv1i16(<vscale x 1 x i16>)

	define signext i16 @vreduce_umax_nxv1i16(<vscale x 1 x i16> %v) {			define signext i16 @vreduce_umax_nxv1i16(<vscale x 1 x i16> %v) {
	; CHECK-LABEL: vreduce_umax_nxv1i16:			; CHECK-LABEL: vreduce_umax_nxv1i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredmaxu.vs v8, v8, v9			; CHECK-NEXT: vredmaxu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.umax.nxv1i16(<vscale x 1 x i16> %v)			%red = call i16 @llvm.vector.reduce.umax.nxv1i16(<vscale x 1 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.smax.nxv1i16(<vscale x 1 x i16>)			declare i16 @llvm.vector.reduce.smax.nxv1i16(<vscale x 1 x i16>)

	define signext i16 @vreduce_smax_nxv1i16(<vscale x 1 x i16> %v) {			define signext i16 @vreduce_smax_nxv1i16(<vscale x 1 x i16> %v) {
	; CHECK-LABEL: vreduce_smax_nxv1i16:			; CHECK-LABEL: vreduce_smax_nxv1i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, 1048568			; CHECK-NEXT: lui a0, 1048568
	; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli a1, zero, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.s.x v9, a0
	; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
	; CHECK-NEXT: vredmax.vs v8, v8, v9			; CHECK-NEXT: vredmax.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.smax.nxv1i16(<vscale x 1 x i16> %v)			%red = call i16 @llvm.vector.reduce.smax.nxv1i16(<vscale x 1 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.umin.nxv1i16(<vscale x 1 x i16>)			declare i16 @llvm.vector.reduce.umin.nxv1i16(<vscale x 1 x i16>)

	define signext i16 @vreduce_umin_nxv1i16(<vscale x 1 x i16> %v) {			define signext i16 @vreduce_umin_nxv1i16(<vscale x 1 x i16> %v) {
	; CHECK-LABEL: vreduce_umin_nxv1i16:			; CHECK-LABEL: vreduce_umin_nxv1i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
				; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vredminu.vs v8, v8, v9			; CHECK-NEXT: vredminu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.umin.nxv1i16(<vscale x 1 x i16> %v)			%red = call i16 @llvm.vector.reduce.umin.nxv1i16(<vscale x 1 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.smin.nxv1i16(<vscale x 1 x i16>)			declare i16 @llvm.vector.reduce.smin.nxv1i16(<vscale x 1 x i16>)

	define signext i16 @vreduce_smin_nxv1i16(<vscale x 1 x i16> %v) {			define signext i16 @vreduce_smin_nxv1i16(<vscale x 1 x i16> %v) {
	; RV32-LABEL: vreduce_smin_nxv1i16:			; RV32-LABEL: vreduce_smin_nxv1i16:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: lui a0, 8			; RV32-NEXT: lui a0, 8
	; RV32-NEXT: addi a0, a0, -1			; RV32-NEXT: addi a0, a0, -1
	; RV32-NEXT: vsetivli zero, 1, e16, mf4, ta, ma			; RV32-NEXT: vsetvli a1, zero, e16, mf4, ta, ma
	; RV32-NEXT: vmv.s.x v9, a0			; RV32-NEXT: vmv.s.x v9, a0
	; RV32-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
	; RV32-NEXT: vredmin.vs v8, v8, v9			; RV32-NEXT: vredmin.vs v8, v8, v9
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_smin_nxv1i16:			; RV64-LABEL: vreduce_smin_nxv1i16:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 8			; RV64-NEXT: lui a0, 8
	; RV64-NEXT: addiw a0, a0, -1			; RV64-NEXT: addiw a0, a0, -1
	; RV64-NEXT: vsetivli zero, 1, e16, mf4, ta, ma			; RV64-NEXT: vsetvli a1, zero, e16, mf4, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
	; RV64-NEXT: vredmin.vs v8, v8, v9			; RV64-NEXT: vredmin.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i16 @llvm.vector.reduce.smin.nxv1i16(<vscale x 1 x i16> %v)			%red = call i16 @llvm.vector.reduce.smin.nxv1i16(<vscale x 1 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.and.nxv1i16(<vscale x 1 x i16>)			declare i16 @llvm.vector.reduce.and.nxv1i16(<vscale x 1 x i16>)

	define signext i16 @vreduce_and_nxv1i16(<vscale x 1 x i16> %v) {			define signext i16 @vreduce_and_nxv1i16(<vscale x 1 x i16> %v) {
	; CHECK-LABEL: vreduce_and_nxv1i16:			; CHECK-LABEL: vreduce_and_nxv1i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
				; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vredand.vs v8, v8, v9			; CHECK-NEXT: vredand.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.and.nxv1i16(<vscale x 1 x i16> %v)			%red = call i16 @llvm.vector.reduce.and.nxv1i16(<vscale x 1 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.or.nxv1i16(<vscale x 1 x i16>)			declare i16 @llvm.vector.reduce.or.nxv1i16(<vscale x 1 x i16>)

	define signext i16 @vreduce_or_nxv1i16(<vscale x 1 x i16> %v) {			define signext i16 @vreduce_or_nxv1i16(<vscale x 1 x i16> %v) {
	; CHECK-LABEL: vreduce_or_nxv1i16:			; CHECK-LABEL: vreduce_or_nxv1i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredor.vs v8, v8, v9			; CHECK-NEXT: vredor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.or.nxv1i16(<vscale x 1 x i16> %v)			%red = call i16 @llvm.vector.reduce.or.nxv1i16(<vscale x 1 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.xor.nxv1i16(<vscale x 1 x i16>)			declare i16 @llvm.vector.reduce.xor.nxv1i16(<vscale x 1 x i16>)

	define signext i16 @vreduce_xor_nxv1i16(<vscale x 1 x i16> %v) {			define signext i16 @vreduce_xor_nxv1i16(<vscale x 1 x i16> %v) {
	; CHECK-LABEL: vreduce_xor_nxv1i16:			; CHECK-LABEL: vreduce_xor_nxv1i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredxor.vs v8, v8, v9			; CHECK-NEXT: vredxor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.xor.nxv1i16(<vscale x 1 x i16> %v)			%red = call i16 @llvm.vector.reduce.xor.nxv1i16(<vscale x 1 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.add.nxv2i16(<vscale x 2 x i16>)			declare i16 @llvm.vector.reduce.add.nxv2i16(<vscale x 2 x i16>)

	define signext i16 @vreduce_add_nxv2i16(<vscale x 2 x i16> %v) {			define signext i16 @vreduce_add_nxv2i16(<vscale x 2 x i16> %v) {
	; CHECK-LABEL: vreduce_add_nxv2i16:			; CHECK-LABEL: vreduce_add_nxv2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredsum.vs v8, v8, v9			; CHECK-NEXT: vredsum.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.add.nxv2i16(<vscale x 2 x i16> %v)			%red = call i16 @llvm.vector.reduce.add.nxv2i16(<vscale x 2 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	define signext i16 @vwreduce_add_nxv2i8(<vscale x 2 x i8> %v) {			define signext i16 @vwreduce_add_nxv2i8(<vscale x 2 x i8> %v) {
	; CHECK-LABEL: vwreduce_add_nxv2i8:			; CHECK-LABEL: vwreduce_add_nxv2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, ma
	; CHECK-NEXT: vwredsum.vs v8, v8, v9			; CHECK-NEXT: vwredsum.vs v8, v8, v9
	; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = sext <vscale x 2 x i8> %v to <vscale x 2 x i16>			%e = sext <vscale x 2 x i8> %v to <vscale x 2 x i16>
	%red = call i16 @llvm.vector.reduce.add.nxv2i16(<vscale x 2 x i16> %e)			%red = call i16 @llvm.vector.reduce.add.nxv2i16(<vscale x 2 x i16> %e)
	ret i16 %red			ret i16 %red
	}			}

	define signext i16 @vwreduce_uadd_nxv2i8(<vscale x 2 x i8> %v) {			define signext i16 @vwreduce_uadd_nxv2i8(<vscale x 2 x i8> %v) {
	; CHECK-LABEL: vwreduce_uadd_nxv2i8:			; CHECK-LABEL: vwreduce_uadd_nxv2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, ma
	; CHECK-NEXT: vwredsum.vs v8, v8, v9			; CHECK-NEXT: vwredsum.vs v8, v8, v9
	; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = sext <vscale x 2 x i8> %v to <vscale x 2 x i16>			%e = sext <vscale x 2 x i8> %v to <vscale x 2 x i16>
	%red = call i16 @llvm.vector.reduce.add.nxv2i16(<vscale x 2 x i16> %e)			%red = call i16 @llvm.vector.reduce.add.nxv2i16(<vscale x 2 x i16> %e)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.umax.nxv2i16(<vscale x 2 x i16>)			declare i16 @llvm.vector.reduce.umax.nxv2i16(<vscale x 2 x i16>)

	define signext i16 @vreduce_umax_nxv2i16(<vscale x 2 x i16> %v) {			define signext i16 @vreduce_umax_nxv2i16(<vscale x 2 x i16> %v) {
	; CHECK-LABEL: vreduce_umax_nxv2i16:			; CHECK-LABEL: vreduce_umax_nxv2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredmaxu.vs v8, v8, v9			; CHECK-NEXT: vredmaxu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.umax.nxv2i16(<vscale x 2 x i16> %v)			%red = call i16 @llvm.vector.reduce.umax.nxv2i16(<vscale x 2 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.smax.nxv2i16(<vscale x 2 x i16>)			declare i16 @llvm.vector.reduce.smax.nxv2i16(<vscale x 2 x i16>)

	define signext i16 @vreduce_smax_nxv2i16(<vscale x 2 x i16> %v) {			define signext i16 @vreduce_smax_nxv2i16(<vscale x 2 x i16> %v) {
	; CHECK-LABEL: vreduce_smax_nxv2i16:			; CHECK-LABEL: vreduce_smax_nxv2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, 1048568			; CHECK-NEXT: lui a0, 1048568
	; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; CHECK-NEXT: vsetvli a1, zero, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.s.x v9, a0
	; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
	; CHECK-NEXT: vredmax.vs v8, v8, v9			; CHECK-NEXT: vredmax.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.smax.nxv2i16(<vscale x 2 x i16> %v)			%red = call i16 @llvm.vector.reduce.smax.nxv2i16(<vscale x 2 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.umin.nxv2i16(<vscale x 2 x i16>)			declare i16 @llvm.vector.reduce.umin.nxv2i16(<vscale x 2 x i16>)

	define signext i16 @vreduce_umin_nxv2i16(<vscale x 2 x i16> %v) {			define signext i16 @vreduce_umin_nxv2i16(<vscale x 2 x i16> %v) {
	; CHECK-LABEL: vreduce_umin_nxv2i16:			; CHECK-LABEL: vreduce_umin_nxv2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
				; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vredminu.vs v8, v8, v9			; CHECK-NEXT: vredminu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.umin.nxv2i16(<vscale x 2 x i16> %v)			%red = call i16 @llvm.vector.reduce.umin.nxv2i16(<vscale x 2 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.smin.nxv2i16(<vscale x 2 x i16>)			declare i16 @llvm.vector.reduce.smin.nxv2i16(<vscale x 2 x i16>)

	define signext i16 @vreduce_smin_nxv2i16(<vscale x 2 x i16> %v) {			define signext i16 @vreduce_smin_nxv2i16(<vscale x 2 x i16> %v) {
	; RV32-LABEL: vreduce_smin_nxv2i16:			; RV32-LABEL: vreduce_smin_nxv2i16:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: lui a0, 8			; RV32-NEXT: lui a0, 8
	; RV32-NEXT: addi a0, a0, -1			; RV32-NEXT: addi a0, a0, -1
	; RV32-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; RV32-NEXT: vsetvli a1, zero, e16, mf2, ta, ma
	; RV32-NEXT: vmv.s.x v9, a0			; RV32-NEXT: vmv.s.x v9, a0
	; RV32-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
	; RV32-NEXT: vredmin.vs v8, v8, v9			; RV32-NEXT: vredmin.vs v8, v8, v9
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_smin_nxv2i16:			; RV64-LABEL: vreduce_smin_nxv2i16:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 8			; RV64-NEXT: lui a0, 8
	; RV64-NEXT: addiw a0, a0, -1			; RV64-NEXT: addiw a0, a0, -1
	; RV64-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; RV64-NEXT: vsetvli a1, zero, e16, mf2, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
	; RV64-NEXT: vredmin.vs v8, v8, v9			; RV64-NEXT: vredmin.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i16 @llvm.vector.reduce.smin.nxv2i16(<vscale x 2 x i16> %v)			%red = call i16 @llvm.vector.reduce.smin.nxv2i16(<vscale x 2 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.and.nxv2i16(<vscale x 2 x i16>)			declare i16 @llvm.vector.reduce.and.nxv2i16(<vscale x 2 x i16>)

	define signext i16 @vreduce_and_nxv2i16(<vscale x 2 x i16> %v) {			define signext i16 @vreduce_and_nxv2i16(<vscale x 2 x i16> %v) {
	; CHECK-LABEL: vreduce_and_nxv2i16:			; CHECK-LABEL: vreduce_and_nxv2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
				; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vredand.vs v8, v8, v9			; CHECK-NEXT: vredand.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.and.nxv2i16(<vscale x 2 x i16> %v)			%red = call i16 @llvm.vector.reduce.and.nxv2i16(<vscale x 2 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.or.nxv2i16(<vscale x 2 x i16>)			declare i16 @llvm.vector.reduce.or.nxv2i16(<vscale x 2 x i16>)

	define signext i16 @vreduce_or_nxv2i16(<vscale x 2 x i16> %v) {			define signext i16 @vreduce_or_nxv2i16(<vscale x 2 x i16> %v) {
	; CHECK-LABEL: vreduce_or_nxv2i16:			; CHECK-LABEL: vreduce_or_nxv2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredor.vs v8, v8, v9			; CHECK-NEXT: vredor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.or.nxv2i16(<vscale x 2 x i16> %v)			%red = call i16 @llvm.vector.reduce.or.nxv2i16(<vscale x 2 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.xor.nxv2i16(<vscale x 2 x i16>)			declare i16 @llvm.vector.reduce.xor.nxv2i16(<vscale x 2 x i16>)

	define signext i16 @vreduce_xor_nxv2i16(<vscale x 2 x i16> %v) {			define signext i16 @vreduce_xor_nxv2i16(<vscale x 2 x i16> %v) {
	; CHECK-LABEL: vreduce_xor_nxv2i16:			; CHECK-LABEL: vreduce_xor_nxv2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredxor.vs v8, v8, v9			; CHECK-NEXT: vredxor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.xor.nxv2i16(<vscale x 2 x i16> %v)			%red = call i16 @llvm.vector.reduce.xor.nxv2i16(<vscale x 2 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.add.nxv4i16(<vscale x 4 x i16>)			declare i16 @llvm.vector.reduce.add.nxv4i16(<vscale x 4 x i16>)

	define signext i16 @vreduce_add_nxv4i16(<vscale x 4 x i16> %v) {			define signext i16 @vreduce_add_nxv4i16(<vscale x 4 x i16> %v) {
	; CHECK-LABEL: vreduce_add_nxv4i16:			; CHECK-LABEL: vreduce_add_nxv4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredsum.vs v8, v8, v9			; CHECK-NEXT: vredsum.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.add.nxv4i16(<vscale x 4 x i16> %v)			%red = call i16 @llvm.vector.reduce.add.nxv4i16(<vscale x 4 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	define signext i16 @vwreduce_add_nxv4i8(<vscale x 4 x i8> %v) {			define signext i16 @vwreduce_add_nxv4i8(<vscale x 4 x i8> %v) {
	; CHECK-LABEL: vwreduce_add_nxv4i8:			; CHECK-LABEL: vwreduce_add_nxv4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf2, ta, ma
	; CHECK-NEXT: vwredsum.vs v8, v8, v9			; CHECK-NEXT: vwredsum.vs v8, v8, v9
	; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = sext <vscale x 4 x i8> %v to <vscale x 4 x i16>			%e = sext <vscale x 4 x i8> %v to <vscale x 4 x i16>
	%red = call i16 @llvm.vector.reduce.add.nxv4i16(<vscale x 4 x i16> %e)			%red = call i16 @llvm.vector.reduce.add.nxv4i16(<vscale x 4 x i16> %e)
	ret i16 %red			ret i16 %red
	}			}

	define signext i16 @vwreduce_uadd_nxv4i8(<vscale x 4 x i8> %v) {			define signext i16 @vwreduce_uadd_nxv4i8(<vscale x 4 x i8> %v) {
	; CHECK-LABEL: vwreduce_uadd_nxv4i8:			; CHECK-LABEL: vwreduce_uadd_nxv4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf2, ta, ma
	; CHECK-NEXT: vwredsum.vs v8, v8, v9			; CHECK-NEXT: vwredsum.vs v8, v8, v9
	; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = sext <vscale x 4 x i8> %v to <vscale x 4 x i16>			%e = sext <vscale x 4 x i8> %v to <vscale x 4 x i16>
	%red = call i16 @llvm.vector.reduce.add.nxv4i16(<vscale x 4 x i16> %e)			%red = call i16 @llvm.vector.reduce.add.nxv4i16(<vscale x 4 x i16> %e)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.umax.nxv4i16(<vscale x 4 x i16>)			declare i16 @llvm.vector.reduce.umax.nxv4i16(<vscale x 4 x i16>)

	define signext i16 @vreduce_umax_nxv4i16(<vscale x 4 x i16> %v) {			define signext i16 @vreduce_umax_nxv4i16(<vscale x 4 x i16> %v) {
	; CHECK-LABEL: vreduce_umax_nxv4i16:			; CHECK-LABEL: vreduce_umax_nxv4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredmaxu.vs v8, v8, v9			; CHECK-NEXT: vredmaxu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.umax.nxv4i16(<vscale x 4 x i16> %v)			%red = call i16 @llvm.vector.reduce.umax.nxv4i16(<vscale x 4 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.smax.nxv4i16(<vscale x 4 x i16>)			declare i16 @llvm.vector.reduce.smax.nxv4i16(<vscale x 4 x i16>)

	define signext i16 @vreduce_smax_nxv4i16(<vscale x 4 x i16> %v) {			define signext i16 @vreduce_smax_nxv4i16(<vscale x 4 x i16> %v) {
	; CHECK-LABEL: vreduce_smax_nxv4i16:			; CHECK-LABEL: vreduce_smax_nxv4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, 1048568			; CHECK-NEXT: lui a0, 1048568
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a1, zero, e16, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.s.x v9, a0
	; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
	; CHECK-NEXT: vredmax.vs v8, v8, v9			; CHECK-NEXT: vredmax.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.smax.nxv4i16(<vscale x 4 x i16> %v)			%red = call i16 @llvm.vector.reduce.smax.nxv4i16(<vscale x 4 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.umin.nxv4i16(<vscale x 4 x i16>)			declare i16 @llvm.vector.reduce.umin.nxv4i16(<vscale x 4 x i16>)

	define signext i16 @vreduce_umin_nxv4i16(<vscale x 4 x i16> %v) {			define signext i16 @vreduce_umin_nxv4i16(<vscale x 4 x i16> %v) {
	; CHECK-LABEL: vreduce_umin_nxv4i16:			; CHECK-LABEL: vreduce_umin_nxv4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
				; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vredminu.vs v8, v8, v9			; CHECK-NEXT: vredminu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.umin.nxv4i16(<vscale x 4 x i16> %v)			%red = call i16 @llvm.vector.reduce.umin.nxv4i16(<vscale x 4 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.smin.nxv4i16(<vscale x 4 x i16>)			declare i16 @llvm.vector.reduce.smin.nxv4i16(<vscale x 4 x i16>)

	define signext i16 @vreduce_smin_nxv4i16(<vscale x 4 x i16> %v) {			define signext i16 @vreduce_smin_nxv4i16(<vscale x 4 x i16> %v) {
	; RV32-LABEL: vreduce_smin_nxv4i16:			; RV32-LABEL: vreduce_smin_nxv4i16:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: lui a0, 8			; RV32-NEXT: lui a0, 8
	; RV32-NEXT: addi a0, a0, -1			; RV32-NEXT: addi a0, a0, -1
	; RV32-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; RV32-NEXT: vsetvli a1, zero, e16, m1, ta, ma
	; RV32-NEXT: vmv.s.x v9, a0			; RV32-NEXT: vmv.s.x v9, a0
	; RV32-NEXT: vsetvli a0, zero, e16, m1, ta, ma
	; RV32-NEXT: vredmin.vs v8, v8, v9			; RV32-NEXT: vredmin.vs v8, v8, v9
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_smin_nxv4i16:			; RV64-LABEL: vreduce_smin_nxv4i16:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 8			; RV64-NEXT: lui a0, 8
	; RV64-NEXT: addiw a0, a0, -1			; RV64-NEXT: addiw a0, a0, -1
	; RV64-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; RV64-NEXT: vsetvli a1, zero, e16, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli a0, zero, e16, m1, ta, ma
	; RV64-NEXT: vredmin.vs v8, v8, v9			; RV64-NEXT: vredmin.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i16 @llvm.vector.reduce.smin.nxv4i16(<vscale x 4 x i16> %v)			%red = call i16 @llvm.vector.reduce.smin.nxv4i16(<vscale x 4 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.and.nxv4i16(<vscale x 4 x i16>)			declare i16 @llvm.vector.reduce.and.nxv4i16(<vscale x 4 x i16>)

	define signext i16 @vreduce_and_nxv4i16(<vscale x 4 x i16> %v) {			define signext i16 @vreduce_and_nxv4i16(<vscale x 4 x i16> %v) {
	; CHECK-LABEL: vreduce_and_nxv4i16:			; CHECK-LABEL: vreduce_and_nxv4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
				; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vredand.vs v8, v8, v9			; CHECK-NEXT: vredand.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.and.nxv4i16(<vscale x 4 x i16> %v)			%red = call i16 @llvm.vector.reduce.and.nxv4i16(<vscale x 4 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.or.nxv4i16(<vscale x 4 x i16>)			declare i16 @llvm.vector.reduce.or.nxv4i16(<vscale x 4 x i16>)

	define signext i16 @vreduce_or_nxv4i16(<vscale x 4 x i16> %v) {			define signext i16 @vreduce_or_nxv4i16(<vscale x 4 x i16> %v) {
	; CHECK-LABEL: vreduce_or_nxv4i16:			; CHECK-LABEL: vreduce_or_nxv4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredor.vs v8, v8, v9			; CHECK-NEXT: vredor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.or.nxv4i16(<vscale x 4 x i16> %v)			%red = call i16 @llvm.vector.reduce.or.nxv4i16(<vscale x 4 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.xor.nxv4i16(<vscale x 4 x i16>)			declare i16 @llvm.vector.reduce.xor.nxv4i16(<vscale x 4 x i16>)

	define signext i16 @vreduce_xor_nxv4i16(<vscale x 4 x i16> %v) {			define signext i16 @vreduce_xor_nxv4i16(<vscale x 4 x i16> %v) {
	; CHECK-LABEL: vreduce_xor_nxv4i16:			; CHECK-LABEL: vreduce_xor_nxv4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredxor.vs v8, v8, v9			; CHECK-NEXT: vredxor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i16 @llvm.vector.reduce.xor.nxv4i16(<vscale x 4 x i16> %v)			%red = call i16 @llvm.vector.reduce.xor.nxv4i16(<vscale x 4 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i32 @llvm.vector.reduce.add.nxv1i32(<vscale x 1 x i32>)			declare i32 @llvm.vector.reduce.add.nxv1i32(<vscale x 1 x i32>)

	define signext i32 @vreduce_add_nxv1i32(<vscale x 1 x i32> %v) {			define signext i32 @vreduce_add_nxv1i32(<vscale x 1 x i32> %v) {
	; CHECK-LABEL: vreduce_add_nxv1i32:			; CHECK-LABEL: vreduce_add_nxv1i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredsum.vs v8, v8, v9			; CHECK-NEXT: vredsum.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.add.nxv1i32(<vscale x 1 x i32> %v)			%red = call i32 @llvm.vector.reduce.add.nxv1i32(<vscale x 1 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	define signext i32 @vwreduce_add_nxv1i16(<vscale x 1 x i16> %v) {			define signext i32 @vwreduce_add_nxv1i16(<vscale x 1 x i16> %v) {
	; CHECK-LABEL: vwreduce_add_nxv1i16:			; CHECK-LABEL: vwreduce_add_nxv1i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, ma
	; CHECK-NEXT: vwredsum.vs v8, v8, v9			; CHECK-NEXT: vwredsum.vs v8, v8, v9
	; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = sext <vscale x 1 x i16> %v to <vscale x 1 x i32>			%e = sext <vscale x 1 x i16> %v to <vscale x 1 x i32>
	%red = call i32 @llvm.vector.reduce.add.nxv1i32(<vscale x 1 x i32> %e)			%red = call i32 @llvm.vector.reduce.add.nxv1i32(<vscale x 1 x i32> %e)
	ret i32 %red			ret i32 %red
	}			}

	define signext i32 @vwreduce_uadd_nxv1i16(<vscale x 1 x i16> %v) {			define signext i32 @vwreduce_uadd_nxv1i16(<vscale x 1 x i16> %v) {
	; CHECK-LABEL: vwreduce_uadd_nxv1i16:			; CHECK-LABEL: vwreduce_uadd_nxv1i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, ma
	; CHECK-NEXT: vwredsumu.vs v8, v8, v9			; CHECK-NEXT: vwredsumu.vs v8, v8, v9
	; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = zext <vscale x 1 x i16> %v to <vscale x 1 x i32>			%e = zext <vscale x 1 x i16> %v to <vscale x 1 x i32>
	%red = call i32 @llvm.vector.reduce.add.nxv1i32(<vscale x 1 x i32> %e)			%red = call i32 @llvm.vector.reduce.add.nxv1i32(<vscale x 1 x i32> %e)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.umax.nxv1i32(<vscale x 1 x i32>)			declare i32 @llvm.vector.reduce.umax.nxv1i32(<vscale x 1 x i32>)

	define signext i32 @vreduce_umax_nxv1i32(<vscale x 1 x i32> %v) {			define signext i32 @vreduce_umax_nxv1i32(<vscale x 1 x i32> %v) {
	; CHECK-LABEL: vreduce_umax_nxv1i32:			; CHECK-LABEL: vreduce_umax_nxv1i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredmaxu.vs v8, v8, v9			; CHECK-NEXT: vredmaxu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.umax.nxv1i32(<vscale x 1 x i32> %v)			%red = call i32 @llvm.vector.reduce.umax.nxv1i32(<vscale x 1 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.smax.nxv1i32(<vscale x 1 x i32>)			declare i32 @llvm.vector.reduce.smax.nxv1i32(<vscale x 1 x i32>)

	define signext i32 @vreduce_smax_nxv1i32(<vscale x 1 x i32> %v) {			define signext i32 @vreduce_smax_nxv1i32(<vscale x 1 x i32> %v) {
	; CHECK-LABEL: vreduce_smax_nxv1i32:			; CHECK-LABEL: vreduce_smax_nxv1i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, 524288			; CHECK-NEXT: lui a0, 524288
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli a1, zero, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.s.x v9, a0
	; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
	; CHECK-NEXT: vredmax.vs v8, v8, v9			; CHECK-NEXT: vredmax.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.smax.nxv1i32(<vscale x 1 x i32> %v)			%red = call i32 @llvm.vector.reduce.smax.nxv1i32(<vscale x 1 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.umin.nxv1i32(<vscale x 1 x i32>)			declare i32 @llvm.vector.reduce.umin.nxv1i32(<vscale x 1 x i32>)

	define signext i32 @vreduce_umin_nxv1i32(<vscale x 1 x i32> %v) {			define signext i32 @vreduce_umin_nxv1i32(<vscale x 1 x i32> %v) {
	; CHECK-LABEL: vreduce_umin_nxv1i32:			; CHECK-LABEL: vreduce_umin_nxv1i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
				; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vredminu.vs v8, v8, v9			; CHECK-NEXT: vredminu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.umin.nxv1i32(<vscale x 1 x i32> %v)			%red = call i32 @llvm.vector.reduce.umin.nxv1i32(<vscale x 1 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.smin.nxv1i32(<vscale x 1 x i32>)			declare i32 @llvm.vector.reduce.smin.nxv1i32(<vscale x 1 x i32>)

	define signext i32 @vreduce_smin_nxv1i32(<vscale x 1 x i32> %v) {			define signext i32 @vreduce_smin_nxv1i32(<vscale x 1 x i32> %v) {
	; RV32-LABEL: vreduce_smin_nxv1i32:			; RV32-LABEL: vreduce_smin_nxv1i32:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: lui a0, 524288			; RV32-NEXT: lui a0, 524288
	; RV32-NEXT: addi a0, a0, -1			; RV32-NEXT: addi a0, a0, -1
	; RV32-NEXT: vsetivli zero, 1, e32, mf2, ta, ma			; RV32-NEXT: vsetvli a1, zero, e32, mf2, ta, ma
	; RV32-NEXT: vmv.s.x v9, a0			; RV32-NEXT: vmv.s.x v9, a0
	; RV32-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
	; RV32-NEXT: vredmin.vs v8, v8, v9			; RV32-NEXT: vredmin.vs v8, v8, v9
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_smin_nxv1i32:			; RV64-LABEL: vreduce_smin_nxv1i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 524288			; RV64-NEXT: lui a0, 524288
	; RV64-NEXT: addiw a0, a0, -1			; RV64-NEXT: addiw a0, a0, -1
	; RV64-NEXT: vsetivli zero, 1, e32, mf2, ta, ma			; RV64-NEXT: vsetvli a1, zero, e32, mf2, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
	; RV64-NEXT: vredmin.vs v8, v8, v9			; RV64-NEXT: vredmin.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i32 @llvm.vector.reduce.smin.nxv1i32(<vscale x 1 x i32> %v)			%red = call i32 @llvm.vector.reduce.smin.nxv1i32(<vscale x 1 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.and.nxv1i32(<vscale x 1 x i32>)			declare i32 @llvm.vector.reduce.and.nxv1i32(<vscale x 1 x i32>)

	define signext i32 @vreduce_and_nxv1i32(<vscale x 1 x i32> %v) {			define signext i32 @vreduce_and_nxv1i32(<vscale x 1 x i32> %v) {
	; CHECK-LABEL: vreduce_and_nxv1i32:			; CHECK-LABEL: vreduce_and_nxv1i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
				; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vredand.vs v8, v8, v9			; CHECK-NEXT: vredand.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.and.nxv1i32(<vscale x 1 x i32> %v)			%red = call i32 @llvm.vector.reduce.and.nxv1i32(<vscale x 1 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.or.nxv1i32(<vscale x 1 x i32>)			declare i32 @llvm.vector.reduce.or.nxv1i32(<vscale x 1 x i32>)

	define signext i32 @vreduce_or_nxv1i32(<vscale x 1 x i32> %v) {			define signext i32 @vreduce_or_nxv1i32(<vscale x 1 x i32> %v) {
	; CHECK-LABEL: vreduce_or_nxv1i32:			; CHECK-LABEL: vreduce_or_nxv1i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredor.vs v8, v8, v9			; CHECK-NEXT: vredor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.or.nxv1i32(<vscale x 1 x i32> %v)			%red = call i32 @llvm.vector.reduce.or.nxv1i32(<vscale x 1 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.xor.nxv1i32(<vscale x 1 x i32>)			declare i32 @llvm.vector.reduce.xor.nxv1i32(<vscale x 1 x i32>)

	define signext i32 @vreduce_xor_nxv1i32(<vscale x 1 x i32> %v) {			define signext i32 @vreduce_xor_nxv1i32(<vscale x 1 x i32> %v) {
	; CHECK-LABEL: vreduce_xor_nxv1i32:			; CHECK-LABEL: vreduce_xor_nxv1i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredxor.vs v8, v8, v9			; CHECK-NEXT: vredxor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.xor.nxv1i32(<vscale x 1 x i32> %v)			%red = call i32 @llvm.vector.reduce.xor.nxv1i32(<vscale x 1 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.add.nxv2i32(<vscale x 2 x i32>)			declare i32 @llvm.vector.reduce.add.nxv2i32(<vscale x 2 x i32>)

	define signext i32 @vreduce_add_nxv2i32(<vscale x 2 x i32> %v) {			define signext i32 @vreduce_add_nxv2i32(<vscale x 2 x i32> %v) {
	; CHECK-LABEL: vreduce_add_nxv2i32:			; CHECK-LABEL: vreduce_add_nxv2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredsum.vs v8, v8, v9			; CHECK-NEXT: vredsum.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.add.nxv2i32(<vscale x 2 x i32> %v)			%red = call i32 @llvm.vector.reduce.add.nxv2i32(<vscale x 2 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	define signext i32 @vwreduce_add_nxv2i16(<vscale x 2 x i16> %v) {			define signext i32 @vwreduce_add_nxv2i16(<vscale x 2 x i16> %v) {
	; CHECK-LABEL: vwreduce_add_nxv2i16:			; CHECK-LABEL: vwreduce_add_nxv2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, ma
	; CHECK-NEXT: vwredsum.vs v8, v8, v9			; CHECK-NEXT: vwredsum.vs v8, v8, v9
	; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = sext <vscale x 2 x i16> %v to <vscale x 2 x i32>			%e = sext <vscale x 2 x i16> %v to <vscale x 2 x i32>
	%red = call i32 @llvm.vector.reduce.add.nxv2i32(<vscale x 2 x i32> %e)			%red = call i32 @llvm.vector.reduce.add.nxv2i32(<vscale x 2 x i32> %e)
	ret i32 %red			ret i32 %red
	}			}

	define signext i32 @vwreduce_uadd_nxv2i16(<vscale x 2 x i16> %v) {			define signext i32 @vwreduce_uadd_nxv2i16(<vscale x 2 x i16> %v) {
	; CHECK-LABEL: vwreduce_uadd_nxv2i16:			; CHECK-LABEL: vwreduce_uadd_nxv2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, ma
	; CHECK-NEXT: vwredsumu.vs v8, v8, v9			; CHECK-NEXT: vwredsumu.vs v8, v8, v9
	; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = zext <vscale x 2 x i16> %v to <vscale x 2 x i32>			%e = zext <vscale x 2 x i16> %v to <vscale x 2 x i32>
	%red = call i32 @llvm.vector.reduce.add.nxv2i32(<vscale x 2 x i32> %e)			%red = call i32 @llvm.vector.reduce.add.nxv2i32(<vscale x 2 x i32> %e)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.umax.nxv2i32(<vscale x 2 x i32>)			declare i32 @llvm.vector.reduce.umax.nxv2i32(<vscale x 2 x i32>)

	define signext i32 @vreduce_umax_nxv2i32(<vscale x 2 x i32> %v) {			define signext i32 @vreduce_umax_nxv2i32(<vscale x 2 x i32> %v) {
	; CHECK-LABEL: vreduce_umax_nxv2i32:			; CHECK-LABEL: vreduce_umax_nxv2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredmaxu.vs v8, v8, v9			; CHECK-NEXT: vredmaxu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.umax.nxv2i32(<vscale x 2 x i32> %v)			%red = call i32 @llvm.vector.reduce.umax.nxv2i32(<vscale x 2 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.smax.nxv2i32(<vscale x 2 x i32>)			declare i32 @llvm.vector.reduce.smax.nxv2i32(<vscale x 2 x i32>)

	define signext i32 @vreduce_smax_nxv2i32(<vscale x 2 x i32> %v) {			define signext i32 @vreduce_smax_nxv2i32(<vscale x 2 x i32> %v) {
	; CHECK-LABEL: vreduce_smax_nxv2i32:			; CHECK-LABEL: vreduce_smax_nxv2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, 524288			; CHECK-NEXT: lui a0, 524288
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a1, zero, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.s.x v9, a0
	; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vredmax.vs v8, v8, v9			; CHECK-NEXT: vredmax.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.smax.nxv2i32(<vscale x 2 x i32> %v)			%red = call i32 @llvm.vector.reduce.smax.nxv2i32(<vscale x 2 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.umin.nxv2i32(<vscale x 2 x i32>)			declare i32 @llvm.vector.reduce.umin.nxv2i32(<vscale x 2 x i32>)

	define signext i32 @vreduce_umin_nxv2i32(<vscale x 2 x i32> %v) {			define signext i32 @vreduce_umin_nxv2i32(<vscale x 2 x i32> %v) {
	; CHECK-LABEL: vreduce_umin_nxv2i32:			; CHECK-LABEL: vreduce_umin_nxv2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
				; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vredminu.vs v8, v8, v9			; CHECK-NEXT: vredminu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.umin.nxv2i32(<vscale x 2 x i32> %v)			%red = call i32 @llvm.vector.reduce.umin.nxv2i32(<vscale x 2 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.smin.nxv2i32(<vscale x 2 x i32>)			declare i32 @llvm.vector.reduce.smin.nxv2i32(<vscale x 2 x i32>)

	define signext i32 @vreduce_smin_nxv2i32(<vscale x 2 x i32> %v) {			define signext i32 @vreduce_smin_nxv2i32(<vscale x 2 x i32> %v) {
	; RV32-LABEL: vreduce_smin_nxv2i32:			; RV32-LABEL: vreduce_smin_nxv2i32:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: lui a0, 524288			; RV32-NEXT: lui a0, 524288
	; RV32-NEXT: addi a0, a0, -1			; RV32-NEXT: addi a0, a0, -1
	; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; RV32-NEXT: vsetvli a1, zero, e32, m1, ta, ma
	; RV32-NEXT: vmv.s.x v9, a0			; RV32-NEXT: vmv.s.x v9, a0
	; RV32-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; RV32-NEXT: vredmin.vs v8, v8, v9			; RV32-NEXT: vredmin.vs v8, v8, v9
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_smin_nxv2i32:			; RV64-LABEL: vreduce_smin_nxv2i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 524288			; RV64-NEXT: lui a0, 524288
	; RV64-NEXT: addiw a0, a0, -1			; RV64-NEXT: addiw a0, a0, -1
	; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; RV64-NEXT: vsetvli a1, zero, e32, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; RV64-NEXT: vredmin.vs v8, v8, v9			; RV64-NEXT: vredmin.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i32 @llvm.vector.reduce.smin.nxv2i32(<vscale x 2 x i32> %v)			%red = call i32 @llvm.vector.reduce.smin.nxv2i32(<vscale x 2 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.and.nxv2i32(<vscale x 2 x i32>)			declare i32 @llvm.vector.reduce.and.nxv2i32(<vscale x 2 x i32>)

	define signext i32 @vreduce_and_nxv2i32(<vscale x 2 x i32> %v) {			define signext i32 @vreduce_and_nxv2i32(<vscale x 2 x i32> %v) {
	; CHECK-LABEL: vreduce_and_nxv2i32:			; CHECK-LABEL: vreduce_and_nxv2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
				; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vredand.vs v8, v8, v9			; CHECK-NEXT: vredand.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.and.nxv2i32(<vscale x 2 x i32> %v)			%red = call i32 @llvm.vector.reduce.and.nxv2i32(<vscale x 2 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.or.nxv2i32(<vscale x 2 x i32>)			declare i32 @llvm.vector.reduce.or.nxv2i32(<vscale x 2 x i32>)

	define signext i32 @vreduce_or_nxv2i32(<vscale x 2 x i32> %v) {			define signext i32 @vreduce_or_nxv2i32(<vscale x 2 x i32> %v) {
	; CHECK-LABEL: vreduce_or_nxv2i32:			; CHECK-LABEL: vreduce_or_nxv2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredor.vs v8, v8, v9			; CHECK-NEXT: vredor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.or.nxv2i32(<vscale x 2 x i32> %v)			%red = call i32 @llvm.vector.reduce.or.nxv2i32(<vscale x 2 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.xor.nxv2i32(<vscale x 2 x i32>)			declare i32 @llvm.vector.reduce.xor.nxv2i32(<vscale x 2 x i32>)

	define signext i32 @vreduce_xor_nxv2i32(<vscale x 2 x i32> %v) {			define signext i32 @vreduce_xor_nxv2i32(<vscale x 2 x i32> %v) {
	; CHECK-LABEL: vreduce_xor_nxv2i32:			; CHECK-LABEL: vreduce_xor_nxv2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
				; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vredxor.vs v8, v8, v9			; CHECK-NEXT: vredxor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.xor.nxv2i32(<vscale x 2 x i32> %v)			%red = call i32 @llvm.vector.reduce.xor.nxv2i32(<vscale x 2 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.add.nxv4i32(<vscale x 4 x i32>)			declare i32 @llvm.vector.reduce.add.nxv4i32(<vscale x 4 x i32>)

	define signext i32 @vreduce_add_nxv4i32(<vscale x 4 x i32> %v) {			define signext i32 @vreduce_add_nxv4i32(<vscale x 4 x i32> %v) {
	; CHECK-LABEL: vreduce_add_nxv4i32:			; CHECK-LABEL: vreduce_add_nxv4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v10, zero			; CHECK-NEXT: vmv.s.x v10, zero
	; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma
	; CHECK-NEXT: vredsum.vs v8, v8, v10			; CHECK-NEXT: vredsum.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.add.nxv4i32(<vscale x 4 x i32> %v)			%red = call i32 @llvm.vector.reduce.add.nxv4i32(<vscale x 4 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	define signext i32 @vwreduce_add_nxv4i16(<vscale x 4 x i16> %v) {			define signext i32 @vwreduce_add_nxv4i16(<vscale x 4 x i16> %v) {
	; CHECK-LABEL: vwreduce_add_nxv4i16:			; CHECK-LABEL: vwreduce_add_nxv4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
	; CHECK-NEXT: vwredsum.vs v8, v8, v9			; CHECK-NEXT: vwredsum.vs v8, v8, v9
	; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = sext <vscale x 4 x i16> %v to <vscale x 4 x i32>			%e = sext <vscale x 4 x i16> %v to <vscale x 4 x i32>
	%red = call i32 @llvm.vector.reduce.add.nxv4i32(<vscale x 4 x i32> %e)			%red = call i32 @llvm.vector.reduce.add.nxv4i32(<vscale x 4 x i32> %e)
	ret i32 %red			ret i32 %red
	}			}

	define signext i32 @vwreduce_uadd_nxv4i16(<vscale x 4 x i16> %v) {			define signext i32 @vwreduce_uadd_nxv4i16(<vscale x 4 x i16> %v) {
	; CHECK-LABEL: vwreduce_uadd_nxv4i16:			; CHECK-LABEL: vwreduce_uadd_nxv4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.s.x v9, zero
	; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
	; CHECK-NEXT: vwredsumu.vs v8, v8, v9			; CHECK-NEXT: vwredsumu.vs v8, v8, v9
	; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%e = zext <vscale x 4 x i16> %v to <vscale x 4 x i32>			%e = zext <vscale x 4 x i16> %v to <vscale x 4 x i32>
	%red = call i32 @llvm.vector.reduce.add.nxv4i32(<vscale x 4 x i32> %e)			%red = call i32 @llvm.vector.reduce.add.nxv4i32(<vscale x 4 x i32> %e)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.umax.nxv4i32(<vscale x 4 x i32>)			declare i32 @llvm.vector.reduce.umax.nxv4i32(<vscale x 4 x i32>)

	define signext i32 @vreduce_umax_nxv4i32(<vscale x 4 x i32> %v) {			define signext i32 @vreduce_umax_nxv4i32(<vscale x 4 x i32> %v) {
	; CHECK-LABEL: vreduce_umax_nxv4i32:			; CHECK-LABEL: vreduce_umax_nxv4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v10, zero			; CHECK-NEXT: vmv.s.x v10, zero
	; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma
	; CHECK-NEXT: vredmaxu.vs v8, v8, v10			; CHECK-NEXT: vredmaxu.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.umax.nxv4i32(<vscale x 4 x i32> %v)			%red = call i32 @llvm.vector.reduce.umax.nxv4i32(<vscale x 4 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.smax.nxv4i32(<vscale x 4 x i32>)			declare i32 @llvm.vector.reduce.smax.nxv4i32(<vscale x 4 x i32>)

	define signext i32 @vreduce_smax_nxv4i32(<vscale x 4 x i32> %v) {			define signext i32 @vreduce_smax_nxv4i32(<vscale x 4 x i32> %v) {
	; CHECK-LABEL: vreduce_smax_nxv4i32:			; CHECK-LABEL: vreduce_smax_nxv4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, 524288			; CHECK-NEXT: lui a0, 524288
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a1, zero, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v10, a0			; CHECK-NEXT: vmv.s.x v10, a0
	; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma
	; CHECK-NEXT: vredmax.vs v8, v8, v10			; CHECK-NEXT: vredmax.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.smax.nxv4i32(<vscale x 4 x i32> %v)			%red = call i32 @llvm.vector.reduce.smax.nxv4i32(<vscale x 4 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.umin.nxv4i32(<vscale x 4 x i32>)			declare i32 @llvm.vector.reduce.umin.nxv4i32(<vscale x 4 x i32>)

	define signext i32 @vreduce_umin_nxv4i32(<vscale x 4 x i32> %v) {			define signext i32 @vreduce_umin_nxv4i32(<vscale x 4 x i32> %v) {
	; CHECK-LABEL: vreduce_umin_nxv4i32:			; CHECK-LABEL: vreduce_umin_nxv4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v10, -1			; CHECK-NEXT: vmv.v.i v10, -1
	; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma
	; CHECK-NEXT: vredminu.vs v8, v8, v10			; CHECK-NEXT: vredminu.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.umin.nxv4i32(<vscale x 4 x i32> %v)			%red = call i32 @llvm.vector.reduce.umin.nxv4i32(<vscale x 4 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.smin.nxv4i32(<vscale x 4 x i32>)			declare i32 @llvm.vector.reduce.smin.nxv4i32(<vscale x 4 x i32>)

	define signext i32 @vreduce_smin_nxv4i32(<vscale x 4 x i32> %v) {			define signext i32 @vreduce_smin_nxv4i32(<vscale x 4 x i32> %v) {
	; RV32-LABEL: vreduce_smin_nxv4i32:			; RV32-LABEL: vreduce_smin_nxv4i32:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: lui a0, 524288			; RV32-NEXT: lui a0, 524288
	; RV32-NEXT: addi a0, a0, -1			; RV32-NEXT: addi a0, a0, -1
	; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; RV32-NEXT: vsetvli a1, zero, e32, m1, ta, ma
	; RV32-NEXT: vmv.s.x v10, a0			; RV32-NEXT: vmv.s.x v10, a0
	; RV32-NEXT: vsetvli a0, zero, e32, m2, ta, ma			; RV32-NEXT: vsetvli a0, zero, e32, m2, ta, ma
	; RV32-NEXT: vredmin.vs v8, v8, v10			; RV32-NEXT: vredmin.vs v8, v8, v10
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_smin_nxv4i32:			; RV64-LABEL: vreduce_smin_nxv4i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 524288			; RV64-NEXT: lui a0, 524288
	; RV64-NEXT: addiw a0, a0, -1			; RV64-NEXT: addiw a0, a0, -1
	; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; RV64-NEXT: vsetvli a1, zero, e32, m1, ta, ma
	; RV64-NEXT: vmv.s.x v10, a0			; RV64-NEXT: vmv.s.x v10, a0
	; RV64-NEXT: vsetvli a0, zero, e32, m2, ta, ma			; RV64-NEXT: vsetvli a0, zero, e32, m2, ta, ma
	; RV64-NEXT: vredmin.vs v8, v8, v10			; RV64-NEXT: vredmin.vs v8, v8, v10
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i32 @llvm.vector.reduce.smin.nxv4i32(<vscale x 4 x i32> %v)			%red = call i32 @llvm.vector.reduce.smin.nxv4i32(<vscale x 4 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.and.nxv4i32(<vscale x 4 x i32>)			declare i32 @llvm.vector.reduce.and.nxv4i32(<vscale x 4 x i32>)

	define signext i32 @vreduce_and_nxv4i32(<vscale x 4 x i32> %v) {			define signext i32 @vreduce_and_nxv4i32(<vscale x 4 x i32> %v) {
	; CHECK-LABEL: vreduce_and_nxv4i32:			; CHECK-LABEL: vreduce_and_nxv4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v10, -1			; CHECK-NEXT: vmv.v.i v10, -1
	; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma
	; CHECK-NEXT: vredand.vs v8, v8, v10			; CHECK-NEXT: vredand.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.and.nxv4i32(<vscale x 4 x i32> %v)			%red = call i32 @llvm.vector.reduce.and.nxv4i32(<vscale x 4 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.or.nxv4i32(<vscale x 4 x i32>)			declare i32 @llvm.vector.reduce.or.nxv4i32(<vscale x 4 x i32>)

	define signext i32 @vreduce_or_nxv4i32(<vscale x 4 x i32> %v) {			define signext i32 @vreduce_or_nxv4i32(<vscale x 4 x i32> %v) {
	; CHECK-LABEL: vreduce_or_nxv4i32:			; CHECK-LABEL: vreduce_or_nxv4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v10, zero			; CHECK-NEXT: vmv.s.x v10, zero
	; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma
	; CHECK-NEXT: vredor.vs v8, v8, v10			; CHECK-NEXT: vredor.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.or.nxv4i32(<vscale x 4 x i32> %v)			%red = call i32 @llvm.vector.reduce.or.nxv4i32(<vscale x 4 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.xor.nxv4i32(<vscale x 4 x i32>)			declare i32 @llvm.vector.reduce.xor.nxv4i32(<vscale x 4 x i32>)

	define signext i32 @vreduce_xor_nxv4i32(<vscale x 4 x i32> %v) {			define signext i32 @vreduce_xor_nxv4i32(<vscale x 4 x i32> %v) {
	; CHECK-LABEL: vreduce_xor_nxv4i32:			; CHECK-LABEL: vreduce_xor_nxv4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v10, zero			; CHECK-NEXT: vmv.s.x v10, zero
	; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma			; CHECK-NEXT: vsetvli a0, zero, e32, m2, ta, ma
	; CHECK-NEXT: vredxor.vs v8, v8, v10			; CHECK-NEXT: vredxor.vs v8, v8, v10
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%red = call i32 @llvm.vector.reduce.xor.nxv4i32(<vscale x 4 x i32> %v)			%red = call i32 @llvm.vector.reduce.xor.nxv4i32(<vscale x 4 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}
	Show All 11 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_add_nxv1i64:			; RV64-LABEL: vreduce_add_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, zero
	; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
				; RV64-NEXT: vmv.s.x v9, zero
	; RV64-NEXT: vredsum.vs v8, v8, v9			; RV64-NEXT: vredsum.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64> %v)			%red = call i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}

	define i64 @vwreduce_add_nxv1i32(<vscale x 1 x i32> %v) {			define i64 @vwreduce_add_nxv1i32(<vscale x 1 x i32> %v) {
	; RV32-LABEL: vwreduce_add_nxv1i32:			; RV32-LABEL: vwreduce_add_nxv1i32:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vmv.s.x v9, zero			; RV32-NEXT: vmv.s.x v9, zero
	; RV32-NEXT: vsetvli a0, zero, e32, mf2, ta, ma			; RV32-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
	; RV32-NEXT: vwredsum.vs v8, v8, v9			; RV32-NEXT: vwredsum.vs v8, v8, v9
	; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, ma
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vwreduce_add_nxv1i32:			; RV64-LABEL: vwreduce_add_nxv1i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, zero			; RV64-NEXT: vmv.s.x v9, zero
	; RV64-NEXT: vsetvli a0, zero, e32, mf2, ta, ma			; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, ma
	; RV64-NEXT: vwredsum.vs v8, v8, v9			; RV64-NEXT: vwredsum.vs v8, v8, v9
	; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%e = sext <vscale x 1 x i32> %v to <vscale x 1 x i64>			%e = sext <vscale x 1 x i32> %v to <vscale x 1 x i64>
	%red = call i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64> %e)			%red = call i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64> %e)
	ret i64 %red			ret i64 %red
	}			}
	Show All 10 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vwreduce_uadd_nxv1i32:			; RV64-LABEL: vwreduce_uadd_nxv1i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, zero			; RV64-NEXT: vmv.s.x v9, zero
	; RV64-NEXT: vsetvli a0, zero, e32, mf2, ta, ma			; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, ma
	; RV64-NEXT: vwredsumu.vs v8, v8, v9			; RV64-NEXT: vwredsumu.vs v8, v8, v9
	; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%e = zext <vscale x 1 x i32> %v to <vscale x 1 x i64>			%e = zext <vscale x 1 x i32> %v to <vscale x 1 x i64>
	%red = call i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64> %e)			%red = call i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64> %e)
	ret i64 %red			ret i64 %red
	}			}
	Show All 11 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_umax_nxv1i64:			; RV64-LABEL: vreduce_umax_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, zero
	; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
				; RV64-NEXT: vmv.s.x v9, zero
	; RV64-NEXT: vredmaxu.vs v8, v8, v9			; RV64-NEXT: vredmaxu.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.umax.nxv1i64(<vscale x 1 x i64> %v)			%red = call i64 @llvm.vector.reduce.umax.nxv1i64(<vscale x 1 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}

	declare i64 @llvm.vector.reduce.smax.nxv1i64(<vscale x 1 x i64>)			declare i64 @llvm.vector.reduce.smax.nxv1i64(<vscale x 1 x i64>)
	Show All 18 Lines
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_smax_nxv1i64:			; RV64-LABEL: vreduce_smax_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, -1			; RV64-NEXT: li a0, -1
	; RV64-NEXT: slli a0, a0, 63			; RV64-NEXT: slli a0, a0, 63
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; RV64-NEXT: vredmax.vs v8, v8, v9			; RV64-NEXT: vredmax.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.smax.nxv1i64(<vscale x 1 x i64> %v)			%red = call i64 @llvm.vector.reduce.smax.nxv1i64(<vscale x 1 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}

	declare i64 @llvm.vector.reduce.umin.nxv1i64(<vscale x 1 x i64>)			declare i64 @llvm.vector.reduce.umin.nxv1i64(<vscale x 1 x i64>)
	Show All 9 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_umin_nxv1i64:			; RV64-LABEL: vreduce_umin_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV64-NEXT: vmv.v.i v9, -1
	; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
				; RV64-NEXT: vmv.v.i v9, -1
	; RV64-NEXT: vredminu.vs v8, v8, v9			; RV64-NEXT: vredminu.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.umin.nxv1i64(<vscale x 1 x i64> %v)			%red = call i64 @llvm.vector.reduce.umin.nxv1i64(<vscale x 1 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}

	declare i64 @llvm.vector.reduce.smin.nxv1i64(<vscale x 1 x i64>)			declare i64 @llvm.vector.reduce.smin.nxv1i64(<vscale x 1 x i64>)
	Show All 20 Lines
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_smin_nxv1i64:			; RV64-LABEL: vreduce_smin_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, -1			; RV64-NEXT: li a0, -1
	; RV64-NEXT: srli a0, a0, 1			; RV64-NEXT: srli a0, a0, 1
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; RV64-NEXT: vredmin.vs v8, v8, v9			; RV64-NEXT: vredmin.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.smin.nxv1i64(<vscale x 1 x i64> %v)			%red = call i64 @llvm.vector.reduce.smin.nxv1i64(<vscale x 1 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}

	declare i64 @llvm.vector.reduce.and.nxv1i64(<vscale x 1 x i64>)			declare i64 @llvm.vector.reduce.and.nxv1i64(<vscale x 1 x i64>)
	Show All 9 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_and_nxv1i64:			; RV64-LABEL: vreduce_and_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV64-NEXT: vmv.v.i v9, -1
	; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
				; RV64-NEXT: vmv.v.i v9, -1
	; RV64-NEXT: vredand.vs v8, v8, v9			; RV64-NEXT: vredand.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.and.nxv1i64(<vscale x 1 x i64> %v)			%red = call i64 @llvm.vector.reduce.and.nxv1i64(<vscale x 1 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}

	declare i64 @llvm.vector.reduce.or.nxv1i64(<vscale x 1 x i64>)			declare i64 @llvm.vector.reduce.or.nxv1i64(<vscale x 1 x i64>)
	Show All 9 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_or_nxv1i64:			; RV64-LABEL: vreduce_or_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, zero
	; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
				; RV64-NEXT: vmv.s.x v9, zero
	; RV64-NEXT: vredor.vs v8, v8, v9			; RV64-NEXT: vredor.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.or.nxv1i64(<vscale x 1 x i64> %v)			%red = call i64 @llvm.vector.reduce.or.nxv1i64(<vscale x 1 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}

	declare i64 @llvm.vector.reduce.xor.nxv1i64(<vscale x 1 x i64>)			declare i64 @llvm.vector.reduce.xor.nxv1i64(<vscale x 1 x i64>)
	Show All 9 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_xor_nxv1i64:			; RV64-LABEL: vreduce_xor_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, zero
	; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
				; RV64-NEXT: vmv.s.x v9, zero
	; RV64-NEXT: vredxor.vs v8, v8, v9			; RV64-NEXT: vredxor.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.xor.nxv1i64(<vscale x 1 x i64> %v)			%red = call i64 @llvm.vector.reduce.xor.nxv1i64(<vscale x 1 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}

	declare i64 @llvm.vector.reduce.add.nxv2i64(<vscale x 2 x i64>)			declare i64 @llvm.vector.reduce.add.nxv2i64(<vscale x 2 x i64>)
	Show All 9 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_add_nxv2i64:			; RV64-LABEL: vreduce_add_nxv2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v10, zero			; RV64-NEXT: vmv.s.x v10, zero
	; RV64-NEXT: vsetvli a0, zero, e64, m2, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m2, ta, ma
	; RV64-NEXT: vredsum.vs v8, v8, v10			; RV64-NEXT: vredsum.vs v8, v8, v10
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.add.nxv2i64(<vscale x 2 x i64> %v)			%red = call i64 @llvm.vector.reduce.add.nxv2i64(<vscale x 2 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}
	Show All 10 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vwreduce_add_nxv2i32:			; RV64-LABEL: vwreduce_add_nxv2i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, zero			; RV64-NEXT: vmv.s.x v9, zero
	; RV64-NEXT: vsetvli a0, zero, e32, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; RV64-NEXT: vwredsum.vs v8, v8, v9			; RV64-NEXT: vwredsum.vs v8, v8, v9
	; RV64-NEXT: vsetivli zero, 0, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 0, e64, m1, ta, ma
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%e = sext <vscale x 2 x i32> %v to <vscale x 2 x i64>			%e = sext <vscale x 2 x i32> %v to <vscale x 2 x i64>
	%red = call i64 @llvm.vector.reduce.add.nxv2i64(<vscale x 2 x i64> %e)			%red = call i64 @llvm.vector.reduce.add.nxv2i64(<vscale x 2 x i64> %e)
	Show All 12 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vwreduce_uadd_nxv2i32:			; RV64-LABEL: vwreduce_uadd_nxv2i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, zero			; RV64-NEXT: vmv.s.x v9, zero
	; RV64-NEXT: vsetvli a0, zero, e32, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e32, m1, ta, ma
	; RV64-NEXT: vwredsumu.vs v8, v8, v9			; RV64-NEXT: vwredsumu.vs v8, v8, v9
	; RV64-NEXT: vsetivli zero, 0, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 0, e64, m1, ta, ma
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%e = zext <vscale x 2 x i32> %v to <vscale x 2 x i64>			%e = zext <vscale x 2 x i32> %v to <vscale x 2 x i64>
	%red = call i64 @llvm.vector.reduce.add.nxv2i64(<vscale x 2 x i64> %e)			%red = call i64 @llvm.vector.reduce.add.nxv2i64(<vscale x 2 x i64> %e)
	Show All 13 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_umax_nxv2i64:			; RV64-LABEL: vreduce_umax_nxv2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v10, zero			; RV64-NEXT: vmv.s.x v10, zero
	; RV64-NEXT: vsetvli a0, zero, e64, m2, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m2, ta, ma
	; RV64-NEXT: vredmaxu.vs v8, v8, v10			; RV64-NEXT: vredmaxu.vs v8, v8, v10
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.umax.nxv2i64(<vscale x 2 x i64> %v)			%red = call i64 @llvm.vector.reduce.umax.nxv2i64(<vscale x 2 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}
	Show All 20 Lines
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_smax_nxv2i64:			; RV64-LABEL: vreduce_smax_nxv2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, -1			; RV64-NEXT: li a0, -1
	; RV64-NEXT: slli a0, a0, 63			; RV64-NEXT: slli a0, a0, 63
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v10, a0			; RV64-NEXT: vmv.s.x v10, a0
	; RV64-NEXT: vsetvli a0, zero, e64, m2, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m2, ta, ma
	; RV64-NEXT: vredmax.vs v8, v8, v10			; RV64-NEXT: vredmax.vs v8, v8, v10
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.smax.nxv2i64(<vscale x 2 x i64> %v)			%red = call i64 @llvm.vector.reduce.smax.nxv2i64(<vscale x 2 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}
	Show All 11 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_umin_nxv2i64:			; RV64-LABEL: vreduce_umin_nxv2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.v.i v10, -1			; RV64-NEXT: vmv.v.i v10, -1
	; RV64-NEXT: vsetvli a0, zero, e64, m2, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m2, ta, ma
	; RV64-NEXT: vredminu.vs v8, v8, v10			; RV64-NEXT: vredminu.vs v8, v8, v10
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.umin.nxv2i64(<vscale x 2 x i64> %v)			%red = call i64 @llvm.vector.reduce.umin.nxv2i64(<vscale x 2 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}
	Show All 22 Lines
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_smin_nxv2i64:			; RV64-LABEL: vreduce_smin_nxv2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, -1			; RV64-NEXT: li a0, -1
	; RV64-NEXT: srli a0, a0, 1			; RV64-NEXT: srli a0, a0, 1
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v10, a0			; RV64-NEXT: vmv.s.x v10, a0
	; RV64-NEXT: vsetvli a0, zero, e64, m2, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m2, ta, ma
	; RV64-NEXT: vredmin.vs v8, v8, v10			; RV64-NEXT: vredmin.vs v8, v8, v10
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.smin.nxv2i64(<vscale x 2 x i64> %v)			%red = call i64 @llvm.vector.reduce.smin.nxv2i64(<vscale x 2 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}
	Show All 11 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_and_nxv2i64:			; RV64-LABEL: vreduce_and_nxv2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.v.i v10, -1			; RV64-NEXT: vmv.v.i v10, -1
	; RV64-NEXT: vsetvli a0, zero, e64, m2, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m2, ta, ma
	; RV64-NEXT: vredand.vs v8, v8, v10			; RV64-NEXT: vredand.vs v8, v8, v10
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.and.nxv2i64(<vscale x 2 x i64> %v)			%red = call i64 @llvm.vector.reduce.and.nxv2i64(<vscale x 2 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}
	Show All 11 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_or_nxv2i64:			; RV64-LABEL: vreduce_or_nxv2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v10, zero			; RV64-NEXT: vmv.s.x v10, zero
	; RV64-NEXT: vsetvli a0, zero, e64, m2, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m2, ta, ma
	; RV64-NEXT: vredor.vs v8, v8, v10			; RV64-NEXT: vredor.vs v8, v8, v10
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.or.nxv2i64(<vscale x 2 x i64> %v)			%red = call i64 @llvm.vector.reduce.or.nxv2i64(<vscale x 2 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}
	Show All 11 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_xor_nxv2i64:			; RV64-LABEL: vreduce_xor_nxv2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v10, zero			; RV64-NEXT: vmv.s.x v10, zero
	; RV64-NEXT: vsetvli a0, zero, e64, m2, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m2, ta, ma
	; RV64-NEXT: vredxor.vs v8, v8, v10			; RV64-NEXT: vredxor.vs v8, v8, v10
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.xor.nxv2i64(<vscale x 2 x i64> %v)			%red = call i64 @llvm.vector.reduce.xor.nxv2i64(<vscale x 2 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}
	Show All 11 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_add_nxv4i64:			; RV64-LABEL: vreduce_add_nxv4i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v12, zero			; RV64-NEXT: vmv.s.x v12, zero
	; RV64-NEXT: vsetvli a0, zero, e64, m4, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m4, ta, ma
	; RV64-NEXT: vredsum.vs v8, v8, v12			; RV64-NEXT: vredsum.vs v8, v8, v12
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.add.nxv4i64(<vscale x 4 x i64> %v)			%red = call i64 @llvm.vector.reduce.add.nxv4i64(<vscale x 4 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}
	Show All 10 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vwreduce_add_nxv4i32:			; RV64-LABEL: vwreduce_add_nxv4i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v10, zero			; RV64-NEXT: vmv.s.x v10, zero
	; RV64-NEXT: vsetvli a0, zero, e32, m2, ta, ma			; RV64-NEXT: vsetvli a0, zero, e32, m2, ta, ma
	; RV64-NEXT: vwredsum.vs v8, v8, v10			; RV64-NEXT: vwredsum.vs v8, v8, v10
	; RV64-NEXT: vsetivli zero, 0, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 0, e64, m1, ta, ma
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%e = sext <vscale x 4 x i32> %v to <vscale x 4 x i64>			%e = sext <vscale x 4 x i32> %v to <vscale x 4 x i64>
	%red = call i64 @llvm.vector.reduce.add.nxv4i64(<vscale x 4 x i64> %e)			%red = call i64 @llvm.vector.reduce.add.nxv4i64(<vscale x 4 x i64> %e)
	Show All 12 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vwreduce_uadd_nxv4i32:			; RV64-LABEL: vwreduce_uadd_nxv4i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v10, zero			; RV64-NEXT: vmv.s.x v10, zero
	; RV64-NEXT: vsetvli a0, zero, e32, m2, ta, ma			; RV64-NEXT: vsetvli a0, zero, e32, m2, ta, ma
	; RV64-NEXT: vwredsumu.vs v8, v8, v10			; RV64-NEXT: vwredsumu.vs v8, v8, v10
	; RV64-NEXT: vsetivli zero, 0, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 0, e64, m1, ta, ma
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%e = zext <vscale x 4 x i32> %v to <vscale x 4 x i64>			%e = zext <vscale x 4 x i32> %v to <vscale x 4 x i64>
	%red = call i64 @llvm.vector.reduce.add.nxv4i64(<vscale x 4 x i64> %e)			%red = call i64 @llvm.vector.reduce.add.nxv4i64(<vscale x 4 x i64> %e)
	Show All 13 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_umax_nxv4i64:			; RV64-LABEL: vreduce_umax_nxv4i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v12, zero			; RV64-NEXT: vmv.s.x v12, zero
	; RV64-NEXT: vsetvli a0, zero, e64, m4, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m4, ta, ma
	; RV64-NEXT: vredmaxu.vs v8, v8, v12			; RV64-NEXT: vredmaxu.vs v8, v8, v12
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.umax.nxv4i64(<vscale x 4 x i64> %v)			%red = call i64 @llvm.vector.reduce.umax.nxv4i64(<vscale x 4 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}
	Show All 20 Lines
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_smax_nxv4i64:			; RV64-LABEL: vreduce_smax_nxv4i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, -1			; RV64-NEXT: li a0, -1
	; RV64-NEXT: slli a0, a0, 63			; RV64-NEXT: slli a0, a0, 63
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v12, a0			; RV64-NEXT: vmv.s.x v12, a0
	; RV64-NEXT: vsetvli a0, zero, e64, m4, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m4, ta, ma
	; RV64-NEXT: vredmax.vs v8, v8, v12			; RV64-NEXT: vredmax.vs v8, v8, v12
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.smax.nxv4i64(<vscale x 4 x i64> %v)			%red = call i64 @llvm.vector.reduce.smax.nxv4i64(<vscale x 4 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}
	Show All 11 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_umin_nxv4i64:			; RV64-LABEL: vreduce_umin_nxv4i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.v.i v12, -1			; RV64-NEXT: vmv.v.i v12, -1
	; RV64-NEXT: vsetvli a0, zero, e64, m4, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m4, ta, ma
	; RV64-NEXT: vredminu.vs v8, v8, v12			; RV64-NEXT: vredminu.vs v8, v8, v12
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.umin.nxv4i64(<vscale x 4 x i64> %v)			%red = call i64 @llvm.vector.reduce.umin.nxv4i64(<vscale x 4 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}
	Show All 22 Lines
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_smin_nxv4i64:			; RV64-LABEL: vreduce_smin_nxv4i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, -1			; RV64-NEXT: li a0, -1
	; RV64-NEXT: srli a0, a0, 1			; RV64-NEXT: srli a0, a0, 1
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v12, a0			; RV64-NEXT: vmv.s.x v12, a0
	; RV64-NEXT: vsetvli a0, zero, e64, m4, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m4, ta, ma
	; RV64-NEXT: vredmin.vs v8, v8, v12			; RV64-NEXT: vredmin.vs v8, v8, v12
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.smin.nxv4i64(<vscale x 4 x i64> %v)			%red = call i64 @llvm.vector.reduce.smin.nxv4i64(<vscale x 4 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}
	Show All 11 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_and_nxv4i64:			; RV64-LABEL: vreduce_and_nxv4i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.v.i v12, -1			; RV64-NEXT: vmv.v.i v12, -1
	; RV64-NEXT: vsetvli a0, zero, e64, m4, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m4, ta, ma
	; RV64-NEXT: vredand.vs v8, v8, v12			; RV64-NEXT: vredand.vs v8, v8, v12
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.and.nxv4i64(<vscale x 4 x i64> %v)			%red = call i64 @llvm.vector.reduce.and.nxv4i64(<vscale x 4 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}
	Show All 11 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_or_nxv4i64:			; RV64-LABEL: vreduce_or_nxv4i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v12, zero			; RV64-NEXT: vmv.s.x v12, zero
	; RV64-NEXT: vsetvli a0, zero, e64, m4, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m4, ta, ma
	; RV64-NEXT: vredor.vs v8, v8, v12			; RV64-NEXT: vredor.vs v8, v8, v12
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.or.nxv4i64(<vscale x 4 x i64> %v)			%red = call i64 @llvm.vector.reduce.or.nxv4i64(<vscale x 4 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}
	Show All 11 Lines
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_xor_nxv4i64:			; RV64-LABEL: vreduce_xor_nxv4i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v12, zero			; RV64-NEXT: vmv.s.x v12, zero
	; RV64-NEXT: vsetvli a0, zero, e64, m4, ta, ma			; RV64-NEXT: vsetvli a0, zero, e64, m4, ta, ma
	; RV64-NEXT: vredxor.vs v8, v8, v12			; RV64-NEXT: vredxor.vs v8, v8, v12
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%red = call i64 @llvm.vector.reduce.xor.nxv4i64(<vscale x 4 x i64> %v)			%red = call i64 @llvm.vector.reduce.xor.nxv4i64(<vscale x 4 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}